“Попередня обробка експериментальних даних. Критерії відсіювання завідомо помилкових даних”
Завантажити презентаціюПрезентація по слайдам:
Доповідь на тему: “Попередня обробка експериментальних даних. Критерії відсіювання завідомо помилкових даних” Виконала: ст. гр. СНм-51 Росинець Наталія
ЗМІСТ ТА ЗАВДАННЯ ПОПЕРЕДНЬОЇ ОБРОБКИ ЕКСПЕРИМЕНТАЛЬНИХ ДАНИХ Результати вимірювань – це випадкові величини, тобто в ході експерименту інформація спотворена перешкодами, і за одних і тих же умов можна отримати різні дані. Зміст попередньої обробки даних полягає у відсіюванні грубих похибок і оцінці достовірності результатів вимірювань. Попередня обробка результатів вимірювань необхідна для того, щоб надалі, при побудові функцій відгуку, з найбільшою ефективністю використовувати статистичні методи і коректно аналізувати отримані результати. Завданням попередньої обробки даних є перевірка відповідності результатів вимірювання нормальному закону і визначення параметрів цього розподілу. Якщо відгук суперечить нормальному розподілу, то слід визначити, якому закону розподілу підлягають дослідні дані або, якщо це можливо, перетворити досліджуваний розподіл до нормального вигляду.
Методи обробки експериментальних даних. Метод найменших квадратів Для обробки експериментальних даних найчастіше на практиці використовують метод найменших квадратів - один з методів теорії помилок, що використовується для оцінки невідомих величин за наслідками вимірювань, що містить випадкові помилки (спричиняються різного роду випадковими причинами, які діють при кожному з окремих вимірювань непередбаченим чином). Метод найменших квадратів запропонував К. Гаус (1794—95) і А. Лежандром (1805—06). Строге математичне обґрунтовування методу було дано А. А. Марковим (старшим) і А. Н. Колмогоровим. Нині цей метод є одним з найважливіших розділів математичної статистики і широко використовується для статистичних висновків в різних областях науки і техніки. В багатьох практично важливих випадках кількість невідомих параметрів буває досить великою і тому реалізація методу виявляється ефективною лише при використанні сучасної обчислювальної техніки.
Суть методу найменших квадратів Суть методу найменших квадратів (по Гаусу) полягає в припущені, що «збиток» від заміни точного (невідомого) значення фізичної величини m її наближеним значенням X, обчисленим за наслідками спостережень, пропорційний квадрату помилки: (X - m)2. Оптимальною оцінкою визнають величину X , позбавлену систематичної помилки, для якої середнє значення «збитку» мінімальне. Задачу пошуку оптимальної оцінки звужують і як Х вибирають лінійну функцію від результатів спостережень, позбавлену систематичної помилки, і таку, для якої середнє значення «збитку» мінімальне в класі всіх лінійних функцій. Якщо випадкові помилки спостережень мають нормальний розподіл і оцінювана величина m залежить від середніх значень результатів спостережень лінійно, то рішення цієї задачі одночасно буде і рішенням загальної задачі. Оцінка X, обчислена згідно методу найменших квадратів — найвірогідніше значення невідомого параметра m.
Основні методи згладжування експериментальних даних Метод найменших квадратів дає найбільш бажаний результат тоді, коли випадкова помилка має порівняно невелику величину. В іншому разі необхідним є проведення попередньої обробки експериментальних даних, яка полягає в наступному: вихідні записи випадкових величин згладжуються певним способом, що дає змогу виявити основну тенденцію у їхній зміні.
Метод виключення перешкод Метод виключення перешкод полягає у проведенні на око середньої лінії, яка враховує тільки основні коливання змінної. Інформація, що надалі буде зніматись із цієї середньої лінії, при математичній обробці даних буде використовуватись як вихідна. Значення випадкової величини, що не збігаються із середньою лінією, прямо не впливатимуть на подальші висновки.
Метод оновлюваної середньої Метод оновлюваної середньої полягає у використанні рекурентної формули для обчислення середнього арифметичного . Якщо випадкова величина х надходить у вигляді дискретних вимірів і для (N - 1) - го виміру обчислено середнє значення , то поява нового виміру змінює попереднє середнє значення на величину При згладжуванні цим методом у кожній точці на часовій осі виміряне значення замінюється на середнє, розраховане на даний момент часу. Послідовність обчислених за рекурентною формулою середніх значень є позбавленим від перешкод рядом вимірів змінної х, який використовується при подальшій обробці.
Приклад: розглянемо згладжування методом оновлюваної середньої наступного ряду вимірювань величини х: 3.4; 3.1; 5.4; 2.7; 2.9; 3.3; 2.7; 4.3; 3.2; 2.0. Перше значення збігається з х1. Друге значення обчислюється за рекурентною формулою: Отже, ;
Приклад (продовження): Результати згладжування експериментальних даних зображено на рисунку:
Метод ковзної середньої Метод ковзної середньої полягає в послідовному усередненні на деякому інтервалі значень вимірюваної величини х. Рухаючи уздовж осі часу для всіх точок , що попали в нього, відповідні значення замінимо середніми значеннями; віднесемо ці значення до середини відповідного інтервалу. Операція згладжування виконується за формулою: де і – номер інтервалу; (l+1) – число вимірювань у і-тому інтервалі; - номер замінюваного вимірювання. Якщо попередня оцінка виконана невдало і після згладжування залишаються перешкоди, утворені дані знову можна піддати усередненню і робити це багаторазово, до бажаного результату.
Приклад: для ряду вимірювань 3.4; 3.1; 5.4; 2.7; 2.9; 3.3; 2.7; 4.3; 3.2; 2.0. обчислимо згладжені значення на інтервалі l+1=3, використовуючи формулу: Отже,
Іноді при згладжуванні заокруглюють наближення, використовуючи середні значення для не перекриваючих один одного інтервалів. Для цього обчислюють середнє значення за трьома першими точками, приписують результат середині інтервалу, а для наступного обчислення середньої використовують 4-ту, 5-ту і 6-ту точки і т. д. В обох випадках частина початкової і кінцевої інформації втрачається.
Метод експоненційного згладжування Цей метод має найширші можливості. Тут використовують наступні формули: де - параметр згладжування, який вибирається в діапазоні 0..1. Тут обчислювана середня заміняє відповідне значення вимірюваної змінної. Від величини залежать згладжуючи властивості методу. При різних можна добувати з вихідної інформації високочастотні або низькочастотні складові. Таким чином, з’являється можливість боротися з низько – і високочастотними шумами, тобто зі швидко – і повільно змінними у часі перешкодами. або
При малих , близьких до 0 , сукупність обчислених середніх відобразить низькочастотні зміни вимірюваної змінної, позбавивши їх швидкозмінних перешкод. У цьому випадку говорять про інерційне згладжування, при якому обчислювана середня мало залежить від останнього вимірювання і значною мірою від середньої, утвореної на попередньому кроці. Якщо обрана величина - близька до 1 (наприклад, становить 0,6), то згладжування буде мало інерційним, значення ближчими до вимірюваних значень х, тобто високі частоти зберігатимуться:
КРИТЕРІЇ ВІДСІЮВАННЯ ЗАВІДОМО ПОМИЛКОВИХ ДАНИХ Дані, які відповідають умовам, що змінилися, називають грубими помилками або значеннями, що різко виділяються (аномальними). У разі відсіву грубих помилок формулюється нульова гіпотеза: Н0 :"Серед результатів спостережень (вибіркових, дослідних даних) немає значень, що різко виділяються (аномальних) ". Альтернативною гіпотезою може бути або Н1(1): "Серед результатів спостережень є тільки одна груба помилка" або Н1(2): "Серед результатів спостережень є дві або більш грубих помилок". Найпоширенішими і теоретично обґрунтованими в цьому випадку є критерій Н.В. Смірнова (використовується при Н1(1)) і критерій Діксона (застосовується як при Н1(1) так і при Н1(2))
Критерій Н. В. Смірнова Якщо відомо, що є тільки одне аномальне значення (альтернативна гіпотеза Н1(1)), то воно буде крайнім членом варіаційного ряду. Тому перевіряти вибірку на наявність однієї грубої помилки природно за допомогою статистики (якщо сумнів викликає перший член варіаційного ряду ): або якщо сумніви викликає максимальний член варіаційного ряду
Критерій Н. В. Смірнова Цей критерій вперше був запропонований Н.В. Смірновим. Він досліджував розподіл цих статистик і склав таблиці процентних точок . При вибраному рівні значущості критична область для критерію Н.В. Смірнова будується таким чином: де – це табличні значення У випадку якщо виконується остання умова (статистика потрапляє в критичну область), то нульова гіпотеза відхиляється, тобто викид х1 або хn не випадковий і не характерний для даної сукупності даних, а визначається умовами, що змінилися або грубими помилками при проведенні дослідів. В цьому випадку значення або виключають з розгляду, а знайдені раніше оцінки піддаються коректуванню з урахуванням відкинутого результату. або
Критерій Діксона В критерії Діксона застосовується статистика: • якщо підозріла «чужорідна» точка має найбільше значення: (1) • якщо підозріла «чужорідна» точка має найменше значення: (2) Де – члени варіаційного ряду
Критерій Діксона Статистики критерію Діксона, що використовуються при інших об'ємах вибірки, приведені в таблиці:
Схожі презентації
Категорії