Як перевірити нормальність розподілу.

Отже, ви провели величезну роботу: проаналізували наявні джерела, висунули гіпотезу, зібрали емпіричні дані, і ось настав час їх математичної обробки. Найбільша частина статистичних спостережень схильна закону нормального розподілу , але ви спостерігаєте відхилення від нормальної кривої або стрибок залежного показника. Ваше завдання - визначити, чи є ці відхилення випадковими, або ж ви відкрили щось нове в науці. А може бути, ви просто неправильно сформували вибірку.
Інструкція
1
Щоб визначити, чи відповідають ваші дані нормальному розподілу, вам потрібно мати статистику по генеральній сукупності. З найбільшою ймовірністю у вас її не буде, бо якщо ви заздалегідь знаєте розподіл досліджуваного показника, то ваше дослідження попросту не потрібно було проводити.
2
Тим не менш, якщо у вас є статистика по генеральній сукупності, ви можете перевірити, чи правильно ви сформували вибірку. Найчастіше для цього застосовується критерій Пірсона, або статистика хі-квадрат. Цей критерій зазвичай використовується для вибірок з числом спостережень більше 30, в іншому випадку використовують t-критерій Стьюдента.
3
В першу чергу обчисліть середнє значення по вибірці і середньоквадратичне відхилення. Ці показники будуть необхідні при будь-яких розрахунках. Далі необхідно визначити теоретичну (гіпотетичну) частоту розподілу досліджуваного ознаки. Вона дорівнюватиме математичному очікуванню розподілу шуканої величини, виходячи з даних генеральної сукупності, або, якщо таких немає, заснована на емпіричних даних.
4
Таким чином ви отримаєте два ряди величин, між якими спостерігається деяка залежність. Тепер слід перевірити ряди показників на рівень згоди за критеріями Пірсона, Колмогорова або Романовського при заданому рівні ймовірності помилки альфа.
5
Якщо коефіцієнт кореляції між емпіричним і теоретичним розподілом досліджуваного ознаки виявиться поза межами заданого рівня ймовірності помилки, гіпотезу про те, що досліджуваний вами ознака відповідає нормальному розподілу генеральної сукупності слід відкинути. Подальша інтерпретація таких результатів статистичної обробки даних залежить від цілей дослідження і, в деякій мірі, від вашої нашої наукової інтуїції або фантазії.