Будівництво та ремонт

Рівень статистичної значущості (р). Рівень значущості

Рівень значущості- ймовірність помилкового відхилення (відкидання) гіпотези, тоді як вона насправді вірна. Йдеться про відхилення нульової гіпотези.

1. 1-й рівень значущості: α ≤ 0,05.

Це 5% рівень значимості. До 5% становить можливість, що ми помилково зробили висновок у тому, що відмінності достовірні, тоді як вони недостовірні насправді. Можна сказати і по-іншому: ми лише на 95% упевнені в тому, що відмінності справді вірогідні.

2. 2-й рівень значущості: α ≤ 0,01.

Це 1% рівень значимості. Імовірність помилкового висновку у тому, що відмінності достовірні, становить трохи більше 1%. Можна сказати і по-іншому: ми на 99% впевнені, що відмінності дійсно достовірні.

3. 3-й рівень значущості: α ≤ 0,001.

Це 0,1% рівень значимості. Усього 0,1% становить ймовірність того, що ми зробили помилковий висновок про те, що відмінності є достовірними. Це найнадійніший варіант висновку про достовірність відмінностей. Можна сказати й по-іншому: ми на 99,9% впевнені, що відмінності дійсно достовірні.

В області ФК та ​​спорту достатній рівень значущості α = 0,05, більш серйозні висновки рекомендується давати, використовуючи рівень значущості α = 0,01 або α = 0,001.

7.2. F-критерій Фішера

Оцінка генеральних параметрів за допомогою вибіркових даних провадиться за допомогою F - критерію Фішера. Цей критерій вказує на наявність або відсутність достовірної відмінності у двох дисперсіях. Критерій Фішера - показник достовірності впливу факторів, що вивчаються, на отриманий результат.

приклад 4.В експериментальній групі школярів середній приріст результатів у стрибках у довжину з розбігу після застосування нової методики навчання склав 10 см (10 см). У контрольній групі, де застосовувалася традиційна методика, 4 см (4 см). Початкові дані:

Експериментальна група (xi): 17; 11; 3; 8; 9; 12; 10; 13; 10; 7.

Контрольна група (у i): 8; 1; 6; 2; 3; 0; 4; 7; 5; 4.

Чи можна стверджувати, що нововведення ефективніше вплинули на процес формування рухової дії, що вивчається, в порівнянні з традиційною методикою?

Для відповіді на поставлене запитання скористаємося F - критерієм Фішера:

1) Задаємося рівнем значущості α = 0,05.

2) Обчислюємо виправлені вибіркові дисперсії з прикладу за формулою:

3) Обчислюємо значення F - критерію за формулою, причому, в чисельник ставиться більша дисперсія, знаменник – менша:

4) З таблиці 3 додатка при α = 0,05; df 1= n 1 - 1 = 9; df 2= n 2 - 1 = 9; знаходимо F 0,05 = 3,18

5) Порівнюємо між собою значення F і F 0,05.

Висновок.Оскільки F< F 0.05 (2,1 < 3,18), то на уровне значимости α = 0,05 различие дисперсий статистически недостоверно, т.е. можно сказать, что школьники при обеих системах подготовки не отличаются по признаку вариативности результатов.

7.3. t- критерій Стьюдента

Загальна назва класу методів статистичної перевірки гіпотез (статистичних критеріїв), заснованих на розподілі Стьюдента. Найчастіші випадки застосування t-критерію пов'язані з перевіркою рівності середніх значень у двох вибірках. t-Статистика будується зазвичай за наступним загальним принципом: у чисельнику випадкова величина з нульовим математичним очікуванням (при виконанні нульової гіпотези), а в знаменнику - вибіркове стандартне відхилення цієї випадкової величини, одержуване як квадратний корінь з незміщеної оцінки дисперсії.

Встановлює доказ достовірної різниці або, навпаки, відсутність відмінності у двох середніх вибіркових значеннях для незалежних вибірок. Розглянемо послідовність обчислень, використовуючи приклад 4:

1) Приймаємо припущення щодо нормальності розподілу генеральних сукупностей, у тому числі отримані дані. Формулюємо гіпотези:

Нульова гіпотеза H o: = .

Альтернативна гіпотеза: H 1: ≠ .

Задаємося рівнем значущості α = 0,05.

2) В результаті попередньої перевірки при використанні критерію Фішера встановлено, що відмінність дисперсій статистично недостовірна: D(x) = D(y).

3) Оскільки генеральні дисперсії D(x) і D(y) однакові, а n 1 і n 2 – обсяги малих незалежних вибірок, то значення критерію, що спостерігається, дорівнює:

Обчислюємо число ступенів свободи за формулою

Нульова гіпотеза відкидається, якщо │ │ ˃ , З таблиці 1 додатка знаходимо критичне значення t – критерію при α = 0,05; = 18: = 2,101

Висновок:оскільки > (4,18 2,101), то на рівні значущості 0,05 ми відкидаємо гіпотезу Н 0 і приймаємо альтернативну гіпотезу Н 1 .

Таким чином, нововведення успішніше вирішують завдання навчання школярів стрибкам у довжину з розбігу, ніж традиційна методика.

Умови застосування - Різниця пов'язаних пар результатів вимірювання. Робиться припущення про нормальний розподіл цих різниць у генеральній сукупності з параметрами.

Приклад 5. Група 10 школярів протягом літніх канікул перебувала у літньому оздоровчому таборі. До і після сезону вони вимірювали життєву ємність легень (ЖЕЛ). За результатами вимірювань слід визначити, чи достовірно змінився цей показник під впливом фізичних вправ на свіжому повітрі.

Вихідні дані до експерименту (x i ; мл) 3400; 3600; 3000; 3500; 2900; 3100; 3200; 3400; 3200; 3400, тобто. обсяг вибірки n=10.

Після експерименту (y i ; мл): 3800; 3700; 3300; 3600; 3100; 3200; 3200; 3300; 3500; 3600.

Порядок обчислень:

1) Знаходимо різницю пов'язаних пар результатів виміру d i:

;

2) Формулюємо гіпотези:

Нульова гіпотеза H o: =

Альтернативна гіпотеза: H1: ≠0.

3) Задаємося рівнем значущості α = 0,05

4) Обчислюємо – (середнє арифметичне), s d – (стандартне відхилення). = 160(мл); s d = 150,6 (мл)

5) Значення t-критерію визначаємо за формулою для пов'язаних пар:

З таблиці 1 додатка знаходимо критичне значення t - критерію при α = 0,05; = n - 1 = 9: = 2,262

Висновок:Оскільки t > t кр(3,36 > 2,262) спостерігається відмінність за показником ЖЕЛ є статистично достовірним лише на рівні значимості α =0,05.

1. Афанасьєв В.В. Основи відбору, за та контролю у спорті / В.В. Афанасьєв, А.В. Муравйов, І.А. Осетрів. - Ярославль: Вид-во ЯДПУ, 2008. - 278 с.

2. Біленко, А.Г. Основи спортивної метрології: Навчальний посібник/А.Г. Біленко, Л.П. Говорков; СПб ГУФК ім. П.Ф. Лісгафт. - СПб., 2005. - 138 с.

3. Губа В.П. Вимірювання та обчислення у спортивно-педагогічній практиці: навчальний посібник для студентів вищих навчальних закладів/В.П. Губа, М.П.Шестаков, Н.Б. Бубнов, М.П. Борисенків. - М.: ФіС, 2006. - 220 с.

4. Гмурман В.Є. Керівництво до вирішення завдань з теорії ймовірностей та математичної статистики. - М: Вища школа, 2004. - 404 с.

5. Коренберг, В.Б. Спортивна метрологія: підручник/В.Б. Коренберг - М.: Фізична культура, 2008. - 368 с.

6. Начинська, С. В. Спортивна метрологія. Навчальний посібник для студ. вищ. навч. закладів / С. В. Начинська. - М.: Видавничий центр «Академія», 2005. - 240 с.

7. Начинська С.В. Застосування статистичних методів у сфері фізичної культури/Начинська С.В – СПб., 2000. – 260 с.

8. Смирнов, Ю. І. Спортивна метрологія: навч. для студ. пед. вузів / Ю. І Смирнов, М. М. Полівщиков. - М.: Видавництво. центр "Академія", 2000. - 232 с.

ДОДАТОК

4. Пояснити, що таке рівень статистичної значимості.

Рівень значущості – це ймовірність того, що ми визнали відмінності суттєвими, а вони насправді випадкові.

Коли ми вказуємо, що відмінності достовірні на 5% рівні значимості, або при p≤0,05. то ми маємо на увазі, що ймовірність того, що вони все-таки недостовірні, становить 0,05. Коли ми вказуємо, що відмінності достовірні на 1% рівні значимості, або при p≤0,01, то маємо на увазі, що ймовірність того, що вони все-таки недостовірні, становить 0,01.

Якщо перекласти все це більш формалізований мову, то рівень значущості - це можливість відхилення нульової гіпотези, тоді як вона правильна.

У статистиці величину називають статистично значущою, якщо мала ймовірність суто випадкового виникнення її або ще більш крайніх величин. Тут під крайністю розуміється ступінь відхилення від нуль-гіпотези. Різниця називається «статистично значущою», якщо є дані, поява яких було малоймовірно, якщо припустити, що ця різниця відсутня; цей вислів не означає, що ця різниця має бути великою, важливою, або значущою в загальному розумінні цього слова.

Рівень важливості зазвичай позначають грецькою літерою (альфа). Популярними рівнями значущості є 5%, 1% та 0.1%. Якщо тест видає p-величину менше α-рівня, то нуль-гіпотеза відхиляється. Такі результати неформально називають статистично значущими. Наприклад, якщо хтось каже що «шанси того, що трапилося є збігом, дорівнюють одному з тисячі», то мають на увазі 0.1 % рівень значущості.

5. Як інтерпретувати моду, медіану та середнє?

Мода – точка, у якій щільність розподілу має локальний максимум. Розподіл може мати кілька мод.

МЕДІАНА - один із показників центру розподілу для порядкових та кількісних змінних; позначається Ме. Є значення змінної, яке поділяє вибірку навпіл таким чином, щоб для 50% об'єктів з вибірки значення змінної не перевищували Ме, а для інших 50% об'єктів - були не менше ніж Ме.

Математичне очікування - поняття середнього значення випадкової величини теорії ймовірностей. Усі розглянуті характеристики: мода, медіана, середня арифметична, середня зважена є середніми. Вони характеризують центральні тенденції одномірного розподілу.

6. Квантильна шкала - це шкала, умовою для побудови якої є можливість ранжування випробуваних за величиною у.

Квантильні ранги мають прямокутний розподіл, тобто у кожному інтервалі квантильної шкали міститься однакова частка обстежених осіб. Стандартизація тестових оцінок шляхом їх переведення в квантильну шкалу стирає відмінності в особливостях розподілу психодіагностичних показників, оскільки зводить будь-який розподіл прямокутного. Тому з позиції теорії вимірювань квантильні шкали відносяться до шкал порядку: вони дають інформацію, у кого з випробуваних сильніше виражена властивість, що тестується, але нічого не дозволяють сказати про те, наскільки або в скільки разів сильніше.

7. Якщо коефіцієнт кореляції по модулю виявляється близьким до одиниці, то величини, що досліджуються, лінійно залежні.

8. Вирішити завдання, використовуючи критерій Фрідмана.

Шістьох респондентам пред'являли тест Равенна. Фіксується час вирішення кожного завдання. Експериментатор передбачає, що знайдено статистично значущі різницю між часом вирішення перших трьох завдань. Результати вимірів представлені у таблиці.

Час вирішення другого завдання тесту, сек.

Час вирішення третього завдання тесту в сік.

1 8 3 5
2 4 15 12
3 6 23 15
4 3 6 6
5 7 12 3
6 15 24 12
Суми 43 83 53
Середні 7,2 13,8 8,8

Критерій χ 2 r Фрідмана

Призначення критерію

Критерій 2 r застосовується для зіставлення показників, виміряних у трьох або більше умовах на одній і тій же вибірці піддослідних.

Критерій дозволяє встановити, що величини показників від умови до умови змінюються, але не вказує на спрямованість змін.

Гіпотези

H 0: Між показниками, отриманими (виміряними) у різних умовах, існують лише випадкові відмінності.

H 1: Між показниками, отриманими за різних умов, існують невипадкові відмінності.

Проранжуємо значення, отримані за трьома тестами кожним випробуваним.

Сума рангів по кожному випробуваному повинна становити 6. Розрахункова загальна сума рангів у критерії визначається за такою формулою:

де n - кількість випробуваних

с - кількість умов виміру (вимірювання).

В даному випадку,

6*3*(3+1)/2 = 36

Показники часу рішення тестів 1, 2, 3 та його ранги (n=6)

Час вирішення 1-го завдання тесту, с.

Час розв'язання другого завдання тесту, в сек.

Час вирішення 3-го завдання тесту в сік.

1 8 3 3 1 5 2
2 4 1 15 3 12 2
3 6 1 23 3 15 2
4 3 1 6 3 6 2
5 7 2 12 3 3 1
6 15 2 24 3 12 1
Суми 43 10 83 16 53 10
Середні 7,2 13,8 8,8

Загальна сума рангів становить: 10+16+10=36, що збігається з розрахунковою величиною.

Сформулюємо гіпотези.

Н 0: Відмінності у часі, який випробувані проводять над рішенням трьох різних тестів є випадковими.

H 1: Відмінності у часі, який випробувані проводять над розв'язанням трьох різних тестів, є випадковими.

Тепер нам потрібно визначити емпіричне значення χ 2 r за формулою:

де с – кількість умов;

n – кількість піддослідних;

T 2 j - суми рангів за кожною з умов.

Визначимо χ 2 r для цього випадку:

χ 2 r = ((12/6*3*(3+1))*(100 +256 + 100)) – 3*6*(3+1) = 4

Оскільки в даному прикладі розглядаються три завдання, тобто 3 умови, =3. Кількість випробуваних n=6. Це дозволяє скористатися спеціальною таблицею χ 2 r , саме табл. VII-A Додатки I. Емпіричне значення 2 r =4 при с=3, n=6 точно відповідає рівню значущості р=0,184.

Відповідь: Н 0 відхиляється. Приймається Н1. Відмінності в часі, який випробувані проводять над розв'язуванням трьох різних тестів, невипадкові (р=0,184).


...) або непозитивним (друге рішення). Завдання пошуку параметра при граничних умовах допоможе вирішити спеціальна надбудова Microsoft Excel Пошук рішення. 2 Практична частина 2.1 Приклад вирішення завдань з використанням функції “підбір параметра” Як відомо, формули Microsoft Excel дозволяють визначити значення функції за її аргументами. Однак може виникнути ситуація.

Його збільшенням з метою інформаційного забезпечення виконавчих місцевих органів. 3 ДОСВІД УПРАВЛІННЯ ТА ОБСЛУГОВУВАННЯ ДАНИХ НА ПРИКЛАДІ АЛМАТИНСЬКОГО ОБЛАСНОГО УПРАВЛІННЯ СТАТИСТИКИ3.1 Алматинське обласне управління статистики як суб'єкт збору та узагальнення статистичної інформації У своїй діяльності Алматинське обласне управління статистики (АТУС)

Перевірити знання студента з першої частини курсу, що викладається у перших чотирьох модулях. У інших питаннях квитка перевіряються знання класичної граничної проблеми теорії ймовірностей та математичної статистики, що викладаються у наступних п'яти модулях. 1. Імовірнісна модель з не більш ніж лічильним числом елементарних результатів. Приклад: випробування з можливими результатами. 2. ...

лекція 4.

Загальні засади перевірки статистичних гіпотез

Підкреслимо ще раз, що отримані в результаті експерименту на будь-якій вибірці дані є підставою для судження про генеральну сукупність. Однак через дію випадкових ймовірнісних причин оцінка параметрів генеральної сукупності, зроблена на підставі експериментальних (вибіркових) даних, завжди супроводжуватиметься похибкою, і тому подібні оцінки повинні розглядатися як імовірні, а не як остаточні твердження. Подібні припущення про властивості та параметри генеральної сукупності отримали назву статистичних гіпотез .

Сутність перевірки статистичної гіпотези полягає в тому, щоб встановити, чи узгоджуються експериментальні дані та висунута гіпотеза, чи допустимо віднести розбіжність між гіпотезою та результатом статистичного аналізу експериментальних даних за рахунок випадкових причин? Таким чином, статистична гіпотеза – це наукова гіпотеза, яка допускає статистичну перевірку, а математична статистика – це наукова дисципліна, завданням якої є науково обґрунтована перевірка статистичних гіпотез.

Статистичні гіпотези

Під час перевірки статистичних гіпотез використовуються два поняття: так звана нульова (позначення Н 0) та альтернативна гіпотеза (позначення Н 1).

Нульова гіпотеза- Це гіпотеза про відсутність відмінностей. Вона позначається як і називається нульовою тому, що містить число 0: , де - Порівнянні значення ознак.

Нульова гіпотеза – те, що хочемо спростувати, якщо маємо завдання довести значимість відмінностей.

Альтернативна гіпотеза- Це гіпотеза про значущість відмінностей. Вона позначається як . Альтернативна гіпотеза – те, що ми хочемо довести, тому іноді її називають експериментальноїгіпотезою.

Бувають завдання, коли потрібно довести якраз незначущість відмінностей, тобто. підтвердити нульову гіпотезу. Проте найчастіше потрібно довести значущість відмінностей, оскільки вони більш інформативні у пошуку нового.

Нульова та альтернативна гіпотези можуть бути спрямованими та неспрямованими.

Спрямовані гіпотези

: не перевищує

: перевищує

Ненаправлені гіпотези

: не відрізняється

: відрізняється

Якщо в ході експерименту було помічено, що водній групі індивідуальні значення випробуваних за якоюсь ознакою, наприклад, за соціальною сміливістю, вище, а в іншій нижче, для перевірки значущості цих відмінностей необхідно сформулювати спрямовані гіпотези.

Якщо необхідно довести, що першій групі під впливом якихось експериментальних впливів відбулися більш виражені зміни, ніж у другій групі, то цьому випадку теж необхідно сформулювати спрямовані гіпотези.

Якщо ж потрібно довести, що розрізняються форми розподілу ознаки у першій та другій групах, то формулюються ненаправлені гіпотези.

Зауваження.При описі кожного критерію даються формулювання гіпотез, які допомагає перевірити.

Взагалі кажучи, при прийнятті чи запереченні гіпотез можливі різні варіанти.

Наприклад, психолог провів вибіркове тестування показників інтелекту у групи підлітків із повних та неповних сімей. В результаті обробки експериментальних даних встановлено, що у підлітків із неповних сімей показники інтелекту в середньому нижчі, ніж у їхніх ровесників із повних сімей. Чи може психолог на основі отриманих результатів зробити висновок, що неповна сім'я веде до зниження інтелекту у підлітків? Висновок, що приймається в таких випадках, носить назву статистичного рішення. Підкреслимо, що таке рішення завжди ймовірне.

Під час перевірки гіпотези експериментальні дані можуть суперечити гіпотезі , тоді ця гіпотеза відхиляється. Інакше, тобто. якщо експериментальні дані узгоджуються з гіпотезою, вона не відхиляється. Часто в таких випадках кажуть, що гіпотеза приймається (хоча таке формулювання не зовсім точне, проте воно широко поширене і ми нею користуватимемося надалі). Звідси видно, що статистична перевірка гіпотез, заснована на експериментальних, вибіркових даних, неминуче пов'язані з ризиком (імовірністю) прийняти хибне рішення. У цьому можливі помилки двох пологів.

Помилка першого родувідбудеться, коли буде прийнято рішення відхилити гіпотезу, хоча насправді вона виявляється правильною.

Помилка другого родустанеться, коли буде прийнято рішення не відхиляти гіпотезу, хоча насправді вона буде невірною. Вочевидь, як і правильні висновки може бути прийнято й у випадках. Вищесказане краще подати у вигляді таблиці 1:

Таблиця 1

Не виключено, що психолог може помилитися у своєму статистичному рішенні; як бачимо з таблиці 1, ці помилки можуть лише двох пологів. Оскільки виключити помилки після прийняття статистичних гіпотез неможливо, необхідно мінімізувати можливі наслідки, тобто. ухвалення невірної статистичної гіпотези. Найчастіше єдиний шлях мінімізації помилок полягає у збільшенні обсягу вибірки.

Поняття рівня статистичної значущості

При обґрунтуванні статистичного висновку слід вирішити питання, де проходить лінія між прийняттям і запереченням нульової гіпотези? У силу наявності в експерименті випадкових впливів цей кордон не може бути проведений абсолютно точно. Вона базується на понятті рівня значимості.

Опр. рівнем значимостіназивається ймовірність помилкового відхилення нульової гіпотези. Або, іншими словами, рівень значущостіце ймовірність помилки першого роду після ухвалення рішення.

Для позначення цієї ймовірності, як правило, використовують або грецьку букву, або латинську букву Р.Надалі ми вживатимемо літеру Р.

Історично склалося так, що в прикладних науках, що використовують статистику, і зокрема у психології, вважається, що нижчим рівнем статистичної значущості є рівень; достатнім - рівень та вищим рівень. Тому в статистичних таблицях, які наводяться у додатку до підручників зі статистики, зазвичай даються табличні значення рівнів: ; ; . Іноді даються табличні значення рівнів і . Величини 0,05, 0,01 та 0,001 - це так звані стандартні рівні статистичної значущості . При статистичному аналізі експериментальних даних психолог залежно від завдань та гіпотез дослідження має вибрати необхідний рівень значущості. Як бачимо, тут найбільша величина, або нижня межа рівня статистичної значущості, дорівнює 0,05 - це означає, що допускається п'ять помилок у вибірці зі ста елементів (випадків, випробуваних) або одна помилка із двадцяти елементів (випадків, випробуваних). Вважається, що ні шість, ні сім, ні більше разів зі ста ми помилитися не можемо. Ціна таких помилок буде надто великою.

Зауважимо, що у сучасних статистичних пакетах на ЕОМ використовуються не стандартні рівні значимості, а рівні, що підраховуються у процесі роботи з відповідним статистичним методом. Ці рівні, що позначаються буквою Р,можуть мати різний числовий вираз в інтервалі від 0 до 1, наприклад, Р= 0,7, Р= 0,23 або Р= 0,012. Зрозуміло, що у перших двох випадках, отримані рівні значущості занадто великі і говорити, що результат значимий не можна. У той самий час у разі результати значимі лише на рівні 12 тисячних, це достовірний рівень.

Правило прийняття статистичного висновку таке: на підставі отриманих експериментальних даних психолог підраховує за вибраним ним статистичним методом так звану емпіричну статистику, або емпіричне значення. Цю величину зручно позначити як Ч емп.Потім емпірична статистика Ч емппорівнюється з двома критичними величинами, які відповідають рівням значимості 5% і 1% для обраного статистичного методу і які, позначаються як . Величини знаходяться для даного статистичного методу за відповідними таблицями, наведеними у додатку до будь-якого підручника зі статистики. Ці величини, зазвичай, завжди різні і в подальшому для зручності можна назвати, як і . Знайдені за таблицями величини критичних значень та зручно представляти у наступній стандартній формі записи:

Однак підкреслимо, що ми використовували позначення і як скорочення слова «число». У всіх статистичних методах прийнято свої символічні позначення всіх цих величин: як підрахованої за відповідним статистичним методом емпіричної величини, так і знайдених за відповідними таблицями критичних величин. Наприклад, при підрахунку рангового коефіцієнта кореляції Спірмена за таблицею 21 Додатка знайшли наступні величини критичних значень, які цього методу позначаються грецької буквою (ро).

Прийнято знайдені значення записувати так:

Тепер нам необхідно порівняти наше емпіричне значення із двома знайденими за таблицями критичними значеннями. Найкраще це зробити, розташувавши всі три числа на так званій осі значимості». « Вісь значущості» являє собою пряму, на лівому кінці якої розташовується 0, хоча він, як правило, не відзначається на цій прямій, і зліва направо йде збільшення числового ряду. По суті, це звична шкільна вісь абсцис ОХдекартової системи координат. Однак особливість цієї осі в тому, що на ній виділено три ділянки, зони». Ліва зона називається зоною незначущості , права - зоною значимості , а проміжна зоною невизначеності . Кордонами всіх трьох зон є Ч кр1для Р = 0,05 і для Р = 0,01, як показано нижче.

Перевірка гіпотез проводиться з допомогою статистичного аналізу. Статистичну значущість знаходять за допомогою Р-значення, яке відповідає ймовірності цієї події при припущенні, що деяке твердження (нульова гіпотеза) є істинним. Якщо Р-значення менше заданого рівня статистичної значущості (зазвичай це 0,05), експериментатор може сміливо зробити висновок, що нульова гіпотеза неправильна, і перейти до розгляду альтернативної гіпотези. За допомогою t-критерію Стьюдента можна обчислити Р-значення та визначити значущість для двох наборів даних.

Кроки

Частина 1

Постановка експерименту

    Визначте свою гіпотезу.Перший крок в оцінці статистичної значущості у тому, щоб вибрати питання, відповідь який ви хочете отримати, і сформулювати гіпотезу. Гіпотеза - це твердження про експериментальні дані, їх розподіл та властивості. Для будь-якого експерименту існує як нульова, і альтернативна гіпотеза. Взагалі кажучи, вам доведеться порівнювати два набори даних, щоб визначити, схожі вони чи різні.

    • Нульова гіпотеза (H0) зазвичай стверджує, що між двома наборами даних немає різниці. Наприклад: ті учні, які читають матеріал перед заняттями, не одержують вищих оцінок.
    • Альтернативна гіпотеза (H a) протилежна нульовій гіпотезі і є твердженням, яке потрібно підтвердити за допомогою експериментальних даних. Наприклад: ті учні, які читають матеріал перед заняттями, отримують вищі оцінки.
  1. Встановіть рівень значущості, щоб визначити, наскільки розподіл даних має відрізнятися від звичайного, щоб це можна було вважати значним результатом. Рівень значущості (його називають також α (\displaystyle \alpha)-Рівнем) - це поріг, який ви визначаєте для статистичної значущості. Якщо Р-значення менше рівня значимості або дорівнює йому, дані вважаються статистично значущими.

    Вирішіть, який критерій ви використовуватимете:односторонній чи двосторонній. Одне із припущень у t-критерії Стьюдента свідчить, що дані розподілені нормально. Нормальний розподіл є дзвоноподібною кривою з максимальною кількістю результатів посередині кривої. t-критерій Стьюдента - це математичний метод перевірки даних, який дозволяє встановити, чи випадають дані межі нормального розподілу (більше, менше, чи “хвостах” кривої).

    • Якщо ви не впевнені, чи дані вище або нижче контрольної групи значень, використовуйте двосторонній критерій. Це дозволить вам визначити значущість у обох напрямках.
    • Якщо ви знаєте, у якому напрямку дані можуть вийти за межі нормального розподілу, використовуйте односторонній критерій. У наведеному вище прикладі очікуємо, що оцінки студентів підвищаться, тому можна використовувати односторонній критерій.
  2. Визначте обсяг вибірки за допомогою статистичної потужності.Статистична потужність дослідження - це ймовірність того, що при даному обсязі вибірки вийде очікуваний результат. Поширений поріг потужності (або β) становить 80%. Аналіз статистичної потужності без будь-яких попередніх даних може представляти певні складності, оскільки потрібна деяка інформація про очікувані середні значення в кожній групі даних та про їх стандартні відхилення. Використовуйте для аналізу статистичної потужності онлайн-калькулятор для визначення оптимального обсягу вибірки для ваших даних.

    • Зазвичай вчені проводять невелике пробне дослідження, яке дозволяє отримати дані для аналізу статистичної потужності та визначити обсяг вибірки, необхідний більш розширеного і повного дослідження.
    • Якщо ви не маєте можливості провести пробне дослідження, постарайтеся на підставі літературних даних та результатів інших людей оцінити можливі середні значення. Можливо, це допоможе вам визначити оптимальний обсяг вибірки.

    Частина 2

    Обчисліть стандартне відхилення
    1. Запишіть формулу стандартного відхилення.Стандартне відхилення показує, наскільки великий розкид даних. Воно дозволяє укласти, наскільки близькі дані, отримані певної вибірці. На перший погляд, формула здається досить складною, але наведені нижче пояснення допоможуть зрозуміти її. Формула має такий вигляд: s = √∑((xi – µ) 2 /(N – 1)).

      • s – стандартне відхилення;
      • знак ∑ вказує на те, що слід скласти усі отримані на вибірці дані;
      • x i відповідає i-му значенню, тобто окремому отриманому результату;
      • µ – це середнє значення для цієї групи;
      • N - загальна кількість даних у вибірці.
    2. Знайдіть середнє значення у кожній групі.Щоб обчислити стандартне відхилення, необхідно спочатку знайти середнє для кожної досліджуваної групи. Середнє значення позначається грецькою літерою µ (мю). Щоб знайти середнє, складіть всі отримані значення і поділіть їх на кількість даних (обсяг вибірки).

      • Наприклад, щоб знайти середню оцінку групи тих учнів, які вивчають матеріал перед заняттями, розглянемо невеликий набір даних. Для простоти використовуємо набір із п'яти точок: 90, 91, 85, 83 і 94.
      • Складемо разом усі значення: 90 + 91 + 85 + 83 + 94 = 443.
      • Поділити суму на число значень, N = 5: 443/5 = 88,6.
      • Отже, середнє значення цієї групи становить 88,6.
    3. Відніміть із середнього кожне отримане значення.Наступний крок полягає у обчисленні різниці (xi – µ). Для цього слід відняти від знайденої середньої величини кожне отримане значення. У нашому прикладі необхідно знайти п'ять різниць:

      • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) та (94 - 88,6).
      • В результаті отримуємо наступні значення: 1,4, 2,4, -3,6, -5,6 та 5,4.
    4. Зведіть у квадрат кожну отриману величину і складіть їх разом.Кожну із щойно знайдених величин слід звести у квадрат. На цьому кроці зникнуть усі негативні значення. Якщо після цього кроку у вас залишаться негативні числа, то ви забули звести їх у квадрат.

      • Для нашого прикладу отримуємо 1,96, 5,76, 12,96, 31,36 та 29,16.
      • Складаємо отримані значення: 1,96+5,76+12,96+31,36+29,16=81,2.
    5. Поділіть обсяг вибірки мінус 1.У формулі сума ділиться на N – 1 через те, що ми не враховуємо генеральну сукупність, а беремо для оцінки вибірку з усіх студентів.

      • Віднімаємо: N – 1 = 5 – 1 = 4
      • Ділимо: 81,2/4 = 20,3
    6. Вийміть квадратний корінь.Після того як ви поділіть суму на обсяг вибірки мінус один, витягніть із знайденого значення квадратний корінь. Це останній крок у обчисленні стандартного відхилення. Є статистичні програми, які після введення початкових даних роблять усі необхідні обчислення.

      • У прикладі стандартне відхилення оцінок тих учнів, які читають матеріал перед заняттями, становить s =√20,3 = 4,51.

    Частина 3

    Визначте значимість
    1. Розрахуйте дисперсію між двома групами даних.До цього кроку ми розглядали приклад лише однієї групи даних. Якщо ви хочете порівняти дві групи, очевидно, слід взяти дані обох груп. Обчисліть стандартне відхилення другої групи даних, а потім знайдіть дисперсію між двома експериментальними групами. Дисперсія обчислюється за такою формулою: s d = √((s 1 /N 1) + (s 2 /N 2)).

Рівень значущості - це ймовірність того, що ми визнали відмінності суттєвими, а вони насправді випадкові.

Коли ми вказуємо, що відмінності достовірні на 5% рівні значимості, або при р< 0,05 , то маємо на увазі, що ймовірність того, що вони все-таки недостовірні, становить 0,05.

Коли ми вказуємо, що відмінності достовірні на 1% рівні значимості, або при р< 0,01 , то маємо на увазі, що ймовірність того, що вони все-таки недостовірні, становить 0,01.

Якщо перекласти все це більш формалізований мову, то рівень значущості - це можливість відхилення нульової гіпотези, тоді як вона правильна.

Помилка,що складається втієї,що мивідхилилинульову гіпотезу,у той час як вона вірна, називається помилкою 1 роду.(Див. Табл. 1)

Табл. 1. Нульова та альтернативні гіпотези та можливі стани перевірки.

Імовірність такої помилки зазвичай позначається як α. По суті, ми мали б вказувати в дужках не р < 0,05 або р < 0,01 а α < 0,05 або α < 0,01.

Якщо ймовірність помилки – це α , то можливість правильного рішення: 1-α. Що менше α, то більша ймовірність правильного рішення.

Історично склалося так, що в психології прийнято вважати нижчим рівнем статистичної значущості 5% рівень (р≤0,05): достатнім – 1% рівень (р≤0,01) і вищим 0,1% рівень (р р≤0,001), тому в таблицях критичних значень зазвичай наводяться значення критеріїв, що відповідають рівням статистичної значущості р≤0,05 та р≤0,01, іноді – р≤0,001. Для деяких критеріїв у таблицях вказано точний рівень значущості їх різних емпіричних значень. Наприклад, для φ*=1,56 р=О,06.

Поки рівень статистичної значущості не досягне р=0,05, ми ще не маємо права відхилити нульову гіпотезу. Ми дотримуватимемося наступного правила відхилення гіпотези про відсутність відмінностей (Але) та прийняття гіпотези про статистичну достовірність відмінностей (Н 1).

Правило відхилення Hо та прийняття h1

Якщо емпіричне значення критерію дорівнює критичному значенню, що відповідає р≤0,05 або перевищує його, то H 0 відхиляється, але ми ще не можемо прийняти H 1 .

Якщо емпіричне значення критерію дорівнює критичному значенню, що відповідає р≤0,01 або перевищує його, то H0 відхиляється і приймається Н1.

Винятки : критерій знаків G, критерій Т Вілкоксону та критерій U Манна-Уітні. Їх встановлюються зворотні співвідношення.

Рис. 4. Приклад "осі значущості" для критерію Q Розенбаума.

Критичні значення критерію позначені Q о,о5 і Q 0,01, емпіричне значення критерію як Q емп. Воно укладено в еліпс.

Праворуч від критичного значення Q 0,01 тягнеться "зона значущості" - сюди потрапляють емпіричні значення, що перевищують Q 0 , 01 і, отже, безумовно, значущі.

Ліворуч від критичного значення Q 0,05 простягається "зона незначущості", - сюди потрапляють емпіричні значення Q, які нижче Q 0,05, і, отже, безумовно незначні.

Ми бачимо, що Q 0,05 =6; Q 0,01 =9; Q емп. =8;

Емпіричне значення критерію потрапляє в ділянку між Q 0,05 і Q 0,01. Це зона " невизначеності " : ми можемо відхилити гіпотезу про недостовірності відмінностей (Н 0), але ще можемо прийняти гіпотези про їх достовірності (H 1).

Практично, однак, дослідник може вважати достовірними вже ті відмінності, які не потрапляють до зони незначущості, заявивши, що вони є достовірними при р < 0,05 або вказавши точний рівень значимості отриманого емпіричного значення критерію, наприклад: р=0,02. За допомогою стандартних таблиць, які є у всіх підручниках з математичних методів, це можна зробити по відношенню до критеріїв Н Крускала-Уолліса, χ 2 r Фрідмана, L Пейджа, φ* Фішера .

Рівень статистичної значущості чи критичні значення критеріїв визначаються по-різному під час перевірки спрямованих і ненаправлених статистичних гіпотез.

При спрямованій статистичній гіпотезі використовується односторонній критерій, при ненаправленій гіпотезі – двосторонній критерій. Двосторонній критерій більш суворий, оскільки він перевіряє відмінності в обидві сторони, і тому емпіричне значення критерію, яке раніше відповідало рівню значимості р < 0,05, тепер відповідає лише рівню р < 0,10.

Нам не доведеться щоразу самостійно вирішувати, чи він використовує односторонній чи двосторонній критерій. Таблиці критичних значень критеріїв підібрані таким чином, що спрямованим гіпотезам відповідає односторонній, а ненаправленим - двосторонній критерій, і наведені значення задовольняють тим вимогам, які пред'являються до кожного з них. Досліднику необхідно лише стежити за тим, щоб його гіпотези збігалися за змістом і формою з гіпотезами, пропонованими в описі кожного з критеріїв.