Параметрические критерии
Параметрические методы обладают высокой чувствительностью. К ним относятся критерии t-Стьюдента и F-Фишера (ANOVA).
Условия применения параметрических методов: 1) соответствие распределения значений в генеральной выборке нормальному закону; 2) достаточно большая выборка, чтобы судить о законе распределения; 3) выполнение требования о гомогенности дисперсии при сравнении средних значений для независимых выборок; 4) наличие или отсутствие в выборке выбросов (экстремально больших или экстремально малых значений).
ПРИМЕНЕНИЕ t - КРИТЕРИЯ
Для вычисления уровня статистической достоверности различия между двумя средними[2], в случае, если эти значения измерены в интервальной шкале или шкале отношений, используется t-критерий. Существует три типа t-критерия: для одной выборки, для независимых и зависимых выборок.
Критерий t -Стьюдента для одной выборки
,
, где ошибка среднего
.
Критерий t -Стьюдента для независимых выборок (примерный)
,
.
Критерий t -Стьюдента для независимых выборок (точный) для выборок разных объемов
.
Критерий t -Стьюдента для зависимых выборок
,
.
Чтобы определить величину t , потребуются формулы для вычисления SS – сумм квадратов, δ2 – дисперсии, SD – стандартного отклонения и df – степеней свободы (см. выше):
,
,
.
´Задача 2.20 (вариант с одной выборкой). Выделяются ли ученики с высоким осенним СБ из всей массы учеников?
Вначале вычисляем среднее арифметическое показателя Х5, А = 4,418
После этого формируем матрицу для учеников с высоким осенним СБ и вычисляем среднее арифметическое M, отклонения D, квадраты отклонений D 2, сумму квадратов отклонений SS, дисперсию δ2, стандартное отклонение SD и ошибку среднего m.
Затем определяем t-критерий Стьюдента и сравниваем его с табличным.
Номер учащихся с хорошими знаниями | СБ осенний | D | D2 |
2 | 4,6 | –0,022 | 0,0005 |
3 | 4,7 | 0,078 | 0,0060 |
4 | 4,2 | –0,422 | 0,1783 |
5 | 5,0 | 0,378 | 0,1427 |
6 | 3,7 | –0,922 | 0,8505 |
10 | 4,9 | 0,278 | 0,0772 |
11 | 5,0 | 0,378 | 0,1427 |
13 | 4,6 | –0,022 | 0,0005 |
16 | 4,9 | 0,278 | 0,0772 |
| М = 4,622 | Σ D = 0,000 | SS = 1,4756 |
n = 9 |
|
| δ2 = 0,1844 |
df = 8 |
|
| SD = 0,4295 |
|
|
| m = 0,1432 |
.
Обращаясь к табл. П 3.4 и имея df = 8, а уровень значимости p = 0,05, мы получаем критическое значение 2,306, которое выше рассчитанного нами.
Вывод. Средние баллы тех, кто занимается лучше, статистически значимо не отличаются от СБ всей выборки (от ожидаемого среднего значения).
´Задача 2.21 (вариант с независимыми выборками). Имеют ли учащиеся с высоким уровнем знаний более высокие осенние СБ, чем учащиеся, которые занимаются хуже? Для решения задачи необходимо сформировать матрицы для учеников с высоким осенним СБ и для учеников с низким осенним СБ, затем вычислить для каждой из выборок среднее арифметическое M, отклонения D, квадраты отклонений D 2, сумму квадратов отклонений SS, дисперсию δ2, стандартное отклонение SD и ошибку среднего m. После чего определить t-крите-рий Стьюдента и сравнить его с табличным. Матрицу для учеников с высоким осенним СБ мы уже обработали в примере выше, осталось повторить аналогичные вычисления для матрицы для учеников с низким осенним СБ.
Номер учащихся со слабыми знаниями | СБ осенний | D | D2 |
1 | 3,9 | –0,375 | 0,1406 |
7 | 3,7 | –0,475 | 0,2256 |
8 | 4,4 | 0,225 | 0,0506 |
9 | 4,6 | 0,425 | 0,1806 |
12 | 4,0 | –0,175 | 0,0306 |
14 | 4,2 | 0,025 | 0,0006 |
15 | 4,0 | –0,175 | 0,0306 |
17 | 4,7 | 0,525 | 0,2756 |
n = 9 | М = 4,175 | Σ D = 0,000 | SS = 0,9350 |
df = 8 |
|
| δ2 = 0,1336 |
|
|
| SD = 0,3655 |
df = 9 + 8 – 2 = 15 |
|
| m = 0,1292 |
По формуле для вычисления примерного критерия t-Стьюдента для независимых выборок получаем:
.
По формуле для вычисления точного критерия t-Стьюдента для независимых выборок разных объемов получаем
Обращаясь к табл. П 3.4 и имея df = 15, а уровень значимости р = 0,05, мы выбираем критическое значение 2,131. Полученная нами величина t = 2,317 превышает 2,131 и может считаться статистически значимой на уровне 0,05. Поэтому мы заключаем, что средние баллы тех, кто занимается лучше, статистически значимо отличаются от СБ тех, кто занимается хуже.
´Задача 2.22 (вариант с зависимыми выборками). Отличается ли весенний СБ от осеннего СБ у учащихся с высоким уровнем знаний?
X9 | X5 | X6 |
|
|
Номер учащихся с хорошими знаниями | Осенний СБ | Осенний СБ | D = X5 – X6 | D 2 |
2 | 4,6 | 4,0 | 0,600 | 0,360 |
3 | 4,7 | 5,0 | –0,300 | 0,090 |
4 | 4,2 | 4,0 | 0,200 | 0,040 |
5 | 5,0 | 4,9 | 0,100 | 0,010 |
6 | 3,7 | 3,9 | –0,200 | 0,040 |
10 | 4,9 | 5,0 | –0,100 | 0,010 |
11 | 5,0 | 5,0 | 0,000 | 0,000 |
13 | 4,6 | 3,7 | 0,900 | 0,810 |
16 | 4,9 | 4,8 | 0,100 | 0,010 |
|
|
| М d = 0,144 | SS = 1,370 |
n = 9 |
|
|
| δ2 = 0,171 |
df = 8 |
|
|
| SD = 0,414 |
|
|
|
| m = 0,138 |
.
Обращаясь к табл. П 3.4 и имея df = 8, а уровень значимости 0,05, выбираем критическое значение 2,306. Подсчитанная нами величина t = 1,047 не превышает 2,306 и не может считаться статистически значимой на уровне 0,05.
Вывод. Между весенними и осенними СБ отсутствуют статистически значимые различия.
´Задача 2.23 (дополнительный пример). Какая методика эффективнее для развития параметра А (кистевая динамометрия) путем вычисления уровня статистической достоверности различия между двумя средними по t-критерию Стьюдента на уровне значимости p < 0,05. Перед проведением эксперимента были сформированы две группы – контрольная и экспериментальная – по 12 испытуемых, которые прошли тест по параметру А.
КГ 68 65 71 69 64 62 62 67 59 61 65 64
ЭГ 67 68 72 65 67 61 64 61 62 69 60 65
По соответствующим формулам вычисляем степень свободы df и t-критерий для независимых выборок. Значения заносим в соответствующие ячейки таблицы:
До эксперимента | dfзавис=11 tзавистаб =2,201 | После эксперимента | |
Контрольная группа | t11- 12 = 2,259 | ||
dfНЕзавис = 22 tНЕзавистаб =2,074 | t11- 21 = 0,227 | t12-22= 2,304 | |
Экспериментальная группа | t21-2 2 = 2,828 |
Выполняем расчеты, как это показано в таблице ниже (например, в программе MS Excel).
Обращаясь к табл. П 3.4 и имея df = 22 для независимых выборок, а уровень значимости 0,05, выбираем критическое значение 2,074. Рассчитанное в примере t 11-21 = 0,227 меньше табличного, поэтому: тесты по параметру А, выполненные перед проведением эксперимента, показали, что статистически достоверных различий между группами КГ и ЭГ по параметру А нет.
Вывод. В таких условиях МОЖНО начинать проводить эксперимент.
В течение двух недель испытуемые КГ тренировались по методике F, а экспериментальной – по методике G. Затем было проведено повторное тестирование параметра А:
КГ 72 68 71 69 67 64 63 67 61 62 64 65
ЭГ 69 70 74 72 69 65 68 70 64 72 68 68
По соответствующим формулам вычисляем степень свободы df и t-критерий для зависимых выборок.
Подсчитанные нами величины t указывают, что после 2 недель тренировок в обеих группах произошли статистически достоверные изменения. Статистически достоверно (t 12-22 = 2,304) стали различаться и данные КГ и ЭГ, а показатель экспериментальной группы t 21-22 = 2,828 больше показателя контрольной группы t 11-12 = 2,259.
Обращаясь к табл. П 3.4 и имея df = 22 для независимых и df = 22 для зависимых выборок, а уровень значимости 0,05, выбираем критические значения – соответственно 2,074 для независимых и 2,201 для зависимых выборок.
Вывод. Методика G экспериментальной группы оказалась более эффективной, чем методика F, которая применялась для развития параметра А в контрольной группе.
КГ | A1 | D | D 2 | A2 | D | D 2 | Dзавис | D 2 | ||
1 | 68 | 3,3 | 10,6 |
| 72 | 5,9 | 35,0 |
| –4 | 16 |
2 | 65 | 0,3 | 0,1 |
| 68 | 1,9 | 3,7 |
| –3 | 9 |
3 | 71 | 6,3 | 39,1 |
| 71 | 4,9 | 24,2 |
| 0 | 0 |
4 | 69 | 4,3 | 18,1 |
| 69 | 2,9 | 8,5 |
| 0 | 0 |
5 | 64 | –0,8 | 0,6 |
| 67 | 0,9 | 0,8 |
| –3 | 9 |
6 | 62 | –2,8 | 7,6 |
| 64 | –2,1 | 4,3 |
| –2 | 4 |
7 | 62 | –2,8 | 7,6 |
| 63 | –3,1 | 9,5 |
| –1 | 1 |
8 | 67 | 2,3 | 5,1 |
| 67 | 0,9 | 0,8 |
| 0 | 0 |
9 | 59 | –5,8 | 33,1 |
| 61 | –5,1 | 25,8 |
| –2 | 4 |
10 | 61 | –3,8 | 14,1 |
| 62 | –4,1 | 16,7 |
| –1 | 1 |
11 | 65 | 0,3 | 0,1 |
| 64 | –2,1 | 4,3 |
| 1 | 1 |
12 | 64 | –0,8 | 0,6 |
| 65 | –1,1 | 1,2 |
| –1 | 1 |
| М = 64,8 | 0,0 | SS = 136,3 |
| М = 66,1 | 0,0 | SS = 134,9 |
| М = –1,3 | SS = 46 |
|
|
| δ2 = 12,4 |
|
|
| δ2 =12,3 |
|
| δ2 = 4,2 |
|
|
| m = 1,0
|
|
|
| m = 1,0 |
|
| m = 0,6 |
ЭГ | A1 | D | D2 | A2 | D | D2 | Dзавис | D2 | ||
13 | 67 | 1,9 | 3,7 |
| 69 | –0,1 | 0,0 |
| –2 | 4 |
14 | 68 | 2,9 | 8,5 |
| 70 | 0,9 | 0,8 |
| –2 | 4 |
15 | 72 | 6,9 | 47,8 |
| 74 | 4,9 | 24,2 |
| –2 | 4 |
16 | 65 | –0,1 | 0,0 |
| 72 | 2,9 | 8,5 |
| –7 | 49 |
17 | 67 | 1,9 | 3,7 |
| 69 | –0,1 | 0,0 |
| –2 | 4 |
18 | 61 | –4,1 | 16,7 |
| 65 | –4,1 | 16,7 |
| –4 | 16 |
19 | 64 | –1,1 | 1,2 |
| 68 | –1,1 | 1,2 |
| –4 | 16 |
20 | 61 | –4,1 | 16,7 |
| 70 | 0,9 | 0,8 |
| –9 | 81 |
21 | 62 | –3,1 | 9,5 |
| 64 | –5,1 | 25,8 |
| –2 | 4 |
22 | 69 | 3,9 | 15,3 |
| 72 | 2,9 | 8,5 |
| –3 | 9 |
23 | 60 | –5,1 | 25,8 |
| 68 | –1,1 | 1,2 |
| –8 | 64 |
24 | 65 | –0,1 | 0,0 |
| 68 | –1,1 | 1,2 |
| –3 | 9 |
| М = 65,1 | 0,0 | SS = 148,9 |
| М = 69,1 | 0,0 | SS = 88,9 |
| М = –4,0 | SS = 264 |
|
|
| δ2 =13,5 |
|
|
| δ2 = 8,1 |
|
| δ2 = 24,0 |
|
|
| m = 1,1 |
|
|
| m = 0,8 |
|
| m = 1,4 |
Дисперсионный анализ
Дисперсионный анализ (ANOVA) является одним из наиболее полезных и универсальных статистических методов, применяемых в психологии в настоящее время. Его можно использовать в экспериментах с межгрупповыми (bg) и внутригрупповыми (wg) планами и в экспериментах, которые имеют несколько уровней категориальной независимой переменной, но только одну количественную зависимую переменную. Дисперсионный анализ основан на F-распределении. Основные формулы для подсчета F приведены в таблице.
Формулы | Сумма квадратов | Число степеней свободы | Средние квадраты |
Общая Total | ![]() | dftotal = N – 1 | |
Межгрупповая Between Group | ![]() | dfbg = k – 1 | ![]() |
Внутригрупповая Within Group | ![]() | dfwg= = dftotal – dfbg = = N – k | ![]() |
Коэффициент детерминации | ![]() | F-отношение Фишера | ![]() |
´Задача 2.24. Зависит ли количество отработанных часов Х7 от уровня удовлетворенности учебой Х8? Для проведения этого анализа нам потребуется данные Х7 всех испытуемых (n=17) расположить в 3 группы (k=3), каждая из которых будет соответствовать определенному уровню удовлетворенности учебой X8.
Вначале вычисляем общее средние арифметические M total = 24 и групповые M group 1 = 25, M group 2 = 24, M group 3 . = 22.
Затем вычисляем отклонения D от M total и квадраты отклонений D2.
Вычисляем общую сумму квадратов отклонений SS total=1776.
По формуле вычисляем межгрупповую (Between Group) сумму квадратов отклонений
.
Вычисляем внутригрупповую (Within Group) сумму квадратов отклонений
.
Определяем степени свободы: dfbg = k – 1 = 3 – 1 = 2; dftotal = N – 1 = 16;
dfwg = dftotal – dfbg = 16 – 2 = N – k = 17 – 3 = 14.
Теперь вычисляем межгрупповой (Between Group) средний квадрат:
.
И внутригрупповой (Within Group) средний квадрат: .
X 8 | X 7 | D | D 2 | M group |
1 | 38 | 14 | 209 |
|
1 | 30 | 6 | 42 |
|
1 | 10 | –14 | 184 |
|
1 | 30 | 6 | 42 |
|
1 | 30 | 6 | 42 |
|
1 | 10 | –14 | 184 | 25 |
2 | 15 | -9 | 73 |
|
2 | 10 | –14 | 184 |
|
2 | 30 | 6 | 42 |
|
2 | 30 | 6 | 42 |
|
2 | 35 | 11 | 131 | 24 |
3 | 12 | –12 | 134 |
|
3 | 35 | 11 | 131 |
|
3 | 20 | –4 | 13 |
|
3 | 20 | –4 | 13 |
|
3 | 35 | 11 | 131 |
|
3 | 10 | –14 | 184 | 22 |
| M total = 24 |
| SS total = 1776 |
|
|
|
| SS bg = 23 |
|
|
|
| SS wg = 17 53 |
|
|
|
| R 2 = 0,01 |
|
|
|
|
|
|
|
|
| d f bg = 2 |
|
|
|
| df wg = 14 |
|
|
|
|
|
|
|
|
| MS bg= 11 |
|
|
|
| MS wg= 125 |
|
|
|
| F = 0, 091 |
|
| p = 0,05 |
| FT= 3,316 |
Наконец, вычисляем критерий Фишера
.
После того как рассчитана величина F , необходимо обратиться к табл. П 3.5, в которой величины даны парами, где верхнее число соответствует критическому значению на уровне 0,05, а нижнее – критическому значению на уровне 0,01. Столбцы расположены в соответствии со степенями свободы между группами ( df bg ), а строки – в соответствии со степенями свободы внутри групп ( df wg ). Чтобы получить критическое значение для нашего анализа, двигайтесь вниз по столбцу для df bg = 2, пока не достигнете строки, соответствующей df wg = 14. Перед нами две величины, 3,74 и 6,51, Поскольку полученная нами величина F (0,091) не превышает 3,74, делаем вывод, что наши результаты статистически незначимы, т. е. между количеством отработанных часов и уровнем удовлетворенности учебой нет никакой связи.