Коэффициент корреляции

Смысл корреляции. По существу, коэффициент корреляции (г) выражает степень соответствия или связи между двумя множествами показателей. Например, если ис-пытуемый„получивший высший показатель по переменной 1, получает высший показатель и по переменной 2, а испытуемый, получивший второй лучший показатель по переменной 1, получает такой же показатель по переменной 2 и т. д. до самого низшего

1 Этот подход к надежности показателей иногда называли теорией надежности как обобщаемое™ (см. Brennan, 1994; Crick & Brennan, 1982; Cronbach, Gleser, Nanda, & Rajaratnam, 1972; Feldt, & Brennan, 1989; Shavelson & Webb, 1991). Однако это название недостаточно специфично для дифференциального термина, так как понятие обобщаемое™ применимо ко всем аспектам тестовых показателей, да и, фактически, ко всем научным данным. Более точная характеристика этого метода определения надежности основана на его способности идентифицировать компоненты дисперсии как релевантные или нерелевантные.

Глава 4. Надежность

105

Рис. 4—1. Двумерное распределение для гипотетической корреляции (+ 1)

показателя в группе, то имеет место прямолинейная корреляция между переменными 1 и 2. Величина корреляции составляет в этом случае + 1,0.

Рис. 4-1 иллюстрирует гипотетический случай прямолинейной положительной корреляции. На рисунке представлена диаграмма рассеяния, или двумерное распределение. Каждая палочка на этой диаграмме отмечает показатель испытуемого как по переменной 1 (горизонтальная ось), так и по переменной 2 (вертикальная ось). Нетрудно заметить, что все 100 случаев в данной группе распределились вдоль диагонали, идущей из левого нижнего угла в правый верхний угол диаграммы. Такое распределение означает прямолинейную положительную корреляцию (+ 1,00), поскольку из него видно, что относительное положение каждого испытуемого по обеим переменным одинаково. На практике, чем ближе двумерное распределение показателей к этой Диагонали, тем выше положительная корреляция между ними.

На рис. 4-2 изображена прямолинейная отрицательная корреляция (— 1,00). В этом случае имеет место полная инверсия показателей по двум переменным: лучший индивидуальный результат по переменной 1 соответствует худшему по переменной 2, и наоборот, причем это обратное соотношение показателей сохраняется неизменным на всем распределении. Из диаграммы рассеяния видно, что все испытуемые Распределяются по диагонали, идущей из левого верхнего в правый нижний угол.

Нулевая корреляция указывает на полное отсутствие связи. Если положение каждого испытуемого относительно переменной 1 определить методом вытаскивания бумажек с именами из шляпы, а затем ту же процедуру повторить для переменной 2, то в Итоге мы и получим нулевую или близкую к нулю корреляцию. При этих условиях, Зная результат индивидуума по переменной 1, невозможно предсказать его относи-

106 Часть 2. Технические и методологические принципы

Рис. 4—2. Двумерное распределение для гипотетической корреляции (- 1)

тельное положение на переменной 2. Испытуемый, имеющий высший показатель по переменной 1, мог бы получить высокий, средний или низкий показатель по неременной 2. Одни испытуемые могут случайно оказаться выше или ниже среднего показателя по обеим переменным, другие будут выше среднего по одной переменной и ниже среднего по другой, иными словами, не будет никакой закономерности в связи показателей при переходе от одного человека к другому.

Вычисляемые по реальным данным коэффициенты корреляции попадают между граничными значениями (- 1 и + 1) и обычно отличаются от нуля, но практически всегда оказываются меньше единицы (по абсолютному значению). Корреляция между показателями способностей почти всегда положительна, хотя часто невысока. Когда между двумя такими переменными обнаруживается отрицательная корреляция, обычно это результат того, каким способом выражались показатели по этим переменным. Например, если временные показатели коррелировать с показателями суммарной результативности, то результатом, скорее всего, будет отрицательная корреляция. Так, если показатель каждого испытуемого по тесту арифметических вычислений выражается количеством минут, затраченных на выполнение всех заданий, тогда как показатель по тесту арифметических рассуждений представлен числом правильно решенных задач, то можно ожидать появления отрицательной корреляции между этими показателями. В данном случае наименее успевающий (работающий медленнее всех) испытуемый получит численно самый высокий показатель по первому тесту, в то время как по второму тесту самый высокий показатель будет у наиболее успевающего, т. е. решившего больше всего задач, испытуемого.

Глава 4. Надежность

10

Коэффициенты корреляции можно вычислять разными способами, в зависимости от природы данных. Наибольшее распространение получил коэффициент корреляции произведения моментов Пирсона. Этот коэффициент учитывает не только положение индивидуума в группе, но и степень его отклонения в ту или иную сторону от среднего уровня группы. Напомним, что когда положение каждого индивидуума выражается в единицах стандартных показателей, те, кто занимает положение выше среднего, получают положительные стандартные показатели, а те, кто находится ниже среднего уровня, — отрицательные. Таким образом, испытуемый, превосходящий группу по уровню обеих коррелируемых неременных, будет иметь два положительных стандартных показателя, а испытуемый, отстающий от группы по уровню этих переменных, — два отрицательных. Если теперь перемножить стандартные показатели каждого из этих испытуемых по обеим переменным, то оба произведения будут положительны. Пирсоновский коэффициент корреляции есть просто среднее арифметическое всех таких произведений. Его числовое значение бывает высоким и положительным, когда соответствующие стандартные показатели имеют по обеим переменным одинаковые знаки и приблизительно равную величину. Когда испытуемых занимают положение выше среднего по одной неременной, но ниже среднего по другой, то соответствующие произведения будут отрицательны. А если сумма произведений отрицательна, то отрицательной будет и корреляция. Когда же одни произведения отрицательны, а другие положительны, корреляция будет близка к нулю.

На практике нет необходимости переводить каждый первичный показатель в стандартный перед нахождением их произведений, так как это преобразование можно выполнить разом для всех показателей после суммирования их попарных произведений. Существует много ускоренных методов вычисления коэффициента корреляции Пирсона. Метод, представленный в табл. 4-1, не самый быстрый, но зато он лучше других раскрывает смысл коэффициента корреляции. В табл. 4-1 показано вычисление г Пирсона между показателями по арифметическому тесту и тесту чтения у 10 детей. В двух столбцах справа от имен учеников приведены их показатели по первому ( X ) и второму (У) тесту. Суммы и средние арифметические 10 показателей приведены под соответствующими столбцами. В третьем столбце приведены отклонения (.г) каждого показателя по арифметическому тесту от среднего арифметического этих показателей, а в четвертом — отклонения (у) индивидуальных показателей по тесту чтения от их среднего арифметического. Квадраты этих отклонений даны в следующих двух столбцах таблицы, а суммы квадратов отклонений используются при вычислении стандартных отклонений показателей по обоим тестам с помощью метода, описанного в главе 3. Вместо того чтобы каждое х и у делить на соответствующее SD Для получения стандартных показателей, это деление выполняется только раз, в конце, как показано в формуле коэффициента корреляции в нижней части табл. 4-1. Попарные произведения (ху) в последнем столбце получены перемножением соответствующих отклонений в столбцах (х) и (у). Для вычисления корреляции (г) сумма этих попарных произведений делится на число случаев ( N ) и па произведение двух стандартных отклонений ( SDxSD ,,).

Статистическая значимость. Вычисленная в табл. 4-1 корреляция (г =0,40) указывает на умеренную положительную связь между показателями арифметического тес-га и теста чтения. То есть налицо некоторая тенденция, выражающаяся в том, что дети, хорошо показавшие себя в арифметическом тесте, также неплохо справляются с тес-

108

Часть 2. Технические и методологические принципы

Таблица 4-1 Вычисление коэффициента корреляции произведения моментов Пирсона

Ученик Арифметика Чтение          
  X Y X У X2 У2 ху
Билл 41 17 + 1 -4 1 16 -4
Кэрол 38 28 -2 + 7 4 49 -14
Джеффри 48 22 + 8 + 1 64 1 8
Энн 32 16 -8 -5 64 25 40
Боб 34 18 -6 -3 36 9 18
Джейн 36 15 -4 -6 16 36 24
Элен 41 24 + 1 + 3 1 9 3
РуТ 43 20 + 3 -1 9 1 -3
Дик 47 23 + 7 + 2 49 4 14
Мери 40 27 0 + 6 0 36 0
400 210 0 0 244 186 86
М 40 21          

том чтения, и наоборот. Если нас интересуют результаты только этих 10 детей, мы можем принять полученный коэффициент корреляции в качестве адекватной характеристики степени связи, существующей между двумя переменными в данной группе. В психологических исследованиях, однако, обычно стремятся распространить полученный на частной выборке испытуемых результат на более широкую совокупность, представленную этими испытуемыми. Например, мы могли бы задаться вопросом, существует ли связь между арифметическими навыками и навыками чтения у американских школьников того же возраста, что и наши испытуемые. Конечно, 10 исследованных случаев — совершенно недостаточная выборка из такой совокупности, ибо на другой сравнимой по размерам выборке можно было бы получить как гораздо более низкую, так и значительно более высокую корреляцию.

Существуют статистические методы оценки вероятных колебаний от одной выборки к другой коэффициентов корреляции, средних, стандартных отклонений и любых других групповых показателей. Вопрос, обычно задаваемый по поводу коэффициентов корреляции, еще проще: отличается ли выборочная корреляция существенно от нуля? Иными словами, если в генеральной совокупности корреляция равна нулю, то могла ли полученная на нашей выборке столь высокая корреляция появиться в результате одной только ошибки выборки? Когда говорят, что корреляция значима «на 1 %-номуровне» (или «науровне0,01»),тоимеютввиду следующее:существует всего лишь один шанс из ста, что в генеральной совокупности данный коэффициент равен нулю. Из чего можно сделать вывод, что между этими двумя переменными действительно имеет место корреляция. Уровни значимости указывают на приемлемую для исследователя степень риска совершить ошибку в выводах из полученных данных. Когда говорят, что корреляция значима на уровне 0,05, то вероятность ошиб-

Глава 4. Надежность

109

ки составляет уже пять шансов из ста. В большинстве психологических исследований применяются 1 и 5 %-ный уровни значимости, хотя при необходимости или желании можно пользоваться и другими уровнями значимости.

Вычисленная в табл. 4-1 корреляция, равная 0,40, незначима даже на уровне 0,05, что вполне ожидаемо, поскольку по 10 случаям трудно вывести общую закономерность, касающуюся связи между переменными. Для выборки такого объема самая малая корреляция, значимая на уровне 0,05, равна 0,63. Любая корреляция ниже этой величины оставляет без ответа вопрос о том, коррелируют ли эти две переменные в совокупности, из которой была извлечена выборка. Минимальные значимые (на 1 и 5 %-ном уровнях) коэффициенты корреляции для выборок разного объема можно определить по справочным таблицам значимости коэффициентов корреляции, имеющимся в любом приличном учебнике статистики. Однако для понимания проблематики этой книги требуется лишь общее представление об основных статистических понятиях.

В течение многих лет уровни значимости были традиционным средством оценивания корреляций. Тем не менее сейчас все больше сознаются недостатки этого подхода и его несоответствие потребностям исследователей. Доказательство того, что коэффициент надежности (или любая корреляция) значимо отличается от нуля, мало что дает как для теории, так и для практики. Даже высокая корреляция, когда она получена на малой выборке, не удовлетворяет «критерию значимости». Приходящий на смену уровням значимости и завоевывающий все большее признание подход учитывает фактическую величину полученной корреляции и оценивает границы доверительного интервала, в который — на выбранном уровне доверительной вероятности — попадает значение генерального коэффициента корреляции (см., например, Carver, 1993; J. Cohen, 1994; Hunter, & Schmidt, 1990; Olkin, & Finn, 1995; Schmidt, 1996; W. W. Tryon, 1996). Это смещение интереса к доверительным интервалам как дополнению, если не замене проверки значимости, предвещает важный сдвиг в анализе коэффициентов корреляции в ближайшие годы.

Коэффициент надежности. Коэффициенты корреляции широко применяются в анализе психометрических данных. Одно из применений таких коэффициентов — это измерение надежности теста. Пример коэффициента надежности, вычисленного пир-соновским методом произведения моментов, приведен на рис. 4-3. В этом случае рассчитывалась корреляция между показателями 104 человек по двум эквивалентным формам теста «беглость речи».' В обоих случаях испытуемым давалось пять минут, в течение которых они должны были написать как можно больше слов, начинающихся на заданную букву. Формы теста отличались друг от друга лишь задаваемой буквой. Авторы теста подобрали начальные буквы с таким расчетом, чтобы трудность заданий была примерно одинаковой.

Корреляция между числом слов, написанных в ходе выполнения каждой из двух форм данного теста, оказалась равной 0,72, т. е. довольно высокой и значимой на уровне 0,01. При объеме выборки N= 104 любая корреляция от 0,25 и выше является значимой на этом уровне. И все же полученная корреляция несколько ниже, чем это Желательно для коэффициентов надежности, обычно превышающих 0,80 и даже 0,90.

Одного из субтестов Тестов первичных умственных способностей для возраста 11-17 лет, разработанных SRA . Данные получены в исследовании Анастази и Дрейка (Anastasi & Drake, 1954).

no

Часть 2. Технические и методологические принципы

Показатели по тесту «беглость речи» (форма 1)