Факторный анализ интеллекта
Психологические исследования, цель которых — идентификация психических черт, выросли из интереса ученых к природе и структуре человеческого интеллекта.1 Такие исследования начинаются с вычисления интеркорреляций показателей, полученных на выборке испытуемых по широкому набору тестов способностей. Затем корреляционная матрица подвергается дальнейшему математическому анализу с целью выявления общих факторов или черт на множестве тестов. Имеющиеся для достижения этой цели разнообразные методы объединены под общим названием факторного анализа.
Факторная матрица. Основная цель факторного анализа (ФА) — упростить описание данных посредством сокращения числа необходимых переменных или, иначе говоря, сократить размерность пространства описания данных. Так, если установлено, что пяти факторов достаточно для объяснения всей общей дисперсии в батарее из 20 тестов, то в большинстве случаев исходные 20 показателей без существенной потери информации можно заменить пятью новыми показателями. На практике обычно из совокупности исходных тестов сохраняют те, которые дают лучшие меры каждого из факторов.
Факторный анализ, независимо от используемых методов, начинается с обработки таблицы интеркорреляций, полученных на множестве тестов, известной как корреляционная матрица, а заканчивается получением факторной матрицы, т. е. таблицы, показывающей вес или нагрузку каждого из факторов по каждому тесту. Табл. 11-1 Представляет собой гипотетическую факторную матрицу, включающую всего два фак-
История этого вопроса затрагивается в Anastasi (1984b).
334
Часть 3. Тестирование способностей
Таблица ll-i Гипотетическая факторная матрица I
Тест | Фактор I | Фактор II |
1, Словарный | 0,74 | 0,54 |
2. Аналогии | 0,64 | 0,39 |
3. Завершение предложений | 0,68 | 0,43 |
4. Восстановление порядка слов в предложении | 0,32 | 0,23 |
5. Понимание прочитанного | 0,70 | 0,50 |
6 Сложение | 0,22 | -0,51 |
7. Умножение | 0,40 | -0,50 |
8. Арифметические задачи | 0,52 | -0,48 |
9. Составление уравнений | 0,43 | -0,37 |
10. Завершение числовых рядов | 0,32 | -0,25 |
тора. Факторы перечисляются в верхней строке таблицы от более значимого к менее значимому, а их веса в каждом из 10 тестов даны в соответствующих столбцах.
Разработано несколько различных методов разложения множества переменных на общие факторы. Еще в начале века Карл Пирсон (Pearson, 1901) показал способ решения задачи такого типа, а Чарльз Спирмен (С. Spearman, 1904,1927) заложил основы современного факторного анализа. Т. Келли (Т. L. Kelly, 1935) и Л. Тёрстоун (L. L. Thur-stone, 1947) в Америке и С. Берт (С. Burt, 1941) в Англии много сделали для усовершенствования этого метода. Альтернативные методы, модификации и усовершенствования ФА разрабатывались многими авторами. Наличие быстродействующих вычислительных машин ведет к принятию более тонких и, соответственно, трудоемких методов ФА. Несмотря на разницу в исходных постулатах, большинство этих методов дает сходные результаты. Для детального знакомства с методами ФА читатель может обратиться к учебникам Comrey, & Lee (1992) или Loehlin (1992). Краткий и простой обзор основных понятий и методов ФА можно найти в книгах Kim, & Mueller (1978a, 1978 b) и P. Kline (1993).
Рассмотрение математических основ или вычислительных процедур ФА не входит в задачи этой книги. К счастью, для понимания результатов ФА не обязательно владеть его специальной методологией. Даже без знания того, как были вычислены факторные нагрузки, можно понять, каким образом следует использовать факторную матрицу для идентификации и интерпретации факторов. Тем не менее, чтобы с пользой читать публикации, посвященные факторно-аналитическим исследованиям, знакомство с некоторыми понятиями и терминами ФА не помешает.
Оси координат. Принято представлять факторы геометрически в виде осей координат, относительно которых каждый тест может быть изображен в виде точки. Рис-11-1 поясняет эту процедуру. На этом графике каждый из 10 тестов, приведенных в табл. 11-1, отображен в виде точки относительно двух факторов, которые соответствуют осям I и И. Так, тест 1 представлен точкой с координатами 0,74 по оси I и 0,54 по оси II. Точки, представляющие остальные 9 тестов, построены аналогичным способом, с использованием значений весов из табл. 10-1. Все эеса по фактору I положи-
Глава 11. Природа интеллекта
335
Рис. 11-1. Гипотетическое факторное отображение, показывающее веса двух групповых факторов по каждому из 10 тестов
тельны, веса по фактору II как положительны, так и отрицательны, что также отражено на рис. 11-1, где тесты с 1-го по 5-го образуют кластер в одной части координатной плоскости, а тесты с 6-го по 10-го — в другой.
В этой связи следует заметить, что положение осей координат не фиксировано данными. Исходная таблица корреляций определяет лишь положение тестов (т. е. точек на рис. 11-1) относительно друг друга. Те же точки можно нанести на плоскость с любым положением координатных осей. По этой причине при проведении факторного анализа обычно вращают оси до тех пор, пока не получают наиболее приемлемого и легко интерпретируемого отображения. Эта процедура вполне обоснованна и в чем-то похожа на измерение долготы, скажем, не от гринвичского меридиана, а от проходящего через Чикаго.
На рис. 11-1 полученные после вращения оси I' и II' показаны пунктирными линиями1. Это вращение выполнено в соответствии с предложенными Тёрстоуном критериями положительного многообразия и простой структуры. Первый предполагает вращение осей до положения, при котором исключаются все значимые отрицательные веса. Большинство психологов считают отрицательные факторные нагрузки логически несоответствующими тестам способностей, так как такая нагрузка означает, что чем выше оценка индивидуума по специфическому фактору, тем ниже будет его результат по соответствующему тесту. Критерий простой структуры, в сущности, означает, что каждый тест должен иметь нагрузки по как можно меньшему числу факто-
Читатель, вероятно, заметил, что полученную в результате вращения ось II следовало бы обозначить как -II, чтобы привести в соответствие с неповернутой осью -II. Однако какой из полюсов оси выбрать в качестве положительного или отрицательного, дело произвольное. В нашем примере полученная вращением ось II была «перевернута», с тем чтобы избавиться от отрицательных весов.
336
Часть 3. Тестирование способностей
Таблица Ц_2 Факторная матрица после вращения
Тест | Фактор Г | Фактор П' |
1. Словарный | 0,91 | -0,06 |
2. Аналогии | 0,75 | 0,02 |
3. Завершение предложений | 0,80 | 0,00 |
4. Восстановление порядка слов в | предложении 0,39 | -0,02 |
5. Понимание прочитанного | 0,86 | -0,04 |
6. Сложение | -0,09 | 0,55 |
7. Умножение | 0,07 | 0,64 |
8. Арифметические задачи | 0,18 | 0,68 |
9. Составление уравнений | 0,16 | 0,54 |
10. Завершение числовых рядов | 0,13 | 0,38 |
(По данным, представленным на рис. 11-1)
ров.1 Выполнение обоих критериев дает факторы, которые можно наиболее легко и однозначно интерпретировать. Если тест имеет высокую нагрузку по одному фактору и не имеет значимых нагрузок по другим факторам, мы можем кое-что узнать о природе этого фактора, изучив содержание данного теста. Напротив, если тест имеет средние или низкие нагрузки по шести факторам, то он мало что скажет нам о природе любого из них.
На рис. 11-1 хорошо видно, что после вращения осей координат все вербальные тесты (1-5) располагаются вдоль или очень близко к оси Г, а числовые тесты (6-10) тесно группируются вокруг оси II'. Новые факторные нагрузки, измеренные относительно повернутых осей, приведены в табл. 11-2. Читатель может легко проверить значения этих факторных нагрузок, изготовив из бумаги «масштабную линейку» со шкалой единиц, соответствующей масштабу координатных осей. С помощью этой линейки можно измерить длину отрезков, соответствующих проекциям точек (тестов) на повернутые оси координат. Факторные нагрузки в табл. 11-2 не имеют отрицательных значений, за исключением пренебрежимо малых величин, явно относимых к ошибкам выборки. Все вербальные тесты имеют высокие нагрузки по фактору I и практически нулевые — по фактору II'. Числовые тесты, напротив, имеют высокие нагрузки по фактору If и пренебрежимо низкие — по фактору Г. Таким образом, вращение координатных осей существенно упростило идентификацию и называние обоих факторов, а также описание факторного состава каждого теста. На практике число факторов часто оказывается больше двух, что, разумеется, усложняет их геометрическое представление и статистический анализ, но не изменяет существа рассмотренной процедуры.
Некоторые исследователи руководствуются теоретической моделью как принципом вращения осей. Кроме того, принимается в расчет неизменность, или подтверж-
1 Этот критерий требует, чтобы по некоторым факторам тесты имели нагрузки, значимо не отличающиеся от нуля. Такое требование можно теперь проверить эмпирически, используя доступные статистические процедуры для нахождения стандартной ошибки факторных нагрузок (Cudeck, & O'Delb 1994).
Глава 11. Природа интеллекта 337
дение одних и тех же факторов в независимо выполненных, но сравнимых исследованиях. В настоящее время факторный анализ все чаще используется в роли подтверждающего, чем исследовательского метода. Нередко его сочетают с моделированием структурными уравнениями (см. главу 5) для оценивания теоретически сформулированной модели вклада различных переменных в выполнение задачи (см., например, Loehlin, 1992).
Интерпретация факторов. Получив после процедуры вращения факторное решение (или, проще говоря, факторную матрицу), мы можем переходить к интерпретации и наименованию факторов. Этот этап работы скорее требует психологической интуиции, нежели статистической подготовки. Чтобы понять природу конкретного фактора, нам ничего не остается, как изучить тесты, имеющие высокие нагрузки по этому фактору, и попытаться обнаружить общие для них психологические процессы. Чем больше оказывается тестов с высокими нагрузками по данному фактору, тем легче раскрыть его природу. Из табл. 11-2, к примеру, сразу видно, что фактор Г вербальный, а фактор II' числовой.
Приведенные в табл. 11-2 факторные нагрузки отображают к тому же корреляцию каждого теста с фактором.1 Напомним, что эта корреляция есть не что иное, как факторная валидность теста (глава 5). По табл. 11-2 можно, к примеру, определить, что факторная валидность словарного теста как средства измерения вербального фактора равна 0,91. Факторная валидность теста на сложение относительно числового фактора равна 0,55. Очевидно, что первые 5 тестов имеют пренебрежимо малую валидность как средства измерения числового фактора, а последние 5 — практически нулевую валидность в качестве мер вербального фактора.
Факторная композиция теста. Одна из основных теорем ФА гласит: полная дисперсия теста равна сумме дисперсий, обусловленных действием общих (разделяемых с другими тестами) и специфических (встречающихся только в одном таком тесте) факторов, плюс дисперсия ошибок.
Мы уже сталкивались с дисперсией ошибок при анализе показателей тестов (глава 4). Если, к примеру, коэффициент надежности теста равен 0,83, то это значит, что 17 % дисперсии показателей по этому тесту составляет дисперсия ошибок (1,00 - 0,83 = 0,17). При помощи факторного анализа можно провести более тонкий анализ источников дисперсии, влияющих на выполнение того или иного теста.
Рассмотрим два гипотетических теста, информация о которых представлена в табл. 11 -3. В ней для каждого теста указаны его факторные нагрузки по Вербальному (V), Числовому (N) и Логическому (R) факторам, а также коэффициенты надежности этих тестов. Так как факторная нагрузка представляет собой еще и корреляцию между тестом и фактором, квадрат факторной нагрузки указывает нам долю общей Дисперсии между тестом и соответствующим фактором. Приведенные в правой части табл. 11-3 квадраты факторных нагрузок показывают пропорциональный вклад каждого фактора в полную дисперсию показателей теста. Так, в тесте на арифметическое Рассуждение 16 % дисперсии можно приписать вербальному, 30 % — числовому и 36 % —
Это справедливо только для случаев, когда применяется ортогональное вращение. При облическом (косоугольном) вращении, речь о котором пойдет в этом разделе позднее, факторные нагрузки и факторные корреляции связаны между собой простым отношением, позволяющим с помощью соответствующих вычислений легко получить одно из другого.
338
Часть 3. Тестирование способностей
Таблица Ц~з
Источники | дисперсии тестовых показателей | ||||||
Тест | Нагрузки общегс фактора V N | Коэффициент надежности R | Относительный вклад | ||||
V | N | R Специ- Ошиб-фический ка | |||||
1. Арифметическое рассуждение 2. Умножение | 0,40 0,10 | 0,55 0,70 | 0,60 0,90 0,30 0,85 | 0,16 0,01 | 0,30 0,49 | 0,36 0,09 | 0,08 0,10 0,26 0,15 |
логическому факторам. Дисперсия ошибок в последнем столбце определена простым вычитанием коэффициента надежности из полной дисперсии (1,00 - 0,90 = 0,10). Цифры слева, указанные рядом с дисперсиями ошибок, отражают специфичность каждого теста, т. е. долю его «истинной» дисперсии, не разделяемую ни с одним другим тестом, вместе с которыми данный тест подвергался факторному анализу. Для теста на арифметическое рассуждение мы получаем следующие величины:
0,16 + 0,30 + 0,36 + 0,10 - 0,92 1,00-0,92 = 0,08
На рис. 11-2 структура полной дисперсии для двух тестов (в соответствии с данными табл. 11-3) представлена в графической форме.
Любой индивидуальный результат по этим двум тестам определяется величиной соответствующих способностей, или факторов, которыми обладает конкретный человек, а также относительными весами этих факторов в конкретном тесте. Поэтому если бы мы располагали чьими-то показателями по вербальному, числовому и логическому факторам, выраженными в одинаковых единицах измерения, то могли бы взвесить каждый показатель, умножая его на соответствующую факторную нагрузку. Сумма этих произведений дала бы нам оценку показателя данного человека по данному тесту. Чем меньше вклад специфического и случайного факторов в этот тест, тем точней будет наша оценка.
Согласно гипотетическим данным табл. 11-3, если конкретный человек имеет очень высокую оценку по Вербальному фактору (V), это гораздо больше поможет ему при выполнении теста на арифметическое рассуждение, чем теста на умножение. Фактически, содействие фактора Показалось бы в 4 раза сильнее в тесте на арифметическое рассуждение по сравнению с тестом на умножение, поскольку вес этого фактора в 4 раза больше в первом тесте, чем во втором (0,40 против 0,10). Из трех общих факторов Числовой фактор (Л7) имел бы наибольшее влияние в тесте на умножение (нагрузка = 0,70), а Логический фактор (/?) — в тесте на арифметическое рассуждение (нагрузка - 0,60).
Факторные нагрузки и корреляция. Вторая основная теорема ФА касается соотношения факторных нагрузок и корреляций между переменными. Корреляция меЖДУ любыми двумя переменными равняется сумме парных произведений их нагрузок по
Глава 11. Природа интеллекта
339
Рис. 11-2. Процентное соотношение общей дисперсии, специфической дисперсии и дисперсии ошибок в двух гипотетических тестах
(По данным табл. 11-3)
общим факторам. Так как специфический фактор и фактор ошибки каждой переменной уникальны, они не вносят никакого вклада в корреляцию между переменными. Корреляция между любыми двумя переменными зависит только от тех факторов, которые являются общими для этих двух переменных. Чем больше веса таких общих факторов в обеих переменных, тем выше будет между ними корреляция. Корреляцию между двумя тестами из табл. 11-3 можно найти перемножением нагрузок каждого из трех общих факторов по этим двум тестам и сложением полученных произведений:
r12= (0,40)(0,10) + (0,55)(0,70) + (0,60)(0,30) = 0,60.
Косоугольная система координат и факторы второго порядка. Изображенные на рис. 11-1 оси называются ортогональными, так как они строго перпендикулярны друг другу. Иногда кластеры тестов располагаются таким образом, что лучшего соответствия используемым критериям удается достичь при использовании облических, или косоугольных, осей. В таком случае уже сами факторы коррелируют друг с другом. Одни исследователи утверждали, что использование ортогональных, или некоррели-рующих, факторов всегда предпочтительнее, поскольку такие факторы дают более простую и четкую картину взаимосвязи черт. Другие настаивают на том, что косоугольную систему координат следует использовать всякий раз, когда она лучше соответствует изучаемым данным, поскольку большинство имеющих ясный физический смысл категорий и не должны быть независимыми. Очевидный пример — рост и вес. Хотя хорошо известно, что рост и вес высоко коррелируют между собой, они оказались весьма полезными категориями при оценке телосложения.
Когда факторы коррелируют между собой, существующие между ними интеркорреляции можно подвергнуть тому же статистическому анализу, который мы применяем к интеркорреляциям между тестами. Иными словами, у нас есть возможность «фак-торизовать факторы» и получить факторы второго порядка. Этот способ обработки Данных был использован в ряде исследований таких переменных, как способности и черты личности. В некоторых исследованиях с использованием тестов способностей был получен единственный общий фактор второго порядка. Как правило, американские исследователи, применяющие факторный анализ, начинают с объяснения как можно большей части общей дисперсии групповыми факторами и только затем выявляют
340
Часть 3- Тестирование способностей
общий фактор как фактор второго порядка, если данные подтверждают его наличие. У английских психологов, напротив, принято начинать с общего фактора, которому приписывается основная доля общей дисперсии, а затем возвращаться к групповым факторам для объяснения остаточной корреляции. Эта разница в методиках есть следствие теоретических различий, о которых речь пойдет в следующем разделе.