Изменение показателей тестов интеллекта на уровне популяции
Повышение показателей. Что происходит с результатами тестов интеллекта на уровне популяции в течение продолжительных периодов времени? С этим вопросом мы уже сталкивались в связи с рассмотрением нескольких проблем. В предыдущем
1 См., например, Bengtson, & Schaie (1989), Birren, &" Bengtson (1988), Birren, & Schaie (1991), Craik. & Salthouse (1992), Fiske, & Chiriboga (1990), Haplin, & Panek (1993), Kausler (1994), Nadien (1989). Sonderegger (1992), Schulz, & Ewen (1993), Willis, & Schaie (1986).
Глава 12. Психологические проблемы тестирования способностей 369
разделе было показано, что вместе с ростом образовательного уровня населения на протяжении нескольких десятилетий соответственно повышался и средний уровень выполнения интеллектуальных тестов. В результате, более старшие, но и менее образованные, в среднем, члены нормативной выборки, получали по тесту интеллекта показатели ниже, чем более молодые, но, в среднем, лучше образованные члены этой выборки. Аналогичный феномен обнаруживается при изучении выборки стандартизации тестов для детей. При рестандартизации шкал Стэнфорд—Бине и WISCрезультаты выполнения тестов в более поздних выборках стандартизации существенно лучше, чем в более ранних выборках. Как следствие, любой конкретный ребенок получил бы более низкий IQ при его тестировании с помощью пересмотренной шкалы, чем в случае применения старой шкалы, причем просто потому, что его результат оценивался бы относительно более высоких норм. К тому же более высокий уровень образования родителей тех детей, которые вошли в более позднюю выборку стандартизации, был одним из условий, упомянутых в связи с повышением оцениваемого тестами уровня интеллекта.
Этот тип сравнения можно определить как лонгитюдное изучение популяций. Обычное применение лонгитюдного метода в психологических исследованиях связано с повторным тестированием одних и тех же лиц на протяжении какого-то периода времени. Однако при лонгитюдном изучении популяций определенная популяция выборочно обследуется в различные периоды времени. В этом случае сравнение производится между когортами лиц, родившихся в разное время, но протестированных в одном возрасте.1 Несколько крупномасштабных исследований, поведенных в течение первых пяти десятилетий XX столетия, показали повышение интеллекта популяции в том виде, как он измеряется стандартизованными тестами интеллекта (Anastasi, 1985d, p. 126-130). При росте грамотности, повышении образовательного уровня и других культурных переменах не столь уж неожиданно было обнаружить, что средний уровень тестируемого интеллекта всего населения устойчиво повышался на протяжении нескольких десятилетий
В этих сравнительных исследованиях использовались разнообразные методы их организации. В одном случае один и тот же тест проводился через какой-то промежуток времени, как при обследовании 11-летних шотландских детей в 1932 и 1947 гг. (Scottish Council, 1949). В другом — репрезентативной выборке лиц давалось два теста с целью установить соответствие между двумя множествами показателей и таким образом обеспечить «перевод» результатов одного теста в результаты другого. Это было сделано при сравнении результатов тестирования солдат американской армии в период Первой и Второй мировых войн, которых обследовали с помощью Армейского альфа и Армейского общего классификационного тестов (Army General Classification Test) соответственно (Tuddenhaim, 1948). Третий, технически более совершенный, подход основан на создании абсолютной, независимой от выборки шкалы показателей посредством использования анкерных заданий, как было сделано при разработке тестов Совета колледжей. Применение теории «задание — ответ» (глава 7) представляет собой дальнейшее усовершенствование этого подхода.
1 Специальное приложение этого общего метода можно распознать в «сравнении с временной задержкой», включенном К. У. Шайи (К. W. Schaie, 1965) в его упоминавшийся выше когортно-последова-тельный план исследования.
370
Часть 3. Тестирование способностей
Понижение показателей. Будут ли показатели определенной популяции по тестам интеллекта со временем повышаться, понижаться или оставаться стабильными, зависит от многих условий. Охватываемый период времени, с сопутствующими ему культурными переменами, безусловно является главным фактором. Возраст обследуемых также имеет значение. Например, повышение образовательного уровня населения будет прямо сказываться на выполнении тестов взрослыми людьми и только косвенно — на показателях детей, так как дети в сравниваемых выборках получили на момент тестирования одинаковый объем образования. Еще одно важное условие, которое нужно учитывать, особенно при изучении специально отобранных субпопуляций, — это коэффициент отбора (degree of selection^ в разные периоды времени. К примеру, если в 1960 г. среднюю школу посещала большая доля населения, чем в 1910, как это и было в действительности, то ученики средней школы 1910 г. представляют собой выборку из генеральной совокупности, извлеченную на основе более высокого критерия, чем выборка учеников средней школы 1960 г. Видимые противоречия между повышением и понижением показателей могут быть обусловлены характером используемых тестов, спецификой тестируемых субпопуляций (например, ориентированные на поступление в колледж старшеклассники, все взрослое население, ученики начальной школы) или специфическими периодами времени, охватываемыми исследованием (например, Flynn, 1984,1987).
Количество и сложность условий, которые могут вызывать повышение или снижение интеллектуального уровня популяции, определяемого с помощью тестов, иллюстрируется анализом широко известного снижения показателей по Тесту академических способностей (SAT) Совета колледжей (Donlon, 1984, р. 188-191; Wirtz, 1977). В период между 1963 и 1977 гг. средний Вербальный показатель SAГ упал с 478 до 429, а средний Математический показатель SAГснизился с 502 до 470. Чтобы понять причины этого неуклонно продолжавшегося 14 лет спада, специально назначенная комиссия заказала 38 исследований специалистам в разных областях и рассмотрела внушительное множество причинных гипотез.
Главный вывод, к которому пришла комиссия, заключался в том, что характер причин изучаемого явления существенно различался в первой и второй половинах 14-летнего периода. На протяжении первых 7 лет снижение показателей происходило преимущественно в результате изменения состава сдающих SAT. Из-за непрерывного роста доли выпускников средней школы, намеревающихся поступить в колледж в течение этого периода, данная выборка становилась все менее отсортированной по когнитивным навыкам, измеряемым данным тестом. Однако во втором 7-летнем периоде популяция поступающих в колледж практически стабилизировалась, и теперь особенностями выборки объяснялась гораздо меньшая часть снижения показателей. Для этого периода объяснение пришлось искать главным образом в условиях, связанных с семьей, школой и обществом в целом. Комиссия отметила, что имеющиеся данные не позволяют определить относительный вклад различных культурных изменений в снижение показателей теста. Тем не менее среди многих факторов, называвшихся в числе возможных значимых условий такого снижения, были и такие, как недооценка значения учебных стандартов, инфляция школьных отметок и автоматический (без экзаменов) перевод в следующий класс, сведение к минимуму домашних заданий, рост числа прогулов школьных занятий, все меньшее уделение внимания овладению навыками и знаниями, чрезмерное увлечение просмотром телепередач, а
Глава 12. Психологические проблемы тестирования способностей
371
также социальные потрясения конкретного исторического периода, препятствующие должному вниманию к жизни школьников.1
Последующий анализ (Turnbull, 1985) дал возможность предположить, что снижение показателей SAT в течение второго 7-летнего периода было, отчасти, отсроченным и косвенным следствием изменений в составе поступавших в колледжи на протяжении первых 7 лет. Поскольку большая доля плохо подготовленных учеников оставалась в средней школе (и подавала заявления о приеме в колледж), многие изменения условий школьного обучения можно рассматривать как приспособительную реакцию школ на возросшую разнородность своих учащихся. Подобные реакции, ведущие к снижению уровня требований школьной программы, иллюстрируются инфляцией отметок, быстрым увеличением числа факультативных курсов по профессиональным и даже по общеобразовательным дисциплинам, упрощением учебников и сокращением домашних заданий. Таким образом изменения в популяции учащихся привели к изменениям учебных программ, что, в свою очередь, повлекло за собой снижение тестовых показателей. Эта гипотеза согласуется с данными о том, что высоких показателей стало меньше в 1970-х гг. Показатели учеников, занимающих высокое место в своем классе, продолжали снижаться, тогда как показатели учеников, занимающих последние места в списке класса, стабилизировались или даже повысились. Более того, в конце 1970-х и в течение 1980-х гг. произошел перелом в уровне требований школ к обучению, который отразился в росте показателей SAT.
Общий обзор. О методологических проблемах, встречающихся на пути тех, кто пытается оценить изменения популяции, ясно свидетельствует неудавшийся обзор публикаций, посвященных улучшению результатов интеллектуальных тестов у населения 14 стран (Flynn, 1987). Опубликованные данные оказались настолько противоречивыми, а их объяснения такими расплывчатыми, что склонили автора обзора не делать никаких выводов, за исключением того, что тесты интеллекта на самом деле измеряют все что угодно, только не интеллект! Попытки измерить изменения популяции пока носят поисковый характер, и оптимальный способ проведения таких измерений еще предстоит разработать. Прекрасное рассмотрение методических вопросов, связанных с измерением изменений популяции, можно найти в материалах конференции по этой теме (Collins, & Horn, 1991).
Пока же для правильного понимания результатов исследований повышения и снижения показателей тестов в популяциях требуется дополнительная информация нескольких видов. Во-первых, должны быть точно описаны проводимые тесты, с уделе-нием особого внимания тому, какие специфические процессы и какое содержание они охватывают (например, перцептивную скорость, память, вербальное понимание, пространственную ориентацию), и указаны источники получения их норм. Во-вторых, необходимо сообщать даты проведения первичного и всех последующих сеансов тестирования. В-третьих, должна приводиться релевантная информация о выборочно обследуемых популяциях, а также о любых изменениях отбора при повторном тестировании, таких, например, как потеря лиц с первоначально лучшими и худшими результатами в последующих выборках. В-четвертых, следует иметь доступ к информа-
Хотя наиболее полно исследовались причины снижения показателей SAT, аналогичный спад показателей был отмечен и в других тестах для абитуриентов, таких как тесты из программы ACT (American College Testing), а также на уровнях средней и начальной школы.
372
Часть 3. Тестирование способностей
ции о любых культурных изменениях, затрагивающих изучаемую популяцию; к ним можно отнести объем и характер образования, достижения в области средств связи и транспортных средств, могущие повлиять на межкультурные контакты, или любые другие события, затрагивающие течение жизни конкретных людей и могущие изменить степень или направление их интеллектуального прогресса.
Дополнительную путаницу, затрудняющую сравнительный обзор изменений в различных популяциях, может также вносить ошибочное, но, к сожалению, распространенное употребление термина «интеллект» (и особенно IQ), как если бы он означал единое, идентифицируемое свойство организма (см., например, Flynn, 1987). Если же вместо этого под интеллектом понимать объединение способностей, необходимое для эффективной деятельности и продвижения вперед в определенной среде (см. главу 11), тогда правильная интерпретация как индивидуальных показателей теста интеллекта, так и средних результатов популяций, обследованных в разное время и в разных местах, безусловно, требует знания важнейших условий, упоминавшихся выше. В настоящее время отмечается растущее признание технических проблем, встречающихся при измерении изменения популяции, а также многообразия методов оценки таких изменений в различных контекстах и с разными целями (см. особенно Gottman, 1995).
Культурное разнообразие
Применение тестов к представителям различных культур рассматривается под разными углами зрения в разных частях этой книги. В главе 18 затрагиваются социальные и этические аспекты такого тестирования, особенно в отношении групп меньшинств в составе более широкой национальной культуры. Технические проблемы, связанные с систематической ошибкой теста и систематической ошибкой задания, проанализированы соответственно в главах 6 и 7. А в главе 9 рассмотрены типичные тесты, первоначально предназначавшиеся для применения в самых разных культурах (так называемые «культурно-свободные тесты»). В этом разделе мы познакомим читателя с основными теоретическими вопросами о роли культуры в поведении, делая особый акцент на интерпретации и использовании показателей тестов интеллекта.
Область культурной психологии. В последние три десятилетия XX века наблюдался заметный рост исследований и публикаций по культурной психологии (Berman, 1990; Irvine, & Berry, 1988). Было даже проведено несколько международных конференций, посвященных почти целиком этой теме (см., например, Brislin, 1993; Cronbach, & Drenth, 1972; Manoleas, 1995). Эта область психологии рассматривает по существу поведенческие различия между группами, выросшими и функционирующими в объективно различимых культурных средах. Такие среды могут быть и узкими, как, например, квартал или деревня, и широкими, как страна или континент. Кроме того, некоторые широко определяемые культуры, такие как латиноамериканская, состоят из субкультур — мексиканской, кубинской, пуэрто-риканской, центрально- и южноамериканской, которые достаточно различаются для того, чтобы выделять их как таковые при необходимости понять индивидуальное поведение (см., например, Geisinger, 199Л Marin & Marin, 1991).