1 Природа и назначение психологических тестов
A. Anastasi, S. Urbina
PSYCHOLOGICAL
TESTING
PRENTICE HALL
А. Анастази, С. Урбина
ПСИХОЛОГИЧЕСКОЕ
ТЕСТИРОВАНИЕ
7-е международное издание
Москва • Санкт-Петербург ■ Нижний Новгород ■ Воронеж
Ростов-на-Дону • Екатеринбург • Самара
Киев • Харьков ■ Минск
2005
ББК 88.3в6 УДК 159.9.072 А64
Анастази А., Урбина С.
А64 Психологическое тестирование. — 7-е изд. — СПб.: Питер, 2005. — 688 с: ип. — (Серия «Мастера психологии»).
ISBN 5-272-00106-0
Классическая работа Анны Анастази «Психологическое тестирование» по праву считается «энциклопедией западной тестологии». При подготовке 7-го издания, выпущенного в США в 1997 году, текст книги был основательно переработан. Появилось несколько новых глав, написанных соавтором А. Анастази — С. Урби-ной. Содержательные изменения отражают новейшие тенденции развития психологического тестирования, в частности, возрастающее влияние компьютеризации как фактора интеграции психологической науки в целом и методов тестирования в частности. В новом издании уделено значительное внимание компьютеризированному адаптивному тестированию, метаанализу, моделированию структурными уравнениями, использованию доверительных интервалов, кросс-культурному тестированию, применению факторного анализа в разработке тестов личности и способностей и другим широко используемым и быстро развивающимся понятиям и процедурам, которые будут оказывать влияние на психометрическую практику в XXI веке.
ББК 88.3в6 УДК 159.9.072
Права на издание получены по соглашению с Prentice Hall.
Все права защищены. Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме
без письменного разрешения владельцев авторских прав.
©1997 by Prentice Hall ISBN 0-02-303085-2 (англ.) © Перевод на русский язык ЗАО Издательский дом «Питер», 2003
ISBN 5-272-00106-0 © Издание на русском языке, оформление ЗАО Издательский дом «Питер», 2005
СОДЕРЖАНИЕ
Предисловие к русскому изданию.....8
Предисловие....................................12
Часть 1. ФУНКЦИИ И ИСТОКИ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ..............................15
1. Природа и назначение
психологических тестов...........................16
Области применения и разновидности
тестов..............................................................16
Что такое психологический тест?..........18
Почему необходим контроль
за использованием психологических
тестов?............................................................24
Проведение тестирования..........................28
Характеристики тестирующего
и ситуационные переменные.................33
Тестирование глазами тестируемых......35
Влияние практического обучения
на выполнение тестов..............................39
Источники информации о тестах...........44
2. Исторические предпосылки современного тестирования..............48
Первые попытки классификации
и обучения умственно отсталых.............49
Первые психологи-экспериментаторы . 50
Вклад Френсиса Гальтона........................51
Джеймс Кэттелл и первые «умственные
тесты».............................................................52
А. Бине и появление тестов интеллекта 53
Групповое тестирование.............................54
Тестирование способностей......................56
Стандартизованные тесты достижений 58 Оценка личности..........................................60
Часть 2. ТЕХНИЧЕСКИЕ И МЕТОДОЛОГИЧЕСКИЕ ПРИНЦИПЫ........63
3. Нормы и смысловое значение тестовых показателей.......................64
Статистические понятия...........................65
Возрастные нормы.......................................71
Внутригрупповые нормы...........................75
Относительность норм...............................84
Компьютеры и интерпретация тестовых показателей...............................91
Интерпретация предметно-ориентированных тестов.........................93
Минимальные квалификационные требования и критические показатели.. 98
4. Надежность................................ЮЗ
Коэффициент корреляции......................104
Типы надежности.......................................НО
Надежность тестов скорости..................121
Зависимость коэффициентов
надежности от обследуемой
выборки.......................................................124
Стандартная ошибка измерения...........127
Оценка надежности в тестировании
владения предметом и критические
показатели..................................................131
5. Валидность: основные понятия ... 133
Развитие понятий валндности теста .. 133
Методы описания содержания..............135
Методы предсказания критерия............139
Методы идентификации конструкта .. 147 Общий обзор и интеграция понятий ... 158
6. Валидность: измерение
и интерпретация.............................162
Коэффициент валндности и ошибка
оценки...........................................................163
Валидность теста и теория принятия
решений........................................................166
Объединение данных различных
тестов............................................................179
Использование тестов для принятия
классификационных решений...........183
Статистический анализ
систематической ошибки теста........188
7. Анализ заданий...........................196
Трудность заданий....................................197
Различительная способность заданий ■•• 203
Теория «задание — ответ»........................211
Анализ заданий тестов скорости......217
Перекрестная валидизация.....................218
Дифференцированное
функционирование заданий.................221
Поисковые исследования
в области разработки заданий.........224
Часть 3. ТЕСТИРОВАНИЕ СПОСОБНОСТЕЙ ...........................227
8. Индивидуальные тесты ...............228
Шкала интеллекта Стэнфорд—Бине .. 229
Шкалы Векслера.........................................239
Шкалы Кауфмана......................................248
Дифференциальные шкалы
способностей..............................................252
Система когнитивной оценки Даса—
Наглиери.....................................................260
9. Тесты для специфических популяций......................................261
Тестирование младенцев
и дошкольников........................................262
Комплексная оценка лиц с задержкой
психического развития...........................274
Тестирование лиц с физическими
недостатками.............................................281
Мультикультурное тестирование.........289
10. Групповое тестирование.............300
Групповые тесты в сравнении с индивидуальными...............................301
Адаптивное тестирование и компьютеризованное проведение тестов............................................................304
Многоуровневые батареи........................307
Измерение множественных способностей..............................................317
11. Природа интеллекта..................324
Значение IQ,.................................................325
Наследуемость и изменчивость .........327
Мотивация и интеллект.........................330
Факторный анализ интеллекта..........333
Теории организации черт.......................340
Природа и развитие черт..........................348
12. Психологические проблемы тестирования способностей............353
Лонгитюдные исследования
интеллекта детей......................................353
Интеллект в раннем детстве...................357
Проблемы тестирования интеллекта взрослых......................................................361
Изменение показателей тестов интеллекта на уровне популяции......368
Культурное разнообразие.........................372
Часть 4. ТЕСТИРОВАНИЕ ЛИЧНОСТИ.....................................379
13. Стандартизованные самоотчеты как метод изучения личности.......... 380
Методики, основанные на отборе
релевантного содержания....................381
Привязка к эмпирическому критерию .. 382 Применение факторного анализа
при разработке тестов.............................396
Теория личности в разработке тестов ... 401 Аттитюды тестируемых
и систематическая ошибка
в ответах......................................................409
Черты, состояния, люди и ситуации ... 414 Современное состояние личностных
опросников..................................................421
14. Измерение интересов
и аттитюдов ...................................422
Инвентари интересов: текущее
состояние.....................................................423
Инвентарь интересов Стронга
(Strong Interest Inventory™- Sll).... 425 Инвентари интересов: общий обзор
и некоторые отличительные
признаки......................................................433
Некоторые важные тенденции.............440
Опросы мнений и шкалы аттитюдов.. 442 Локус контроля............................................446
15. Проективные методики.............449
Природа проективных методик..............449
Методики чернильных пятен.................450
Рисуночные методики...............................458
Вербальные методики..............................465
Автобиографические воспоминания... 467
Методики действия...................................469
Оценка проективных методик................473
16. Прочие методики психологической оценки................484
Средства определения стилей
и типов.........................................................484
Ситуационные тесты...............................492
Представления о себе и личные
конструкты.................................................496
Отчеты наблюдателей.............................505
Биографические сведения........................512
Часть 5. ОБЛАСТИ ПРИМЕНЕНИЯ ТЕСТИРОВАНИЯ............................515
17. Основные области применения тестов в наше время........................516
Тестирование в образовании...................516
Типы образовательных тестов.............524
Тестирование в сфере профессиональной деятельности.....535
Использование тестов в клинической психологии и психологическом консультировании....................................556
18. Этические и социальные
аспекты тестирования.....................583
Этические проблемы психологического тестирования и психологической оценки...........................................................585
Оценка квалификации пользователей и профессиональная компетентность.........................................586
Профессиональная ответственность
издателей тестов......................................588
Защита неприкосновенности
личной жизни............................................590
Конфиденциальность...............................592
Сообщение результатов теста.................594
Тестирование особых популяций.........595
ПРИЛОЖЕНИЕ А............................602
Алфавитный перечень тестов и других оценочных инструментов.... 602
ПРИЛОЖЕНИЕ Б............................607
Адреса издателей, распространителей и организаций, связанных с вопросами разработки и использования тестов.........................607
ЛИТЕРАТУРА...................................609
АЛФАВИТНО-ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ.....................................674
ПРЕДИСЛОВИЕ
К РУССКОМУ ИЗДАНИЮ
В 1982 г. издательство «Педагогика» выпустило русский перевод книги Анны Ана-стази «Психологическое тестирование», которую редакторы перевода — К. М. Гуре-вич и В. И. Лубовский — по праву назвали «энциклопедией западной тестологии». Выход книги такого масштаба — всегда событие, а если учесть время и место — событие, как модно сейчас говорить, знаковое, поскольку ее появление было тогда воспринято как снятие негласного табу на широкое использование тестов в практической работе психологов, дефектологов, педагогов и других специалистов. Хотя со времени принятия печально известного постановления ЦК ВКП(б) о педологических извращениях в системе наркомпросов прошло более 45 лет, в начале 1980-х гг. его последствия были еще весьма ощутимы в советской психологии и педагогике. Так или иначе, книга Анастази стала для многих из нас не только источником знаний, но и тем долгожданным глотком свободы, который партия и правительство расчетливо давали сделать советской интеллигенции, дабы она не деградировала в изоляции от остального мира.
С тех пор прошло почти 20 лет. Многое изменилось в нашем обществе, однако потребность в книгах такого уровня, к счастью, осталась прежней, а если говорить о психологах, то, возможно, даже возросла вместе со значительным увеличением их числа. Издание 1982 г. с тиражом в 15 000 экземпляров стало библиографической редкостью почти сразу после выхода в свет. И хотя к настоящему времени выпущенный издательством «Педагогика» знаменитый двухтомник Анастази явно устарел, он по-прежнему пользуется большой популярностью у студентов, аспирантов и практических работников, связанных с тестированием. Мне не совсем понятно, почему наши — теперь уже не следующие директивам партии — издательства не воспользовались столь благоприятной маркетинговой ситуацией и не предприняли попыток выпустить перевод более свежего издания Psychological Testing , которая разошлась бы моментально. Возможно, потому что последнее, шестое, издание книги Анастази вышло в 1988 г. и могло показаться нашим издателям в середине 1990-х гг. не совсем «свежим». Возможно, были и другие причины, — книги, в которых встречаются формулы и графики, не пользуются любовью издателей. Как бы то ни было, это шестое издание оказалось на данный момент последним изданием «Психологического тестирования» Анны Анастази, ибо вышедшее в 1997 г. седьмое издание книги с тем же названием представляет собой в корне переработанный вариант, уже в соавторстве с Сюзаной Урбиной, и является, по существу, новой книгой. Именно этот вариант издательство «Питер» предложило мне для перевода.
Эта новая книга отличается от предыдущих изданий авторского учебника Анны Анастази в нескольких важных отношениях. Самые заметные перемены связаны с уменьшением объема. При незначительном изменении структуры глав, книга стала гораздо компактнее — теперь это один том, хотя и весьма солидный. Сокращению подверглись, в основном, подробности, касающиеся построения конкретных тестов и их психометрических характеристик. Однако тем, кто только начинает знакомиться
Предисловие к русскому изданию
9
с такой сложнейшей областью деятельности, как психологическое тестирование, излишние подробности только мешают. К тому же конкретная информация о тестах, публикуемая в книгах учебного характера, даже для специалистов представляет скорее исторический интерес, поскольку устаревает с неимоверной скоростью. Для свежей информации существует периодика. Поэтому, если быть объективным, от сокращения объема книга только выиграла как учебник начального уровня.
С другой стороны, любое сокращение учебника влечет за собой снижение его самодостаточности. Современные учебники, особенно западные, встроены в систему информационного обеспечения через разветвленную систему ссылок на многочисленные источники, в которых подробно рассматриваются затрагиваемые в них вопросы. Книга Анастази и Урбины тоже построена в этом ключе и содержит обширную библиографию источников на английском языке, ссылки на которые даются практически в каждом абзаце текста. Для отечественных читателей это оборачивается двумя проблемами: получением доступа к таким источникам и необходимостью достаточно хорошо знать английский язык, чтобы быстро ознакомиться с их содержанием. Если последнюю проблему каждый человек решает самостоятельно, то решить первую проблему, даже с учетом развития Интернета, далеко не так просто. На мой взгляд, паллиативным решением могло бы быть создание собственного — минимального — информационного обеспечения для каждой заслуживающей того переводной книги. «Психологическое тестирование», несмотря на свой энциклопедический характер, относится к книгам типа «знаю что», и в этом ее достоинство. Но есть еще книги типа «знаю как», на которые, помимо нормативных документов, чаще всего и ссылаются А. Анастази и С. Урбина. К сожалению, именно таких книг не хватает нашим студентам, аспирантам и практикам. Разумеется, речь идет не о рецептурных поделках, а о серьезной литературе, написанной, однако, не для зрелых специалистов (такая литература у нас все же есть), а для тех, кто хочет стать таковым. Если говорить конкретно об издаваемой книге, то в качестве ее сопровождения хорошо было бы своевременно перевести ряд книг учебного характера по конструированию тестов, современным методам анализа заданий, метаанализу, многомерному шкалированию, факторному и кластерному анализу, методу моделирования структурными уравнениями, да и по отдельным типам тестов тоже. Это значительно бы повысило ее эффективность как учебника. Пока же в качестве такого сопровождения можно рекомендовать единственную книгу Пола Клайна «Справочное руководство по конструированию тестов» (1994), переведенную Е. П. Савченко под ред. Л. Ф. Бурлачука, — и то в принципе, поскольку она уже стала библиографической редкостью.
Изменения в содержании книги отражают основные тенденции развития психологического тестирования, которые авторы связывают с непрерывно возрастающим влиянием компьютеризации на эту область и с ее превращением в сферу политических и правовых интересов. Причем, как мне показалось, авторы придают компьютеризации статус фактора интеграции психологической науки в целом, и методов тестирования в частности, приводя в качестве примеров развитие психологической оценки, объединяющей два традиционно противопоставлявшихся подхода — психометрический и клинический; тенденцию к объединению нейропсихологических (косвенных) методов диагностики локальных поражений головного мозга с прямыми методами нейроинтроскопии; попытки учесть при разработке новых тестов неразрывное единство когнитивных и личностных переменных, и др. Все это действительно так, но, на мой взгляд, роль компьютеризации во всем этом гораздо скромнее. Интегративные
10
Предисловие к русскому изданию
тенденции в психологии — результат ее собственного внутреннего развития. Психологи наконец-то стали понимать, что психоанализ и когнитивная психология — два совместимых аспекта описания сложнейшей природы человеческого поведения, а теория деятельности должна существовать не вместо всех научных школ, а вместе с другими подходами к объяснению человеческой психики. Компьютеризацию же лучше рассматривать как условие, облегчающее проявление интегративных тенденций, выстраданных в ходе короткой, но полной драматизма истории психологической науки.
Социальным, этическим и правовым аспектам тестирования в этом издании уделяется еще больше внимания, чем в прежних. Некоторые из затрагиваемых проблем, безусловно, специфичны для Америки и обусловлены содержанием конкретных законов. Тем не менее за всеми частностями скрывается ряд общих тенденций, крайне важных для развития психологического тестирования в нашей стране. Укажу лишь на одну, главную, на мой взгляд. Три составляющих ситуацию тестирования элемента — тестируемый, тестирующий и тест — по своему значению окончательно выстроились в указанном порядке. Из этого, казалось бы, тривиального факта вытекает множество отнюдь не тривиальных следствий методического, этического, социального и даже политического характера. С тестов постепенно снимаются обвинения во всех смертных грехах. Тесты — всего лишь инструменты в руках людей, и как любые другие инструменты — лопаты, пилы, топоры — могут быть хорошими и не очень, а иногда вообще бракованными. Для пользователей тестов все более очевидным становится факт, что все люди разные. Отсюда непременным условием подбора тестов, организации тестирования и, что особенно важно, интерпретации его результатов является учет истории развития индивидуума, особенностей его жизненного опыта и другой информации, релевантной целям тестирования. Взгляд на тестирование как экономящий время заменитель психологической оценки индивидуума уходит в прошлое. Все это резко повышает профессиональную, моральную и правовую ответственность тестирующего, распространяющуюся на весь процесс тестирования, от выбора подходящего для конкретных целей и конкретного человека теста до сообщения заключения по результатам теста получателю. В связи с этим повышаются и квалификационные требования к пользователям тестов. К слову сказать, просто купить профессиональный тест в Америке, пожалуй, сложнее, чем револьвер, поскольку в обществе давно осознали, насколько опасным в руках неопытных или безответственных людей может быть этот психологический инструмент. Вряд ли нужно убеждать читателей в остроте и актуальности подобных вопросов для сложившегося в нашей стране положения дел в области психологической практики.
Работая над переводом этой книги, я, естественно, пользовался русским изданием 1982 г., которое представляет собой перевод с четвертого издания Psychological Testing , вышедшего в 1976 г. Когда я сравнил оба оригинала — 1976 и 1997 гг., — то оказалось, что их текст, в среднем, совпадает примерно на 50% (естественно, в одних главах этот процент значительно меньше, в других — больше). Это вселяло оптимизм, сокращая работу вдвое. Однако, сравнив русский перевод издательства «Педагогика» с книгой, которую мне предстояло перевести, я обнаружил, как это ни покажется странным, гораздо меньше совпадений. Парадокс объясняется просто — временем. Этот перевод делался в конце 1970-х — начале 1980-х гг., и он просто устарел — как в отношении научного языка, так и в плане смысловых акцентов. К тому же текст глав, посвященных статистическим аспектам тестирования, содержал изрядное количество терминоло-
Предисловие к русскому изданию
11
гических ошибок и смысловых неточностей, допущенных (по понятным причинам) переводчиками и пропущенных (по непонятным причинам) редакторами. Поэтому ничего не оставалось, как перевести всю книгу заново, сохраняя в совпадающих частях отдельные предложения и небольшие куски из старого перевода в тех случаях, когда они вписываются в современное прочтение текста.
Если говорить о трудностях перевода, то основная и, пожалуй, единственная трудность связана с лексически точным и кратким переводом названий тестов, нормативных документов, организаций и законов. В этой области нет устоявшихся образцов, зафиксированных в словарях, и потому возможны многочисленные варианты. Что касается названий тестов, то, как справедливо подчеркивают авторы этой книги, по ним нельзя судить о том, что измеряет тот или иной тест. Тем не менее большинство непрофессионалов судят о тестах как раз по их названию. Проблема усугубляется тем, что даже на языке оригинала названия тестов далеко не всегда точно соответствуют их содержанию и назначению, а при переводе вносятся дополнительные искажения. К примеру, вряд ли стоит называть тест, проверяющий понимание элементарных законов механики, изучаемых в средних классах школы, «тестом технических способностей», как это делается в русском издании 1982 г. В этом издании при переводе названий тестов я следовал, во-первых, принципу точности, и только во-вторых — принципу «красивости» названий товара (а то, что тесты — это товар, теперь хорошо известно и российским пользователям). В скобках после каждого названия теста, документа, организации или важного термина приведены соответствующее название или термин на языке оригинала. Это не только позволяет проверить работу переводчика, но и выполняет роль вспомогательного словаря для тех студентов и аспирантов, которые читают литературу по психологии на английском языке. Что касается математико-статистических терминов, то, в целом, они приведены в соответствие со стандартной терминологией в данной области.
Надеюсь, что эта книга послужит благородному делу преумножения знаний и повышению профессиональной культуры в области психологического тестирования, по меньшей мере, для нескольких поколений наших студентов, аспирантов и практических работников.
9 января 2001 г.
А. А. Алексеев
ПРЕДИСЛОВИЕ
Памяти Джона Портера Фоули-младшего, внесшего существенный вклад в подготовку всех предыдущих изданий этой книги, посвящается.
АннаАнастази Сюзанна Урбан
Девяностые годы свидетельствовали о неуклонном повышении и расширении интереса к психологическому тестированию, обнаружившегося в восьмидесятые. На это указывает как разработка новых тестов, часть которых отражает принципиально новые подходы, так и непрекращающиеся исследования существующих тестов наряду с систематическим пересмотром их более ранних версий. Главная цель, которую мы преследовали при отборе психодиагностического инструментария, заслуживающего упоминания или обсуждения на страницах этой книги, — раскрыть перед читателями многообразие измерительных инструментов, доступных в этой области на сегодняшний день, а также показать ряд тестов и методик, важных в историческом плане. Любая попытка дать исчерпывающее описание всей области психологического тестирования, или даже сколько-нибудь значительной ее части, потребовала бы книги иного объема.
Повышенное внимание уделяется людям, проходящим тестирование. Пользователи тестов побуждаются к поиску причин качества выполнения конкретного теста конкретным человеком в том, с какими событиями ему пришлось столкнуться в своей жизни и как он на них реагировал. Например, какие биографические сведения о данном человеке могли бы помочь понять его ответы на тест и повысить точность осуществляемого на основе полученных оценок прогнозирования последующего поведения — в школе, на работе и в других повседневных ситуациях? Из этого следует, что пользователь теста несет повышенную ответственность при выборе подходящих для конкретного человека тестов и методов проведения тестирования, равно как и при сообщении и использовании полученных результатов. Именно поэтому данный учебник задумывался, в основном, с целью обеспечить основу для правильного пользования тестами.
Эффективное использование тестов требует хотя бы элементарного знакомства с их конструированием. Такие знания необходимы для того, чтобы пользователь мог оценить различные тесты, выбрать среди них подходящие для определенных целей и конкретных обследуемых и правильно интерпретировать результаты тестирования. Хотя эта книга не адресована конкретно профессиональным разработчикам тестов, тем не менее, она содержит достаточно сведений о том, как создавать тесты, отвечающие потребностям пользователя.
В данном издании также даются простые объяснения некоторых широко используемых и быстро развивающихся понятий и процедур, которые, по всей вероятности, будут оказывать влияние на психометрическую практику в XXI в. Примерами таковых служат: компьютеризированное адаптивное тестирование, метаанализ, моделирование структурными уравнениями, использование доверительных интервалов вместо традиционной статистической значимости, кросс-культурное тестирование и все более широкое применение факторного анализа в разработке тестов личности и спо-
Предисловие
13
собностей. Применение различных моделей и техник факторного анализа в практике тестирования обеспечило получение норм, которые допускают интерпретацию оценок на разных уровнях специфичности или обобщенности, так что пользователь теста может выбрать тот уровень, который наиболее подходит для данного конкретного человека или конкретной ситуации.
В настоящее время в тестировании достаточно явно обнаруживаются две долгосрочные тенденции; вместо того чтобы посвятить им отдельные главы, мы обращаемся к их обсуждению на протяжении всей книги, всякий раз, когда рассматриваемый материал представляет для этого удобный случай. Первая тенденция — это постоянно возрастающее влияние компьютеризации на развитие, создание и проведение тестов, в добавление к твердо установившейся практике использования компьютеров для подсчета набранных баллов и последующей обработки результатов тестирования. Скорость технического прогресса столь велика, что он, по-видимому, опережает развитие существующих областей психологии. Однако технология оказывает мощное содействие психологии в ее продвижении на передовые позиции как в теории, так и в методах исследования. Например, в наше время происходит быстрое объединение и «перекрестное оплодотворение» различных областей психологии, чему в немалой степени способствует та легкость, с какой исследователи всего мира могут получать необходимую информацию, обрабатывать ее и обмениваться между собой полученными данными. Переосмысление когнитивных и личностных черт как взаимодействующих и неразделимых сторон индивидуума, который, в свою очередь, неотделим от его физического «Я», жизненных событий и среды, — один из самых ярких и многообещающих примеров этой тенденции к интеграции.
Вторая тенденция, весьма серьезно сказывающаяся на психологическом тестировании, отражает нарастающее вторжение политических и правовых интересов в эту область. Несмотря на то что эта тенденция сеет разногласия и несет в себе потенциальную опасность для развития тестологии, она все же имеет ряд позитивных последствий в виде побуждения к творчеству и повышенной бдительности в отношении планируемых и непредвиденных последствий использования тестов. Ссылки на ряд законов, оказавших влияние на практику тестирования, приведены на протяжении всего текста учебника, вместе с указанием их названий и года принятия; с их содержанием можно ознакомится по отчетам конгресса США и другим периодическим изданиям, которые можно найти в справочных отделах большинства библиотек.
Если на обложке первых шести изданий этого учебника стояло имя одного автора, то седьмое его издание подготовлено в соавторстве. Два автора вместе составляли план реорганизации глав и перечень охватываемых ими главных тем. Конкретная работа по пересмотру и переписыванию глав учебника была распределена следующим образом: Анастази — главы 1-7 и 10-12, Урбина — главы 8, 9 и 13-18. Кроме того, Урбина взяла на себя основные административные функции и ведение переписки. Однако, каждый из авторов знакомился с черновыми вариантами глав другого и вносил предложения, которые обычно принимались и вносились в окончательный текст книги.
Очевидно, что эта книга не могла быть написана, если бы авторы не имели доступа к результатам исследований и публикациям многих психологов из различных уголков США и других стран. Их имена встречаются на протяжении всей книги: при цитировании публикаций, при указании источников конкретных данных и в сводном перечне ссылок на использованную литературу. Внутри этой впечатляющей группы не-
14
Предисловие
сколько человек все же выделяются на общем фоне благодаря своей постоянной готовности к бескорыстному сотрудничеству и величине сделанного ими вклада в наше общее дело. Среди них мы должны в первую очередь упомянуть Дайану Браун (Di-anne Brown) из научной дирекции Американской психологической ассоциации (АРА), Аурелио Прифитеру (Aurelio Prifitera) и Джоан Ленке (Joanne Lenke) из Психологической корпорации ( Psychological Corporation ), Лоран Летандр (Lorin Letendre) из издательства Consulting Psychologists Press , Кэрол Уотсон (Carol Watson) из корпорации NCS ( National Computer Systems ), Дугласа Джексона (Douglas Jackson) из корпорации SAS ( Sigma Assessment Systems ), Элизабет Мак-Грэт (Elizabeth McGrath) и Джона Освальда Gohn Oswald) из издательства Riverside Publishing Company , а также Уэйна Камару (Wayne Camara) из Совета колледжей ( College Board ). Наконец, мы выражаем глубокую благодарность персоналу библиотек Университета Фордхама и Университета Северной Каролины за удовлетворение наших запросов, постоянно менявшихся в процессе работы над этой книгой.
А. Анастази С. Урбина
Часть 1
ФУНКЦИИ И ИСТОКИ
ПСИХОЛОГИЧЕСКОГО
ТЕСТИРОВАНИЯ
1 ПРИРОДА И НАЗНАЧЕНИЕ ПСИХОЛОГИЧЕСКИХ ТЕСТОВ
Психологические тесты — это инструменты или, употребляя более широкий термин, орудия. Чтобы получить положительные результаты от применения тестов, мы должны учитывать этот важный факт. Любой инструмент может быть орудием, приносящим пользу или наносящим вред, — в зависимости от того, как его используют. Тестирование развивалось и продолжает развиваться нарастающими темпами, оказывая эффективное содействие в решении все более широкого круга вопросов в различных сферах повседневной жизни.' Однако его развитие сопровождалось нереалистичными ожиданиями и неправильным применением некоторых тестов. Пользователям нужно знать, как оценить тот или иной тест. Насколько подходит этот тест для той конкретной цели, ради достижения которой он используется? Какую информацию он может дать о человеке, который его выполняет? Как результаты этого теста можно включить в цепочку данных, приводящую к выбору линии действия? Именно такого рода вопросы мы ставили на первое место при подготовке этой книги. Наша книга ориентирована не на специалистов-тестологов, а на всех тех, кто изучает психологию. В настоящее время просто необходимо обладать определенной базой знаний о тестах, причем это касается не только тех, кто конструирует тесты или проводит тестирование, но всех и каждого, кто использует результаты тестов в качестве главного источника данных при принятии решений в отношении себя или других людей.
Области применения и разновидности тестов
Традиционно назначение психологических тестов состояло в том, чтобы измерять различия между людьми или между реакциями одного и того же человека в разных условиях. Одной из самых ранних проблем, побудивших к разработке психологических тестов, было выявление умственно отсталых. И до сегодняшнего дня обнаруже-
1 Что касается ясных и убедительных иллюстраций потенциальных вкладов психологических тестов с примерами из реальной жизни, см. Dahlstrom (1993b).
Глава 1. Природа и назначение психологических тестов
17
ние интеллектуальных дефектов остается важной областью применения определенных видов психологических тестов. Родственная область клинического применения тестов включает обследование лиц с тяжелыми эмоциональными расстройствами и другими типами нарушения поведения. Помимо этого, мощный импульс первоначальному развитию тестов был задан стремлением удовлетворить нужды образования. Имеются в виду знаменитые тесты Бине, с которых, собственно говоря, и началось интеллектуальное тестирование. В настоящее время школы входят в число основных пользователей тестов. Распределение детей по способностям с целью максимально использовать возможности разных типов школьного обучения, выявление умственно отсталых, с одной стороны, и одаренных учеников — с другой, образовательное и профессиональное консультирование учащихся средних школ и студентов колледжей, отбор в профессиональные и другие специальные школы — вот лишь некоторые примеры использования тестов в образовании.
Отбор и распределение персонала на промышленных предприятиях — еще одна важная область применения психологического тестирования. От оператора на линии сборки или делопроизводителя до управленцев высшего звена вряд ли найдется работа, для которой тестирование не оказалось бы полезным при решении вопроса о найме, распределении обязанностей, переводе на новое место, повышении по службе или увольнении. Разумеется, эффективное применение тестов в большинстве таких ситуаций, особенно касающихся высококвалифицированной работы, возможно лишь тогда, когда тесты используют в качестве дополнения к специальному собеседованию с кандидатами, создающему условия — в виде биографического контекста — для правильной интерпретации тестовых показателей конкретного кандидата. Тем не менее тестирование составляет важную часть полной программы управления трудовыми ресурсами. Весьма близкое по целям применение психологического тестирования имеет место в вооруженных силах при отборе и распределении военнослужащих. По сравнению с эпохой Первой мировой войной, когда предпринимались отдельные попытки психологического обследования новобранцев, разнообразие и масштабы применения психологических тестов в армии во время Второй мировой войны значительно увеличились. Впоследствии исследованиями по разработке тестов были охвачены все рода войск.
Использование тестов в индивидуальном консультировании постепенно расширилось от узконаправленных советов относительно учебных и профессиональных планов до рассмотрения всех аспектов жизни человека. Эмоциональное благополучие и эффективные межличностные отношения все более отчетливо выделяются в качестве целей консультирования. Также отмечается усиливающаяся тенденция к использованию тестов для улучшения самопонимания и личностного роста. В рамках такого применения тестов их показатели составляют часть информации, на основе которой человек принимает решения относительно себя самого и своей жизни.
Совершенно очевидно, что психологические тесты в настоящее время применяют при решении широкого круга практических проблем. Однако не следует забывать и о том, что такие тесты — важное средство фундаментальных исследований. К примеру, почти все проблемы в дифференциальной психологии требуют обращения к методикам тестирования как средству сбора данных. В качестве иллюстраций можно указать на исследования природы, характера и степени индивидуальных различий, структуры психологических черт, измерение групповых различий и выявление биологических и культурных факторов, связанных с различиями в поведении. Во всех таких областях
18
Часть 1. Функции и истоки психологического тестирования
исследования, как, впрочем, и во многих других, точное измерение индивидуальных различий, ставшее возможным благодаря правильно построенным тестам, является необходимым условием работы. Кроме того, психологические тесты служат стандартизованными инструментами исследования таких разнообразных проблем, как возрастные изменения в развитии человека на протяжении всей его жизни, относительная эффективность разных методов обучения, результативность психотерапии, воздействие социальных программ и влияние средовых переменных на человеческую деятельность.
Столь разнообразные по своему назначению виды тестов различаются и по другим важным характеристикам. Прежде всего, они разделяются по способу проведения тестирования: индивидуальному (проводимому квалифицированным специалистом), групповому или компьютерному. Далее, тесты различаются по тем аспектам поведения, для измерения которых они предназначены. Некоторые из них нацелены на оценку когнитивных особенностей, или способностей, которые могут варьировать от общих способностей, таких как готовность извлекать пользу из учебной работы в колледже, до высоко специфичных сенсомоторных умений, необходимых для выполнения простой ручной операции. Другие тесты обеспечивают измерение аффективных переменных, или личности, включая эмоциональные и мотивационные характеристики, межличностное поведение, интересы, аттитюды и ценности.
При столь очевидном разнообразии природы и назначения психологических тестов, есть ли у них какие-то общие отличительные признаки? Чем психологические тесты отличаются от других методов сбора информации о людях? Ответ следует искать в некоторых принципиальных особенностях конструирования и применения тестов. Рассмотрению этих особенностей и посвящен следующий раздел.
Что такое психологический тест?
Выборочный анализ поведения. Психологический тест, в сущности, представляет собой объективное и стандартизованное измерение образцов (или проб) поведения. Психологические тесты, подобно наблюдениям или тестам в любых других науках, проводятся на малой выборке тщательно отобранных образцов поведения индивидуума. В этом отношении психолог идет почти тем же путем, что и биохимик, делающий свои заключения о составе крови пациента или качестве питьевой воды в микрорайоне на основе анализа одной или нескольких взятых им проб. Если психолог хочет проверить словарный запас ребенка, умение служащего выполнять арифметические вычисления или зрительно-двигательную координацию пилота, он предъявляет им репрезентативные наборы слов, арифметических задач или же тесты двигательных способностей и оценивает их реакции. Насколько адекватен тест изучаемому аспекту поведения, зависит, очевидно, от количества и характера заданий, образующих сти-мульный набор (или выборку заданий) данного теста. Так, арифметический тест, состоящий из 5 задач или включающий лишь вопросы на умножение, вряд ли может дать достаточно верное представление о счетных навыках взрослого человека, а словарный тест, составленный целиком из терминов игры в бейсбол, едва ли обеспечит надежную оценку полного словарного запаса ребенка.
Диагностическая, или предсказательная, ценность психологического теста зависит от того, насколько он может служить индикатором относительно широкой и важ-
Глава 1. Природа и назначение психологических тестов
19
ной области поведения. Измерение образцов поведения, непосредственно охватываемых данным тестом, очень редко оказывается, если вообще оказывается, целью психологического тестирования. Знание ребенком какого-то списка из 50 слов, так же как и выполнение конкретной серии из 20 арифметических задач, сами по себе не представляют большого интереса. Но если можно продемонстрировать близкое соответствие между знанием ребенком данного списка слов и его общим словарным запасом или же между показателем, полученным при решении арифметических задач претендентом на должность клерка, и качеством выполнения им счетных операций на работе, то используемые тесты отвечают своему назначению.
В этой связи следует отметить, что задания теста не обязательно должны иметь близкое сходство с поведением, для предсказания которого тест предназначен. Здесь важно только, чтобы между ними и поведением наблюдалось эмпирическое соответствие. Степень сходства между тестируемыми образцами поведения и прогнозируемым поведением достаточно широко варьирует. На одном полюсе континуума «сходство — различие» тест может полностью совпадать с какой-то частью предсказываемого поведения. В качестве примеров можно было бы привести словарный тест по иностранному языку, проверяющий знание учащимися 20 из 50 вновь выученных слов, или тест на знание правил дорожного движения для получения водительских прав. Однако задания тестов профессиональной пригодности, применяемых перед началом обучения специальности, уже меньше похожи на те, которые приходится выполнять на настоящей работе. На другом полюсе находятся проективные личностные тесты, такие как тест чернильных пятен Роршаха, в котором делается попытка на основе ассоциаций, возникающих у обследуемого человека при разглядывании чернильных пятен, предсказать, как он будет реагировать на других людей, эмоционально окрашенные раздражители и прочие сложные ситуации повседневной жизни. Несмотря на внешние различия, все эти тесты состоят из выборочных проб поведения индивидуума. И ценность каждого должна доказываться эмпирически устанавливаемым соответствием между характеристиками деятельности человека в ситуации тестирования и в других ситуациях.
Используемые в этой связи термины «диагноз» и «прогноз» являются довольно слабым дифференциальным признаком. Обычно прогноз ассоциируется с оцениванием во временной перспективе, — например, будущее выполнение индивидом какой-либо деятельности предсказывается исходя из результатов выполнения им теста в настоящее время. Вместе с тем, в широком смысле, даже диагноз наличных состояний, таких как умственная отсталость или эмоциональные расстройства, содержит предсказание того, как будет вести себя человек с тем или иным диагнозом в ситуациях, отличных от тестовых. В логическом отношении проще рассматривать все тесты как выборочное измерение поведения, на основе которого можно предсказать поведение в других случаях. Поэтому имеет смысл рассматривать разные виды тестов как вариации этой основной схемы.
Еще один момент, который следовало бы обсудить в самом начале, связан с понятием способность ( capacity ). Вполне возможно создать тест, например, для предсказания успешности овладения французским языком еще до того, как конкретный человек приступит к его изучению. Такой тест был бы связан с выборочным анализом типов поведения, необходимых для освоения нового языка, но сам по себе не предполагал бы знания французского. Тогда можно было бы сказать, что этот тест измеряет «способность» или «потенциальные возможности» индивидуума к овладению французским
20
Часть 1. Функции и истоки психологического тестирования
языком. Однако такие термины по отношению к психологическим тестам следует использовать с осторожностью. Только в том смысле, что выборка образцов настоящего поведения может быть использована как индикатор другого, будущего поведения, мы вправе говорить об измерении «способности» данным тестом. Ни один психологический тест не может измерить ничего, кроме поведения. Будет ли такое поведение эффективным показателем другого поведения, определяется только эмпирическим путем.
Стандартизация. Напомним, что мы начали с определения психологического теста как стандартизованного измерения. Стандартизация подразумевает единообразие процедуры проведения и оценки выполнения теста. Если мы хотим, чтобы показатели, полученные разными людьми, были сравнимыми, условия тестирования должны быть одинаковыми для всех. Такое требование — всего лишь конкретное применение принципа контролируемости условий любого научного наблюдения. В тестовой ситуации единственной независимой переменной часто оказывается сам обследуемый.
Чтобы обеспечить единообразие условий тестирования, создатель теста дает подробные указания по проведению каждого вновь разработанного теста. Формулирование таких указаний — важная часть стандартизации нового теста. Она включает точные указания относительно используемого стимульного материала, временных ограничений, устных инструкций испытуемому, пробных образцов заданий, допустимых ответов на вопросы обследуемого и других тонкостей проведения теста. На выполнение некоторых тестов может влиять множество других, не столь очевидных факторов. Так, зачитывая вслух инструкцию или задания, следует принимать в расчет скорость речи, тон голоса, интонацию, паузы и выражение лица. В тесте на обнаружение нелепостей, например, правильный ответ может быть невольно подсказан улыбкой или паузой после произнесения критического слова. Значение стандартизованной процедуры тестирования с точки зрения проводящего обследование специалиста будет обсуждаться в этой главе позднее, в связи с проблемами проведения теста.
Другой важный этап в стандартизации теста — установление норм. Психологические тесты не имеют заранее определенных стандартов их успешного или неуспешного выполнения; критерии выполнения каждого теста устанавливаются на основе эмпирических данных. В большинстве случаев тестовый показатель индивидуума интерпретируется на основе сравнения с оценками, полученными по данному тесту другими людьми. Как следует из самого этого термина, норма — это обычный, или средний, уровень выполнения. Поэтому, если нормальные 8-летние дети правильно решают 12 задач из 50 в тесте на типичное арифметическое рассуждение, значит, норма для 8-летнего ребенка по этому тесту соответствует 12 (очкам, баллам или каким-то другим произвольным «единицам» измерения). Показатели такого рода принято называть первичными оценками (или «сырыми» баллами). Они могут выражаться числом правильно решенных заданий, временем, необходимым для их выполнения, числом ошибок и другими объективными мерами, соответствующими содержанию теста. Такая первичная оценка ни о чем не говорит до тех пор, пока не получит выражение в единицах подходящих интерпретационных данных.
В процессе стандартизации теста его проводят на большой репрезентативной выборке лиц определенного типа, для работы с которыми он предназначен. Эта группа, называемая выборкой стандартизации, как раз и служит для установления норм. Такие нормы показывают не только средний уровень выполнения теста, но и относительную частоту различных по степени отклонений от среднего уровня в обе стороны, что
Глава 1. Природа и назначение психологических тестов 21
позволяет количественно оценивать величину превышения или отставания от среднего. Конкретные формы выражения таких норм рассматриваются в главе 3. Любая из этих форм позволяет охарактеризовать положение индивидуума относительно нормативной выборки или выборки стандартизации.
Следует попутно отметить, что нормы для личностных тестов устанавливаются в сущности таким же образом, как и для тестов способностей. Норма по личностному тесту совсем не обязательно соответствует наиболее желательному или «идеальному» варианту его выполнения, равно как и норма по тесту способностей практически не бывает представлена абсолютным показателем, выставляемым за безошибочное выполнение всех тестовых заданий. Для тестов обоих типов норма соответствует результатам их выполнения типичными, или средними, людьми. Например, в тестах, измеряющих «доминирование — подчинение», норма приходится на среднюю точку, отображающую степень доминирования или подчинения, проявляемую средним человеком. Подобным же образом в опроснике эмоционального приспособления ( emotionaladjustment inventory ) норма обычно не соответствует полному отсутствию неблагоприятных или дезадаптивных реакций. Некоторое количество таких реакций свойственно большинству «нормальных» людей, входящих в выборку стандартизации, и потому норма должна отображать это количество реакций, свидетельствующих об отсутствии у большинства людей абсолютного контроля над своими эмоциями.
Объективное измерение трудности. Обращаясь к определению психологического теста, с которого началось его обсуждение, напомним, что тест был охарактеризован не только как стандартизованное, но и как объективное измерение. В каких конкретных отношениях такие тесты являются объективными? Некоторые аспекты объективности психологических тестов уже были затронуты при обсуждении стандартизации. В связи с этим отмечалось, что процедуры тестирования, вычисления первичных оценок по тесту и их интерпретации объективны в той мере, насколько они независимы от субъективных суждений специалиста, проводящего тестирование. Теоретически у любого конкретного человека оценка по тесту должна быть одной и той же независимо от того, кто проводит с ним данный тест. На самом деле это не совсем так, поскольку полная стандартизация и абсолютная объективность практически недостижимы. Но по крайней мере стремление к такой объективности составляет одну из целей при конструировании теста, и нужно признать, что приемлемый уровень объективности достигнут в большинстве созданных тестов.
Есть и другие важные отношения, в которых психологические тесты с полным основанием можно охарактеризовать как объективные. Определение уровня трудности одного задания или теста в целом основывается на объективных эмпирических процедурах. Когда А. Бине и Т. Симон составляли свою первую (Binet & Simon, 1905) шкалу для измерения интеллекта, они расположили входящие в нее 30 заданий в порядке возрастания трудности. Уровень трудности определялся путем опробования этих заданий на 50 нормальных и нескольких умственно отсталых детях. Задания, с которыми справилось большинство детей, ipsofacto ^, расценивались как самые легкие; задания же, с которыми справилось относительно малое число детей, считались более трудными. С помощью такой процедуры был установлен эмпирический порядок трудности всех заданий. Этот пример из истории тестирования служит прообразом объек-
' В силу самого факта (лат.). — Примеч. науч. ред.
22
Часть 1. Функции и истоки психологического тестирования
тивного измерения уровня трудности, ставшего теперь общепринятой процедурой при создании психологических тестов.
Не только расположение, но и отбор заданий для включения их в тест может определяться исходя из доли входящих в пробную выборку лиц, которые справляются с каждым заданием. Так, если наблюдается скопление заданий на любом из концов шкалы (т. е. на полюсах легкости или трудности), от части таких заданий можно отказаться. Аналогично, если какие-то отрезки шкалы оказываются пустыми или представленными малым числом заданий, можно добавить новые, чтобы заполнить образовавшиеся пробелы. Более формальные аспекты анализа заданий будут рассмотрены в главе 7.
Надежность. Насколько хорош данный тест? Действительно ли он отвечает своему назначению? Эти вопросы могут выливаться, — и время от времени действительно выливаются, — в длительные бесплодные дискуссии. Субъективные мнения, необоснованные предчувствия и личные пристрастия могут приводить одних к переоценке возможностей конкретного теста, а у других вызывать его упорное неприятие. Единственный способ дать окончательный ответ на подобные вопросы — эмпирическая проверка. Объективная оценка психологических тестов предполагает в первую очередь определение их надежности и валидности в строго заданных ситуациях.
В психометрии термин «надежность» по существу означает согласованность. Надежность теста есть согласованность оценок у обследуемых лиц при их повторном тестировании тем же самым тестом или его эквивалентной формой. Если измерение IQ ребенка в понедельник дает коэффициент интеллекта, равный 110, а в пятницу, при повторном тестировании, равный 80, то очевидно, что ни к одной из этих оценок нельзя отнестись с доверием. Аналогично, если в наборе из 50 слов кто-то правильно определил 40, а в другом, считающимся эквивалентным, наборе — только 20, то ни одна из этих оценок не может рассматриваться в качестве надежного показателя уровня вербального понимания у данного человека. Разумеется, возможно, что в обоих примерах ошибочной является только одна из двух оценок, но это может показать лишь последующее тестирование; из приведенных данных следует только то, что обе оценки одновременно не могут быть правильными. Для более конкретного вывода (верна одна из оценок или неверны обе) требуется дополнительная информация.
Прежде чем давать разрешение на широкое использование психологического теста, необходимо провести тщательную объективную проверку его надежности. Различные типы надежности тестов и соответствующие методы ее измерения рассмотрены в главе 4. Надежность может проверяться путем сравнения результатов теста, получаемых при его проведении на одних и тех же людях в различные моменты времени, с использованием разных наборов заданий, при смене лиц, проводящих или оценивающих его выполнение, а также при варьировании любых других релевантных условий тестирования. Очень важно точно указывать тип надежности и способ ее определения, поскольку один и тот же тест может изменяться при этом в различных аспектах. Кроме того, следует сообщать сведения о величине и характере выборки, на которой проверялась надежность теста. Такая информация дает возможность пользователям теста предсказывать, будет ли данный тест столь же надежен для той группы, в которой они собираются его применить, или же им следует ожидать снижения (повышения) его фактической надежности по сравнению с номинальной.
Валидность. Несомненно, самый важный вопрос относительно всякого психологического теста касается его валидности: действительно ли данный тест измеряет то, для
Глава 1. Природа и назначение психологических тестов
23
измерения чего он предназначен, и в какой степени? Валидность предусматривает прямую проверку того, насколько хорошо тест выполняет свою функцию. Для определения валидности обычно требуются независимые, внешние критерии всего того, что тест должен измерять. Например, если тест пригодности к обучению медицинским профессиям используется при отборе поступающих в медицинское училище, таким критерием, в общем, будет являться успешное окончание этого училища. В процессе валидизации данного теста его следовало бы провести на большой группе студентов в то время, когда они поступают в училище. Показателями результативности их обучения в медицинском училище могли бы служить получаемые каждым студентом отметки, характеристики преподавателей, успешное или неуспешное прохождение практики и завершение обучения. Такая сводная характеристика и служит критерием, с которым должны соотноситься исходные тестовые показатели студентов. Сильная корреляция, или высокий коэффициент валидности, означала бы, что студенты, имевшие высокие показатели по тесту, добивались в медицинском училище заметных успехов, а у имевших низкие показатели успехи были слабыми. Слабая корреляция указывала бы на плохое соответствие между тестовыми показателями и критериальной мерой и, следовательно, на низкую валидность теста. В данном случае коэффициент валидности дает нам возможность определить, насколько точно может быть предсказана на основе тестовых показателей эффективность (по заданному критерию) деятельности.
Валидность тестов, предназначенных для других целей, устанавливается сходным образом относительно подходящих для этого критериев. Например, для теста профессиональной пригодности валидность можно установить, основываясь на результативности работы группы персонала, нанятого на испытательный срок. Валидность батареи тестов, предназначенных для определения летных качеств, может быть установлена по результатам тренировочных полетов. Валидизация тестов, имеющих более широкое применение, производится относительно ряда независимо получаемых поведенческих индексов, и их валидность устанавливается только в ходе постепенного накопления данных из множества различных исследований.
Читатель, может быть, обратил внимание на кажущуюся парадоксальность понятия валидности теста. Если так необходимо наблюдать за людьми вне тестовой ситуации или как-то иначе получать объективные данные о том, что мы пытаемся предсказать с помощью теста, почему же не отказаться от самого теста? Ответ на этот вопрос нужно искать в различиях между группой, на которой производится валидизация теста, и группами, в которых данный тест будет со временем использоваться по его прямому назначению. Прежде чем предоставить тест пользователям, его валидность устанавливается на репрезентативной выборке испытуемых. Показатели этих испытуемых используются не по прямому назначению, а только в целях проверки создаваемого теста. Если валидность теста доказывается таким методом, его можно применять на других выборках уже при отсутствии критериальных мер.
И все же можно возразить, что нужно лишь подождать до тех пор, пока используемые в качестве критериальных мер результаты деятельности или поведения любой группы появятся сами собой и таким образом получить ту информацию, которую мы пытаемся предсказать с помощью тестов. Однако подобный образ действий в большинстве случаев потребовал бы неприемлемых затрат времени и энергии. Так, если бы мы захотели определить, кто из поступающих на работу справится с ней или кто из абитуриентов успешно закончит колледж, нам пришлось бы принять всех желающих
24
Часть 1. Функции и истоки психологического тестирования
(или, в крайнем случае, сформировать из них случайную выборку) и дожидаться окончательных итогов! Тесты как раз и предназначены для того, чтобы свести к минимуму недопустимую расточительность такого образа действий — и его пагубное эмоциональное воздействие на людей. С помощью тестов можно оценить, с заданным пределом погрешности, актуальный уровень навыков, знаний и других релевантных характеристик индивидуума, составляющих предпосылку его будущей деятельности. И чем выше валидность и надежность теста, тем меньше будет относительная величина погрешности.
Конкретные проблемы, с которыми сталкиваются при определении валидности тестов разных типов, а также используемые при этом специальные критерии и статистические методы рассмотрены в главах 5 и 6. Однако один момент необходимо обсудить сейчас. Валидность показывает нам не только степень соответствия теста своему назначению. Фактически, она указывает нам,' что измеряется тем или иным тестом. Анализируя данные валидизации, мы можем объективно определить, что же все-таки измеряет наш тест. Поэтому было бы правильнее определять валидность как меру нашей уверенности в том, что тест измеряет именно то, для измерения чего он предназначен. Несомненно, интерпретация тестовых показателей была бы более ясной и однозначной, если бы тесты всегда получали названия исходя из эмпирически установленных соотношений, по которым устанавливалась их валидность. Тенденцию к изменению в этом направлении можно увидеть в выборе таких названий, как «тест академической оценки» и «тест распределения персонала» вместо неопределенного — «тест интеллекта».