Почеиу необходим контроль за использованием психологических тестов?
«Могу ли я получить бланки теста Стэнфорд—Бине? Мой племянник на следующей неделе поступает в школу N., и мне бы хотелось немного поднатаскать его, чтобы он смог поступить».
«Чтобы усовершенствовать программу чтения в нашей школе, нам нужен культурно-свободный тест интеллекта, позволяющий измерять врожденный потенциал ребенка».
«Вчера вечером я ответил на вопросы интеллектуального теста, опубликованного в журнале, и получил IQ , равный 80, я думаю, что психологические тесты просто глупы».
«Моя соседка по комнате изучает психологию. Она дала мне личностный тест, по которому я оказалась невротичной. Я так расстроилась, что даже перестала ходить на занятия».
«В прошлом году вы давали нашим служащим с исследовательскими целями новый личностный тест. Нам бы теперь хотелось иметь их тестовые показатели для картотеки кадров».
Эти высказывания не выдуманы. Каждое взято из реальных случаев, перечисление которых легко может продолжить любой психолог. Эти высказывания иллюстрируют возможность неправильного использования или интерпретации психологических тестов, ведущих к представлению о тестах как о чем-то бесполезном или даже вредящем
Глава 1. Природа и назначение психологических тестов
25
обследуемому. Как любой научный метод или точный инструмент, психологические тесты обнаруживают свою эффективность только при правильном и умелом применении. В руках недобросовестного или неквалифицированного пользователя такие тесты могут причинить серьезный вред. Есть два главных аргумента в пользу контроля за использованием психологических тестов: а) гарантирование того, что тесты будут проводить только квалифицированные специалисты, а получаемые результаты будут правильно использованы, и б) предотвращение знакомства широкой публики с содержанием тестов, которое может существенно снизить их валидность.
Квалифицированный специалист по тестированию. Потребность в квалифицированном специалисте на каждом из трех основных этапов тестирования — при выборе теста, его проведении и подсчете баллов с последующей интерпретацией результатов — очевидна. Тесты нельзя выбирать, подобно косилкам для газонов, по каталогу, высланному почтой. Их невозможно оценить по названию, автору или каким-то другим идентификационным признакам. Разумеется, для оценки таких факторов, как цена, объемность и легкость транспортировки тестовых материалов, время тестирования, легкость и быстрота подсчета первичных оценок, никакой психологической подготовки не требуется; все эти сведения обычно приводятся в каталоге тестов, и их необходимо учитывать при составлении программы тестирования. Однако, для того чтобы тест выполнил свои функции, важно оценить такие его технические характеристики, как валидность, надежность, уровень трудности и нормы. Только так пользователи могут определить, насколько тот или иной тест пригоден для решения их специфических задач и насколько он подходит для той категории лиц, которую они планируют обследовать с его помощью.
Несколько раньше в этой главе, при предварительном обсуждении стандартизации теста, уже указывалось на важность должной подготовки специалиста, проводящего тестирование. Если мы хотим, чтобы результаты, получаемые при проведении одного и того же теста разными специалистами, были сопоставимы, или чтобы можно было оценить тестовый показатель конкретного человека исходя из опубликованных норм, требуется полное понимание необходимости точно следовать инструкциям, равно как и доскональное знание стандартных процедур. Не менее важен и тщательный контроль условий тестирования. Аналогично этому, неправильный или неточный подсчет «сырых» баллов может полностью обесценить тестовый показатель. При отсутствии надлежащих контрольных процедур ошибки при подсчете «сырых» баллов встречаются намного чаще, чем, по-видимому, принято думать.
Правильная интерпретация тестовых показателей требует всестороннего понимания самого теста, особенностей обследуемого человека и условий тестирования. Что именно измеряется — можно объективно определить, только соотнося тест со специфическими процедурами, на основе которых была установлена его валидность. Столь же необходима и информация о надежности, особенностях группы, на которой устанавливались нормы, и т. п. Существенными для интерпретации любых показателей теста являются биографические сведения о проходящем тестирование человеке. За одинаковой оценкой у разных лиц могут стоять совершенно разные причины. Поэтому заключения, которые делают исходя из таких оценок, порой существенно различаются. Наконец, нельзя не упомянуть и такие особые факторы, влияющие на конкретный показатель, как необычные условия тестирования, временные эмоциональные или физические состояния тестируемого и его предыдущий опыт прохождения тестов.
26 Часть 1. Функции и истоки психологического тестирования
Роль пользователя тестов. Важным результатом развития психологического тестирования в 1980-е и 1990-е гг. стало растущее признание ключевой роли пользователя тестов (Anastasi, 1990b). В этом контексте пользователь тестов — любой человек, который использует тестовые показатели как главный источник информации при принятии практических решений. Пользователь тестов может быть, а может и не быть специалистом по проведению тестов и обработке результатов тестирования. В качестве примеров пользователей можно назвать учителей, консультантов, чиновников системы образования, кадровиков на промышленных предприятиях и в государственных учреждениях. Львиная доля критики в адрес тестов направлена не на какие-то только им — как специфическим инструментам — присущие особенности, а на неправильное использование результатов тестирования недостаточно компетентными пользователями. Ряд нарушений в этой области вызван предпочтением сокращенных форм тестов, стремлением к быстрым ответам и простым шаблонным решениям реальных проблем. Спешка вследствие перегруженности работой может поддерживать доверие к таким средствам достижения цели. И все же наиболее частой причиной неправильного использования тестов, вероятно, являются недостаточные или ошибочные знания пользователей в области тестирования (Eyde, Moreland, Robertson, Primofi, & Most, 1988; Moreland, Eyde, Robertson, Primoff, & Most, 1995; Tyler & Miller, 1986).
Специальные комитеты национальных профессиональных организаций, работающие совместно с издателями тестов, все больше внимания уделяют предупреждению неправильного использования тестов. Ярким примером тому служит проект, осуществляемый Рабочей группой по выработке квалификационных требований к пользователям тестов ( Test User Qualifications Working Group ), хорошо известной по очаровательному акрониму TUQWoG (Eyde et al„ 1988). Главной целью TUQWoG было выработать опирающийся на широкий опыт набор необходимых квалификационных требований к пользователям различных видов тестов, с тем чтобы издатели тестов могли включить эти требования в свои формы для покупателей. В результате интенсивных общенациональных исследований в рамках проекта TUQWoG за пять лет была создана впечатляющая база данных. Некоторые издатели тестов уже начали использовать эти данные в своих квалификационных формах для покупателей. Позднее была образована вторая рабочая группа, целью которой стала разработка нормативных документов и учебных материалов для пользователей тестов на основе базы данных TUQWoG . Ставшая известной под названием TUTWoG (измененный акроним TUQWoG , в котором Qзаменена на Т, первую букву слова training —обучение), эта группа в качестве своего первого продукта подготовила — с профилактическими целями — обзор наиболее распространенных случаев неправильного использования тестов (Eyde et al., 1993). Более поздняя сводка таких случаев дана в Moreland et al. (1995).
Закрытая и открытая информация о тестах. Ясно, что если бы кто-то заучил правильные ответы на тест для проверки цветовой слепоты, то с помощью такого теста уже не удалось бы оценить цветовое зрение этого человека. При таких обстоятельствах данный тест полностью утратил бы свою валидность. Очевидно, доступ к содержанию тестов следует ограничивать, чтобы предотвратить умышленные попытки исказить результаты тестирования. Тем не менее в других случаях влияние осведомленности может быть менее явным, а тест может утрачивать валидность в результате действий искренне заблуждающихся лиц. Например, школьный учитель может, из лучших побуждений, натренировать свой класс в решении задач, сходных с задания-
Глава 1. Природа и назначение психологических тестов 27
ми интеллектуального теста, с тем «чтобы дети были хорошо подготовлены к проведению теста». Такое отношение учителя продиктовано простым переносом обычной процедуры подготовки к школьным экзаменам на ситуацию тестирования. Однако применительно к тесту интеллекта такая специальная тренировка или натаскивание, вероятно, приведет к повышению тестовых показателей, не оказывая сколько-нибудь заметного влияния на более широкую область поведения, замеры которого пытаются произвести с помощью данного теста. При таких обстоятельствах валидность этого теста как прогностического или диагностического инструмента снижается.
Обеспечение защиты конкретного содержания тестов от несанкционированного доступа не должно мешать оперативному сообщению информации о тестах лицам, проходящим тестирование, заинтересованным специалистам и широкой публике. Распространение такой информации служит нескольким целям. Во-первых, она рассеивает мифы и раскрывает «тайны», связанные с тестированием, и тем самым содействует преодолению широко распространенных заблуждений в отношении назначения тестов и значения их показателей. Ряд публикаций, распространяемых некоторыми крупными, специализирующимися на выпуске тестов издательствами, отличаются ясным изложением материала и предназначены именно для этой цели. Во-вторых, часть распространяемой информации имеет отношение к специальным процедурам конструирования и оценивания конкретных тестов; эти материалы содержат релевантные данные о надежности, валидности и других психометрических характеристиках тестов. Такие сведения обычно включаются в специальные руководства, подготовленные для каждого профессионального теста, доступ к которым открыт всем заинтересованным лицам.
В-третьих, распространение информации о тестах преследует еще одну цель — ознакомить тех, кому предстоит пройти тестирование, с типичной обстановкой и процедурами проведения разных тестов, рассеять тревогу и создать все условия для того, чтобы каждый из этих людей мог в полной мере проявить себя при выполнении того или иного теста. С этой целью подготовлена серия разъяснительных буклетов, часть которых носит общий характер, тогда как другие касаются конкретных тестов, таких как Тест академической оценки Совета колледжей { College Board ' s Scholastic Assessment Test ). Эти материалы обсуждаются в одном из последующих разделов данной главы. Наконец, в-четвертых, сообщение определенной информации служит крайне важной цели — обеспечению обратной связи прошедшим тестирование лицам, касающейся их собственных результатов по любому тесту, который с ними проводился. Психологи всегда уделяли большое внимание способам сообщения такой информации в разных контекстах, добиваясь ее максимальной полезности и содержательности. Соответствующие процедуры рассмотрены в главах 17 и 18.
Распространение информации о тестах и тестировании имеет исключительно важное значение. Здесь обнаруживаются как полезные, так и вредные тенденции. Примером последних могут служить излишне поспешные попытки законодательных органов ввести в этой сфере правительственный контроль на местном и федеральном уровнях (Bersoff, 1981,1983; В. Lerner, 1980b). Местные законы, регулирующие раскрытие связанной с тестированием информации, были приняты и начали действовать в конце 1970-х гг. в штатах Калифорния и Нью-Йорк. Закон штата Нью-Йорк, более жесткий по сравнению с калифорнийским, требовал полного раскрытия вопросов тестов и ответов на них в крупномасштабных программах тестирования для приема в высшие учебные заведения.
28 Часть 1. Функции и истоки психологического тестирования
Поскольку такое требование раскрытия информации делает необходимым подготовку новой формы каждого теста при очередном проведении тестирования, это может повлечь за собой любое из целого ряда неблагоприятных последствий. Среди них, помимо менее значимых, — сокращение количества наличных данных тестирования за год, повышение платы, взимаемой с абитуриентов за тестирование, и снижение контроля качества, наблюдаемое как при конструировании тестов, так и при уравнивании оценок по тестам, проводимым в разное время. Стоит также отметить, что лишь очень немногие из прошедших тестирование пользуются возможностью ознакомиться с содержанием тестов и ответами на них, предоставляемую им законом о раскрытии информации, и что результаты повторного тестирования по другой форме теста не улучшаются сколько-нибудь существенно от такого ознакомления (Strieker, 1984). Целей, которые послужили мотивом предложения законов о раскрытии связанной с тестированием информации, можно достичь более эффективным и безвредным способом, а именно путем интенсификации доступных механизмов сообщения информации о тестах.