Развитие понятий валидности теста
К самым истокам тестирования восходит применение тестов для оценки усвоенного людьми содержания в конкретных областях знаний или деятельности. В наши Дни это применение тестов представлено переводными и выпускными экзаменами в
134
Часть 2. Технические и методологические принципы
школе и тестами для получения водительских прав или права занимать определенную должность. Этот тип теста, обычно определяемый как тест достижения, принято оценивать путем сравнения его содержания с содержанием той области, для оценки которой он предназначается. Такой дескриптивный (описательный) подход до сих пор сохраняет свое значение в том, что касается валидизации тестов, и будет рассмотрен в первом разделе этой главы.
С переходом тестирования во вторую фазу своего развития, главный интерес переместился с констатации на предсказание. Как разные люди будут реагировать на данную ситуацию сейчас или через какое-то время? Какой будет эта индивидуальная реакция в разных точно'установленных ситуациях? Действие (или деятельность) в той ситуации, для которой хотели предсказать поведение, стали назвать критерием. Соответственно, валидность теста обычно сообщалась в виде коэффициента корреляции между показателями теста и прямой, независимой мерой такого критерия. Этот метод особенно подходит для тестов, применяемых при отборе или распределении лиц, поступающих в учебные заведения, на работу или желающих пройти определенный курс лечения. Так, для теста механических способностей критерием могла бы быть эффективность последующей работы в должности механика, для теста академических способностей — оценки в колледже, а для шкалы нейротизма — оценки товарищей или другие доступные сведения о поведении человека в различных жизненных ситуациях.
Современный этап в истории тестирования отражает две главные тенденции: 1) усилившуюся теоретическую ориентацию и 2) тесное сцепление психологической теории с верификацией посредством эмпирической и экспериментальной проверки гипотез. Эти тенденции носят явный характер в конструировании и валидизации тестов, как, впрочем, и в других областях психологии как науки в целом (Anastasi, 1992a, 1992b, 1995).
Один из результатов этих тенденций — растущее признание ценности конструктов в том, что касается описания и понимания поведения человека. Конструкты — это широкие категории, выводимые логическим путем из общих признаков, свойств или черт, обнаруживающих себя в непосредственно наблюдаемых поведенческих переменных. Сами же конструкты, будучи теоретическими категориями, недоступны непосредственному наблюдению.
Интерес к конструктам привел к введению нового понятия, которое сначала считалось еще одной, третьей, разновидностью понятия валидности теста, именно конст-руктной валидности (AERA, АРА, NCME, 1985; АРА, AERA, NCME, 1974; Cronbach, & МееЫ, 1955). Со временем конструктную валидность признали в качестве основного, базисного понятия валидности, включающего все ее остальные виды, поскольку именно она точно определяет, что измеряется данным тестом. Методы установления содержательной и прогностической валидности относятся к разряду тех многих средств получения информации, которые способствуют более точному определению и пониманию конструктов, оцениваемых тестами. В то же время эти методы дают информацию, представляющую самостоятельную ценность, и сохраняют свое первостепенное значение при оценке применяемых в ряде областей тестов. А потому понятия (и соответствующие термины) содержательной и прогностической валидности остались в употреблении, несмотря на их интеграцию в единое понятие конструктной валидности.
Глава 5. Валидность: основные понятия
135