Ситуационные тесты

Хотя термин «ситуационный тест» получил распространение во время и сразу после Второй мировой войны, соответствующие этому термину тесты были разработаны несколько раньше. По существу, ситуационным называется тест, при котором тестируемый помещается в ситуацию, моделирующую или очень похожую на критериальную ситуацию из «реальной жизни». Таким образом, эти тесты обнаруживают некоторое принципиальное сходство с методиками получения выборочных образцов работы (job-sample techniques), используемых при конструировании тестов профессиональных достижений, и с методиками оценки учебных достижений на основе анализа реальной деятельности (performance-based assessments).' Однако, критериальное поведение, выборочные замеры которого производятся в ситуационных тестах, обычно бывает более изменчивым и сложным. Кроме того, выполнение ситуационных тестов оценивается не на основе способностей и знаний, а в «единицах» таких личностных переменных, как эмоциональные реакции, межличностные отношения и аттитюды.

Тесты для программы «Исследование воспитания характера». Среди самых первых ситуационных тестов — хотя в то время они так не назывались, — были тесты, разработанные X. Хартшорном (Н. Hartshorne), М. Мэем (М. A. May) и их сотрудниками (1928, 1929,1930) для программы «Исследование воспитания характера» (Character Education Inquiry [СЕЦ). Эти тесты предназначались, главным образом, в качестве исследовательских инструментов для использования в обширном проекте по изучению природы и развития характера у детей. Тем не менее эти методы можно приспособить для других целей тестирования, и примеры такого применения уже имеются.

1 Характеристика этих двух классов методик дана в главе 17.

Глава 16. Прочие методики психологической оценки 493

В общем, в методиках CEI использовались знакомые, естественные ситуации из повседневной жизни школьников. Тесты проводились в виде плановых контрольных работ в классе, как часть домашнего задания ученикам, в ходе спортивных соревнований или в групповых играх. Кроме того, дети не сознавали, что их тестируют, кроме случаев, когда в процедуру тестирования включался обычный школьный опрос. В то же время все тесты Хартшорна—Мэя представляли собой тщательно стандартизованные инструменты, дающие объективные количественные показатели.

Тесты CEI предназначались для измерения новым и оригинальным способом таких поведенческих характеристик, как честность, самоконтроль и альтруизм. Большинство из них касались честности и были связаны с ситуациями, в которых детей заставляли поверить в то, что они могут схитрить или обмануть, не боясь быть разоблаченными. Например, в задаче с кругами (Circles Puzzle) ребенка просили, закрыв глаза, поставить метки в каждом из 10 маленьких случайно расположенных кругов. Контрольное тестирование в исключавших подглядывание условиях показало, что получить в сумме трех попыток результат свыше 13 правильных помет практически невозможно. Поэтому показатель свыше 13 регистрировался как доказательство подглядывания и, следовательно, нечестности.

Большинство тестов CEI, как оказалось, обладают хорошей различительной способностью, обеспечивая широкий диапазон индивидуальных различий в показателях. Надежность их также, по-видимому, вполне удовлетворительна. Однако ответы детей обнаружили существенную ситуационную специфичность. Интеркорреляции различных тестов, принадлежащих к одной категории (например, тесты на честность или упорство), оказались очень низкими. Эта специфичность становится вполне понятной, когда мы рассматриваем действие интересов, ценностей и мотивов конкретного ребенка в различных ситуациях. Например, ребенок, у которого сильно выражен мотив выделиться в учебе, не обязательно заинтересован в достижениях на спортивных соревнованиях или в групповых играх. Эти различия в мотивации могли, в свою очередь, сказаться на поведении ребенка в тестах на честность, проводимых в этих различных контекстах. Как в отношении полученных данных, так и в их интерпретации, исследователи, участвовавшие в программе CEI, предугадали на четыре десятилетия раньше то значение специфичности, которое придается этому понятию в наше время. Однако проведенный позднее повторный анализ данных CEI, позволил предположить, что более подходящая для их объяснения модель включает в себя как общий фактор честности, так и ситуационную компоненту, и что есть даже некоторые основания для выделения общего фактора «морального характера» (Burton, 1963; Rushton, 1984).1

Ситуационные тесты в центрах оценки и методики разыгрывания ролей. Ситуационные тесты составляли большую часть программы центров оценки, которую Бюро стратегических служб США (OSS) ввело в период Второй мировой войны. Методика оценки в центрах (assessment-centertechnique) требует, по существу, пребывания в стационаре в течение нескольких дней, когда кандидатов наблюдают и испытывают в различных ситуациях и разными способами. Эта методика представляла собой главную процедуру при отборе кандидатов для службы в военной разведке (Murray, & MacKinnon, 1946; OSS Assessment Staff, 1948). Аналогичные процедуры были впослед-

' Интересный анализ роли, которую исследования Хартшорна и Мэя сыграли в полемике по поводу привития добродетелей и формирования характера, можно найти в работе Vitz (1990).

494

Часть 4. Тестирование личности

ствии внедрены в Институте оценки и исследования личности при Калифорнийском университете, а также включены в ряд крупномасштабных проектов оценки военнослужащих и гражданских специалистов.1

Примером одного типа тестов, разработанных OSS, может служить ситуационный тест «Напряженная ситуация», предназначенный для выборочного изучения поведения человека в условиях стресса, фрустрации или эмоционального срыва. Например перед обследуемым ставится задача, которую нужно выполнить с двумя «помощниками», которые, в действительности, не только не помогают, но и мешают ее выполнению. В ситуационном тесте другого типа использовалась группа без лидера (leaderless group) в качестве средства для оценивания таких характеристик, как умение работать в команде, находчивость, инициатива и лидерство. Предлагаемая в таких тестах задача требует совместных усилий группы испытуемых, причем никто из них не назначается главным и не наделяется особыми полномочиями. Примеры из программы OSS включают ситуацию «Водная преграда» {Brook Situation), требующую переброски людей и оборудования через небольшую речку с максимальной скоростью и безопасностью, и ситуацию «Преодоление укрепления», в которой людей и снаряжение нужно было переправить через две «крепостные стены», разделенные воображаемым рвом.

Вариантом этой методики является Групповая дискуссия без лидера {Leaderless Group Discussion [LGD]). He требующая для своего проведения много времени и особого оборудования, методика LGD широко применялась при отборе таких групп, как армейские офицеры, инспектора и управляющие государственных служб, руководители среднего звена и кандидаты на высшие управленческие должности в промышленности, торговые агенты и руководители отделов сбыта, учителя и социальные работники. По существу дела, группе просто дается тема для обсуждения в течение установленного времени. Проводящие тест специалисты наблюдают и оценивают каждого участника дискуссии по целому ряду критериев, но не участвуют в самой дискуссии. Хотя методика LGD часто использовалась в неконтролируемых и нестандартизован-ных условиях, она стала предметом значительного числа психометрических исследований. Их результаты свидетельствуют о том, что особенно в тех случаях, когда оценщики должным образом подготовлены, LGD может быть эффективным инструментом предсказания эффективности труда, предъявляющего повышенные требования к вербальному общению и решению проблем в ходе дискуссии, а также к умению завоевывать признание среди сослуживцев (Bass, 1954; Greenwood, & McNamara, 1967; Guilford, 1959; Thornton, & Zorich, 1980).

Некоторые ситуационные тесты используют разыгрывание ролей (roleplaying) или импровизацию, для того чтобы вызвать интересующее поведение. Фактически, упоминавшиеся выше групповые дискуссии без лидера, да и некоторые другие ситуационные тесты, можно рассматривать как простые или усложненные варианты разыгрывания ролей. Хотя разыгрывание ролей было одним из методов, используемых в программе оценки OSS, оно имеет более ранние истоки и более широкое применение. Исчерпывающий обзор истории, теоретических основ и разнообразных вариантов метода разыгрывания ролей или импровизации можно найти в работе McReynolds, & DeVoge (1978). Этот метод предполагает, что обследуемому человеку дается прямая инструкция сыграть некую роль либо открыто (с партнерами или без них), либо в

1 Описание этих узловых проектов оценки персонала, начиная с программы OSS, можно найти в книге J. S. Wiggins (1973/1988, chap. И).

Глава 16. Прочие методики психологической оценки 495

форме рассказа о том, что бы он в этом случае делал и/или говорил. Сама ситуация может быть представлена реалистически, как на театральной сцене, либо задана в форме аудио-, видеозаписи или печатного текста.1

Метод импровизации продолжает пользоваться огромной популярностью, хотя и используется по большей части нестрого и всякий раз приспосабливается к конкретной области и локальным условиям. Одно важное приложение этого метода — профессиональная оценка персонала, особенно когда межличностное поведение занимает важное место в должностных обязанностях (Strieker, 1982; Strieker, & Rock, 1990). Особый пример — оценка эффективности консультанта. В этой ситуации за будущим консультантом либо непосредственно наблюдают во время проводимого им сеанса консультирования «подготовленного клиента» (coached client) — штатного сотрудника или сокурсника в роли клиента, излагающего заранее отобранные и стандартизованные проблемы, либо анализируют видеозапись такого сеанса (см., например.Соппог, 1994, р. 72-75; Kelz, 1966; Neufeldt, Iversen, & Juntunen, 1995; A. Williams, 1995). Когда используется видеозапись, проходящий обучение может пронаблюдать свои действия и оценить их, в дополнения к оценкам экспертов и сокурсников.2

Методики оценки в центрах неоднократно доказывали свою эффективность в роли предикторов разнообразных критериев (см., например, Coulton, & Feild, 1995; Howard, & Bray, 1988; Ritchie, 1994; Tziner, Ronen, & Hacohen, 1993). Они широко использовались в областях, где критерии отбора являются сложными, например, в области профессий, связанных с правовым принуждением (J. L. Coleman, 1987; Moore, & Un-singer, 1987). Была даже проведена некоторая работа по адаптации этих методик для оценки глухих претендентов на получение работы (Berkay, 1993). Вследствие широкой применимости таких методик мы не в состоянии сделать какие-то обобщения по поводу валидности любой конкретной методики оценки в центре, — результаты различаются от центра к центру, в зависимости от используемых в них специфических процедур, характера критерия и квалификации экспертов. В общем, коэффициенты валидности обычно оказываются самыми высокими там, где самые надежные методологии — такие, как в программах обследования, использующих несколько способов оценки, включая оценки лиц одной категории с испытуемым, — и где акцент делается на релевантных и доступных прямому наблюдению измерениях (dimensions) поведения (Gaugler, Rosenthal, Thornton, & Bentson, 1987; Shore, Shore, & Thornton, 1992; Thornton, & Byham, 1982). Несмотря на обширные исследования, ряд вопросов в отношении методик оценки в центрах остаются без ответа. Вероятно, самый неприятный вопрос касается невозможности в нескольких исследованиях продемонстрировать конвергентную валидность различных методов оценивания отдельных измерений (dimensions) выполнения тестовых заданий.3

' Мультимедийные и интерактивные компьютерные технологии делают возможным применение совершенно новых способов предъявления реалистичных стимульных ситуаций и вариантов реакций на них со стороны тестируемого. Обсуждение возможностей и проблем в разработке мультимедийных тестов и описание инструментов с использованием интерактивного видео, измеряющих навыки разрешения конфликтов, можно найти в работах Drasgow, Olson-Buchanan, & Moberg (1996) и Olson-Buchanan, Drasgow, Moberg, Mead, & Keenan (1996).

2 В клинической психологии разыгрывание ролей подверглось всесторонней и систематической разработке в рамках нескольких теоретических подходов, и особенно в программах модификации поведения, семейной терапии и супружеского консультирования.

3 Краткие, но информативные критические обзоры исследований в центрах оценки см. в Landy, Shan-kster, Kohler (1994, p. 277-278); Schmidt, Ones, Hunter (1992, 635-637).

496

Часть 4. Тестирование личности

Представления о себе и личные конструкты

Восьмидесятые и девяностые годы свидетельствовали о возрождении интереса к Я-концепции и связанным с ней конструктам (Byrne, 1996; Harter, 1990; Hattie, 1992-Markus, & Wurt, 1987; Oosterwegel, & Oppenheimer, 1993; Wylie, 1989).1 Ряд современных подходов к оценке личности сосредоточены на том, как люди смотрят на себя и других. Такие методы часто отражают влияние феноменологической психологии, в которой основное внимание уделяется тому, как события воспринимаются конкретным человеком. Тем самым описание себя (или самохарактеристика) по праву приобретает первостепенную важность вместо того, чтобы рассматриваться в качестве второстепенных заместителей других поведенческих наблюдений. Внимание исследователей сосредоточивается также на степени самопринятия, проявляемого индивидуумом.

Все рассматриваемые в этом разделе методики нацелены на оценку результатов восприятия человеком себя и других людей. Хотя лишь несколько таких инструментов распространяются специальными издательствами, большинство методик разрабатывалось для конкретных исследовательских проектов и их можно легко найти в соответствующих публикациях. Одни из них представляют интерес, главным образом, вследствие связи с определенными теориями личности или с областью активных, непрекращающихся исследований. Другие находят широкое применение при изучении самых разных проблем.

Тест завершения предложений Вашингтонского университета. Вероятно, можно утверждать, что тесты для измерения Я-концепции по существу не отличаются от опросников типа самоотчетов, обсуждавшихся в главе 13. И все-таки точнее было бы говорить, что стандартизованные самоотчеты фактически являются средством измерения Я-концепции. Интерпретация ответов на опросники с точки зрения самоконцептуализации {self-conceptualization) составляет основу теоретического подхода к развитию личности, сформулированного Дж. Ловингер (Loevinger, 1966a, 1966b, 1976, 1987,1993; Loevinger, & Ossorio, 1958). Пытаясь свести воедино множество разнородных данных из своих собственных и других исследований, Дж. Ловингер высказала предположение о существовании свойства личности, которое она определила как способность концептулизировать себя, или «дистанцироваться» {assume distance) от себя и своих импульсов. Согласно Дж. Ловингер, проявления именно этого свойства в ответах на личностные опросники были описаны в таких терминах, как эффект фасада (facade), оборонительная позиция тестируемого (test-taking defensiveness), установка на ответ (response set), социальная желательность (socialdesirability), молчаливое согласие (acquiescence) и личный стиль ответов (personal style). Подобно некоторым другим психологам, Дж. Ловингер рассматривает такие аттитюды тестируемого не как инструментальные ошибки, которые должны быть исключены, а как главный источник значимой дисперсии в личностных опросниках.

На основе данных из многочисленных источников Дж. Ловингер высказала предположение, что способность формировать Я-концепцию или, иначе говоря, составлять представление о себе, увеличивается с возрастом, уровнем развития интеллекта, образованием и повышением социоэкономического статуса. В самой низкой точке

1 Обзор философских и психологических подходов к «Я» (the self) и связанным с ним процессам, охватывающий период от XVII по XX в. включительно, можно найти в книге Levin (1992).

Глава 16. Прочие методики психологической оценки

497

развития, примером которой служит младенец, индивидуум не способен к самоконцептуализации. По мере развития этой способности ребенок постепенно формирует стереотипизированное, конвенциональное и социально приемлемое представление о себе. Эту стадию Дж. Ловингер считает типично подростковой. По мере продвижения к зрелости индивидуум преодолевает такие стереотипные представления в направлении дифференцированной и реалистичной Я-концепции. На этой стадии люди полностью сознают свои отличительные особенности и признают себя такими, какие они есть в действительности.

Именно такую черту личности как способность к самоконцептуализации, получившую название «развитие эго», или «уровень эго», Дж. Ловингер с сотрудниками и попытались измерить с помощью Теста завершения предложений Вашингтонского университета (Washington University Sentence Completion Test [ WUSCT] — Loevinger, 1985, 1987; Loevinger, & Wessler, 1970; Loevinger, Wessler, & Redmore, 1970). В соответствии с теоретической позицией его авторов постулируется девять уровней развития эго: досоциальный (Presocial), импульсивный (Impulsive), защиты собственных интересов (Self-Protective), конформиста (Conformist), самоанализа (Self-Aware), сознательности (Conscientious), индивидуалистический (Individualistic), автономный (Autonomous) и интегрированный (Integrated). Кроме первого уровня, предшествующего появлению вербальных навыков, остальные уровни можно оценить с помощью WUSCT. Каждое завершенное предложение Получает ранговую оценку уровня эго, на основе которых рассчитывается совокупный показатель по полному тесту. WUSCTоснован на исследованиях, проводившихся с женщинами и девочками-подростками, и только позже был адаптирован для применения к мужчинам и мальчикам. Еще позже тест был переработан и теперь пользователям его доступны сравнимые формы для мужчин и женщин (Loevinger, 1985; Novy, 1992). В новом руководстве по подсчету показателей МУ5СГпредставлены данные как для женской, так и для мужской выборок (Ну, & Loevinger, 1996).

Дальнейшие исследования с применением WUSCT подтвердили его надежность (Novy, & Francis, 1992; Weiss, Zillberg, & Genevro, 1989) и валидность как средства измерения конструкта «развитие эго» в различных выборках (Bushe, & Gibbs, 1990; Novy, Gaa, Frankiewicz, Liberman, & Amerikaner, 1992; Westenberg, & Block, 1993). Особенно плодотворным оказалось применение этого инструмента при изучении половых различий в развитии эго (Cohn, 1991). Один из немногих проблематичных аспектов WUSCT, разделяемый с другими тестами завершения предложений и методиками, допускающими свободные вербальные ответы, заключается в том, что его показатели имеют тенденцию коррелировать с беглостью речи и словарным запасом, а в некоторых случаях могут подвергаться прямому влиянию этих переменных (см., например, Vaillant, & McCullough, 1987; Westenberg, & Block, 1993). Хотя эту возможность нужно учитывать при планировании исследований с WUSCT, равно как и при использовании этого теста с другими целями, она согласуется с его теоретическим обоснованием и не должна делать недействительными получаемые результаты.

Инвентари самооценок и родственные измерительные средства. Во все большей массе исследований конструкт «Я-концепция» сливается с довольно родственными конструктами, обозначаемыми как самооценка (Baumeister, 1993; Bedner, & Peterson, 1995) и воспринимаемая самоэффективность (Bandura, 1982, 1995; Maddux, 1995; Schwarzer, 1992). Главной опорой этих исследований является воздействие самооцен-

498

Часть 4. Тестирование личности

ки индивидуума на эффективность его деятельности. В действительности, самооценка (self-esteem) типично характеризуется как оценочный компонент Я-концепции. На основе длительного, кумулятивного воздействия Такие самооценки могут влиять на развитие когнитивных и аффективных черт. В частности, имеет место широкое согласие по поводу того, что самооценка является определяющим фактором таких психологически важных переменных, как совладающая способность (coping ability) и чувство благополучия (sense of well-being).

Конструкт «самооценка», на первый взгляд, обманчиво прост. Часто предполагается существование общего оценочного отношения к себе, варьирующего от крайне положительного до крайне отрицательного, которое является устойчивым и всецело субъективным по характеру. Измерение самооценки в исследовательских и практических целях традиционно проводилось исходя из этих предположений. И эта традиция стала настолько прочной, что Бласкович и Томака (Blascovich, & Tomaka, 1991) в своем исчерпывающем критическом обзоре средств измерения самооценки и Я-концепции отнесли разработанную Розенбергом (Rosenberg, 1965) Шкалу самооценки (Self-Esteem Scale [SES]) — десятипунктную, прямую (face valid) шкалу типа самоотчета — к наиболее часто используемым средствам такого рода.

Простые и очевидные меры общей самооценки, наподобие SES, кажется, и в самом деле относительно устойчивы во времени и, в ряде случаев, могут быть полезными в качестве способа оценки общего самоуважения (self-regard). Тем не менее, многие исследователи пришли к выводу, что отношение между Я-концепцией и поведением можно продемонстрировать с большей ясностью, если первую рассматривать как иерархический, многомерный конструкт — и оценивать соответственно (Fleming, & Courtney, 1984; Marsh, Byrne, & Shavelson, 1992; Marsh, & Shavelson, 1985; Shavelson, & Bolus, 1982; Shavelson, Hubner, & Stanton, 1976; Uguroglu, & Walberg, 1979). При определенных обстоятельствах единая, глобальная мера самооценки может дать противоречивые результаты или не обнаружить значимых корреляций с другими переменными, в то время как более узко определяемый конструкт, такой как академическая Я-кон-цепция, даст согласующиеся и значимые результаты. Это особенно справедливо в отношении тех, для кого учебные достижения могут не занимать высокого места в личной системе ценностей. В таких случаях общее высокое мнение о себе, необъективно отражающее собственную систему ценностей респондента, может не коррелировать значимо с учебными достижениями или интеллектуальной деятельностью. Кроме того, исследования показывают, что меры «переживаемой самооценки», основанные на самоотчетах (experienced self-esteem), и меры «проявляемой самооценки» (presented self-esteem), основанной на отчетах других, не всегда коррелируют (Demo, 1985).

Подобные результаты и выводы привели к тому, что в последние годы исследователи отошли от одномерных концептуализации самооценки и переключились на изучение ее специфических аспектов, и эта тенденция быстро набирает силу. Особенно много исследований, посвященных взаимосвязи академической Я-концепции и академических достижений у детей и подростков. В этой конкретной области, исследования, использующие сложную методологию типа моделирования структурными уравнениями и лонгитюдных планов, позволяющую анализировать направление причинных связей, подтвердили точку зрения, согласно которой академические Я-концепции связаны с конкретными учебными предметами. Они также показали, что эти Я-концепции коррелируют, предсказывают и влияют на последующие академические достижения (Fortier, Vallerand, & Guay, 1995; House, 1995; Lyon, & MacDonald, 1990; H.W. Marsh, 1990a, 1990b).

Глава 16. Прочие методики психологической оценки

499

При создании новейших средств измерения Я-концепции была использована обширная теоретическая и эмпирическая литература, накопившаяся в этой области. Шкала Я-концепции школьника {Student Self-Concept Scale [SSCS] — Gresham, Elliott, & Evans-Fernandez, 1993), например, является серийно выпускаемым и доступным для приобретения инструментом, при создании которого авторы использовали в качестве отправной точки разработанную А. Бандурой (Bandura, 1982, 1986) теорию самоэффективности, опираясь также на другие теории и результаты исследований. SSCS оценивает три главные области Я-концепции, а именно, академическую, социальную и образ себя (self-image). Внутри каждой из этих областей респонденты указывают не только степень своей уверенности в том, что они способны сделать из перечисленного в пунктах шкалы, но и степень значимости для них каждого из пунктов, а также степень уверенности в том, что, обладая определенными качествами или сделав определенные вещи, они достигнут определенных результатов. SCSS предусматривает получение показателей по подшкалам и совокупного показателя относительно раздельных статистических норм для учащихся мужского и женского пола на каждом из уровней начальной и средней школы.

Аналогичный, хотя и не выпускаемый для свободной продажи, измерительный инструмент — Инвентарь личной и академической Я-концепции (Personal and Academic Self-Concept Inventory [PASCI] — Fleming, & Whalen, 1990) — разрабатывался для оценки учащихся средней школы и студентов колледжей. Он отражает попытки авторов операционализировать и более глубоко исследовать иерархическую, многоаспектную модель Я-концепции, развитую Шейвлсоном (Shavelson) и его коллегами. PASCI представляет собой четвертую редакцию и расширение экспериментальной шкалы, разработанной еще в 1950-х гг. для оценки чувства неадекватности или несостоятельности (feelings of inadequacy).1 Современная версия включает шкалу общей самооценки и шесть дополнительных шкал частных аспектов Я-концепции. Из этих шести две шкалы имеют дело с социальными аспектами Я-концепции (Социальное принятие и Социальная тревожность), еще две имеют отношение к ее физическим аспектам (Внешность и Физические способности), а две оставшиеся являются академическими (Cno-t собности к математике и Вербальные способности). Разумеется, что и SSCS, и PASCI подвержены систематическим ошибкам в ответах, присущим всем стандартизованным самоотчетам и рассмотренным в главе 13. Кроме того, оба этих инструмента еще нуждаются в дополнительном документальном подтверждении их эффективности в тех контекстах, для которых они разрабатывались. Однако, с точки зрения дифференциации конструкта и определения содержания, они достаточно полно отражают достижения в концептуализации и измерении самооценки.

Контрольный список прилагательных. Несколько широко ориентированных методик было разработано специально для оценки представлений человека о самом себе. Одна из них — Контрольный список прилагательных (Adjective Check List [ACL]) — пользуется немалой популярностью и доступна для приобретения. Первоначально сконструированная для использования в научно-исследовательской программе Ин-

1 Бласкович и Томака (Blascovich, & Tomaka, 1991) дают краткий обзор эволюции этого инструмента, также как и многих других мер самооценки. Модель Шейвлсона была одной из наиболее влиятельных в этой области и использовалась также в концептуализации SSCS. Более подробную информацию об этой модели можно найти в Marsh et al. (1992), Marsh & Shavelson (1985), Shavelson, & Bolus (1982), Shavelson et al. (1976).

500

Часть 4. Тестирование личности

ститута оценки и исследования личности (IPAR), эта методика содержит список из 300 расположенных в алфавитном порядке прилагательных от absentminded до zany^ (Cough, 1960; Cough, & Heilbrun, 1983). Респонденты отмечают все прилагательные, которые они считают своими описательными характеристиками.

В своем современном виде ACL предусматривает получение показателей по 37 шкалам, из которых четыре шкалы оценивают установки на ответ. Шкалы, образующие главный кластер, первоначально составлялись с опорой на целесообразность или содержание, путем подбора прилагательных для каждой из 15 потребностей, входящих в перечень Мюррея и охватываемых EPSS (см. гл. 15). Дополнительный набор из 9 «актуальных шкал» (topicalscales) разрабатывался преимущественно путем привязки пунктов к эмпирическому критерию, с тем чтобы получить меры черт, считающихся важными в межличностном поведении. Два оставшихся кластера шкал проектировались с опорой на специализированные теории личности: транзактный анализ Э. Берна (Berne, 1961,1966) и теорию креативности и интеллекта Уэлша (Welsh, 1975b). Главйым источником данных эмпирической валидизации всех 37 шкал, к которому обращались на том или ином этапе разработки каждой шкалы, было непосредственное наблюдение участников программ оценки в центрах IPAR и итоговые рейтинги черт. На основе этих оценок, проведенных в IPAR, и данных других, дополнительных исследований в руководстве к ACL приводятся характеристики личности, соответствующие высоким и низким показателям по каждой шкале.

В качестве исследовательского инструмента A CL применялся к ошеломляющему многообразию проблем, относящихся к таким областям, как психопатология, выбор профессии, творчество, политическая и экономическая деятельность и даже реакции пациентов на устройства для исправления неправильного прикуса и контактные линзы. ACL также использовался для оценки личности исторических персонажей на основе их биографий и публикаций (Welsh, 1975a) и для характеристики неодушевленных объектов, таких как города или автомобили. Позднее эта методика применялась, среди прочих, при изучении возрастных изменений у женщин в середине жизни (Hel-son, &Wink, 1992; Wink, &Helson, 1993; York, & John, 1992) и в исследованиях нарциссизма (Wink, 1991,1992).2

Q -сортировка. Еще одной специальной методикой, пригодной для исследования Я-концепции, является Q-сортировка, первоначально разработанная Стефенсоном (Stephenson, 1953) в целях инструментального обеспечения подхода, известного как Q-методология (см., например, Kerlinger, 1986, chap. 32; McKeown, & Thomas, 1988). В этой методике респонденту дается набор карточек, содержащих какие-либо утверждения или названия черт, которые он должен рассортировать на «кучки» — от «наиболее характерных» до «наименее характерных» для него. Формулировки утверждений или названия черт могут браться из стандартного перечня, но чаще для большего соответствия конкретному случаю их подбирают специально. Чтобы обеспечить равнораспределенность оценок (ratings), используется «принудительно-нормальное» (forced normal) распределение, когда респонденту дается инструкция класть в каждую «кучку» строго определенное количество карточек. Такой расклад можно составить

1 «Рассеянный» и «сумасбродный» соответственно. — Примеч. науч. ред.

2 Что касается рецензий на ACL, см. Teeter (1985) и Zarske (1985). Полную библиографию по ACL Д° 1980 г. включительно можно получить у издателей (Gough & Heilbrun, 1980).

Глава 16. Прочие методики психологической оценки

501

для выборки названий (или формулировок) любого объема, обратившись к таблице нормального распределения. Следует отметить, что, подобно рассмотренной в главе 13 методике вынужденного выбора, Q-сортировкадает ипсативные, а не нормативные данные. Иными словами, респонденты сообщают нам о том, что они считают своими сильными и слабыми качествами, но не о том, насколько сильно, по их мнению, эти качества выражены у них по сравнению с другими людьми или какой-либо внешней нормой.

Q-сортировка использовалась при изучении разнообразных психологических проблем (Bern, & Funder, 1978; Block, 1961/1978; Kogan, & Block, 1991; Ozer, 1993; Rogers, & Dymond, 1954). При тщательном исследовании личности конкретного человека его часто просят провести повторную сортировку того же набора карточек, но в рамках иной системы отсчета. Например, респондент может сортировать карточки применительно к себе самому и к другим людям, скажем своему отцу, матери, жене или мужу. Точно так же он может проводить сортировки применительно к самому себе, но в разных ситуациях, скажем на работе, дома или при взаимодействии с другими людьми. Q-сортировку можно также применять для получения от респондентов сведений о том, какими, по их мнению, они является на самом деле (реальное «Я»), какими их видят другие люди (социальное «Я») и какими они хотели бы быть (идеальное «Я»). Для наблюдения за изменениями, происходящими у индивидуума, Q-сортировки можно получать последовательно на разных стадиях психотерапии — процедура, которой чаще других придерживались приверженцы клиенто-центрирован-ной терапии. В процессе терапии представление о себе меняется в сторону более благоприятных оценок и приближается к идеальному «Я» индивидуума (Rogers, & Dymond, 1954, chap. 4).1

Семантический дифференциал. Эта методика впервые была разработана Ч. Осгу-дом и его сотрудниками (Osgood, Suci, & Tannenbaum, 1957) как инструмент для исследований по психологии значения, хотя его возможности для оценки личности были быстро осознаны. Семантический дифференциал представляет собой стандартизованную, дискретную процедуру для измерения коннотативных значений любого данного концепта у конкретного человека. Каждый концепт оценивается по 7-балльной графической шкале как более тесно связанный с одним или другим из пары полюсов шкалы (рис. 16-2). Для каждого концепта применяется серия — обычно из 15 или более — биполярных шкал, заданных словами, употребляемыми в качестве прилагательных. Корреляционный и факторный анализ первоначального набора из 50 разработанных Осгудом шкал выявил три основных фактора: 1) фактор оценки (Evaluative), с высокими нагрузками по таким шкалам, как хороший—плохой, полезный-бесполезный, чистый—грязный; 2) фактор силы (Potency), обнаруженный в таких шкалах, как сильный—слабый, большой—маленький, тяжелый—легкий; 3) фактор активности (Activity), идентифицированный в таких шкалах, как активный—пассивный, быстрый—медленный, острый—тупой. Фактор «оценки» является самым весомым, объясняющим наибольший процент полной дисперсии.

' Все эти процедуры можно, разумеется, реализовать с ранее описанным Контрольным списком прилагательных ACL или любыми другими методиками для оценки Я-концепции. Вдобавок ко всему, Q-сортировки и контрольные списки могут использоваться для протоколирования оценок наблюдателей, что обсуждается в этой главе позднее.

502

Часть 4. Тестирование личности

Рис. 16-3. Иллюстрация методики семантического дифференциала.

Оценивая концепт «отец», респондент ставит галочку в соответствующем сегменте каждой шкалы.

Обычно число используемых шкал значительно больше

Ответы по семантическому дифференциалу можно анализировать несколькими способами. При количественной обработке оценкам по каждой шкале могут приписываться числовые значения от 1 до 7 или от -3 до +3. Тогда можно измерить общее сходство любых двух концептов для отдельного человека или группы исходя из их положения на всех шкалах. Коннотативные значения всех концептов, оцененных одним человеком, можно проанализировать посредством вычисления «показателя» каждого концепта по трем описанным выше главным факторам. Так, на шкале с числовыми значениями от -3 до +3 концепт «мой брат» у конкретного человека может получить -2 по фактору оценки, 0,1 по фактору силы и 2,7 по фактору активности.

Оцениваемые концепты могут выбираться в соответствии с любой изучаемой проблемой. Респондентов можно, например, попросить оценить: а) самих себя, членов своих семей, друзей, коллег по работе, учителей или общественных деятелей; б) членов различных этнических или культурных групп; в) представителей различных профессий; г) разнообразные занятия, такие как учеба или спортивные игры на открытом воздухе; д) абстрактные понятия, такие как смущение, ненависть, болезнь, мир или любовь; е) названия товаров или торговые марки; ж) радио- или телепрограммы. Семантический дифференциал применялся в самых различных контекстах, в исследованиях по таким разным проблемам, как клиническая диагностика и терапия, выбор профессии, культурные различия и реакции потребителей на товары и торговые марки (Snider, & Osgood, 1969). Кроме того, не прекращается работа по совершенствованию самой этой методики (см., например, Cogliser, & Schriesheim, 1994). Библиография по семантическому дифференциалу насчитывает более 2000 источников.

Репертуарный тест ролевых конструктов. Одной из методик, специально созданных для использования в клинической практике, является разработанный Дж. А. Кел-ли (G. A. Kelly, 1955,1963,1970) Репертуарный тест ролевых конструктов или, сокращенно, Pen-тест (Role Constwct Repertory Test [Rep Test}). Разработка Pen-теста тесно связана с теорией личности Дж. Келли. Основная идея, на которой строится эта теория, состоит в том, что концепты или конструкты, используемые индивидуумом для

Глава 16. Прочие методики психологической оценки

503

восприятия объектов или событий, влияют на его поведение. В ходе психотерапии часто необходимо создать новые конструкты или избавиться от некоторых старых, прежде чем можно будет сделать шаг вперед по пути к исцелению.

Pen-тест разрабатывался с целью помочь клиницисту выявить некоторые важные конструкты клиента в отношении других людей. Хотя существует много способов проведения теста, включая его групповую и индивидуальную версию, он всегда предполагает сортировку стимулов тем или иным способом. Pen-тест дает данные, которые можно представить в виде матрицы, или решетки (grid), и затем провести оценку взаимосвязей между конструктами. Один из более простых вариантов Pen-теста поможет проиллюстрировать его характерные особенности.1 В этом варианте респонденту вначале дается перечень названий ролей (Role Title List) и его просят указать человека, соответствующего каждой из этих ролей в его собственной жизни. В число типичных ролей могут быть включены, например, ваш отец, ваша жена или подруга, учитель, которого вы любили, и человек, с которым вы до последнего времени близко общались, но который, как вам кажется, не любит вас. Затем проводящий тестирование выбирает из числа названных лиц троих и спрашивает: «В каком важном отношении двое из них похожи друг на друга, но отличаются от третьего?» Эта процедура повторяется с множеством других наборов из трех персонажей, в которых ряд персонажей может неоднократно встречаться в разных сочетаниях по три. После того как первичные данные такого рода собраны и представлены в виде решетки, можно провести анализ их импликаций. Несмотря на то что Pen-тест дает богатые качественные данные, было разработано множество количественных способов определения того, насколько важными могут быть выявленные конструкты для конкретного человека. Эти способы варьируют от простой описательной статистики до весьма сложного структурного анализа. Имеется также программное обеспечение содержательного и структурного анализа протоколов (см., например, Winter, 1992).

В своих разнообразных модификациях Реп-тест использовался в большом количестве исследований по проблемам, имеющим отношение к теории личности, социальному познанию, образованию и общению, а также к психотерапии и психологической оценке. Среди показателей, выводимых из классификаций респондентом знакомых и близких ему людей, один получил название когнитивная сложность (cognitive complexity). Этот показатель основан на числе различных конструктов, используемых индивидуумом, и рассматривается в качестве меры когнитивного стиля. Более высокая степень когнитивной сложности означает, что данный человек использует больше измерений (dimensions) и, следовательно, пользуется более дифференцированной когнитивной системой при организации и репрезентации окружающей его среды (Bieri, 1971; Bieri et al., 1966; Goldstein, & Blackman, 1978a, p. 483-487; 1978b). Однако, когнитивная сложность сама является многоаспектным конструктом, и уровень ее корреляции с другими переменными в значительной степени зависит от того, как она концептуализируется и измеряется (см., например, Goldsmith, & Nugent, 1984).

После периода относительного затишья, продолжавшегося до 1980-х гг., интерес к теории личных конструктов Келли вспыхнул с новой силой, и с этого времени ис-

1 Что касается других вариантов проведения теста, см. Bannister, & Mair (1968), Beail (1985), Land-field, & Epting (1987), G. J. Neimeyer (1989), Winter (1992). (На рус. яз. см.: Франселла Ф., Баннис-тер Д. Новый метод исследования личности: Руководство по репертуарным личностным методикам: Пер. с англ. — М.: Прогресс, 1987. — Примеч. науч. ред.)

504

Часть 4. Тестирование личности

следования в рамках этого теоретического подхода продолжали набирать темп (Bannister, 1985; Burr, & Butt, 1992; Epting, & Landfield, 1985; Fransella, & Thomas, 1988; G.J. Neimeyer! & R. A.Neimeyer, 1990; R. A.Neimeyer & G.J.Neimeyer, 1992). Теория Келли к тому же использовалась в качестве одной из опор конструктивизма.1 Поскольку методика Келли идеально подходит для выявления тех неповторяемых способов, какими индивидуум извлекает из опыта и организует смысловые значения, в последние годы Реп-тест сам стал предметом обширных исследований. Сейчас для анализа данных репертуарных решеток исследователи применяют более сложные и тонкие статистические методы, такие как иерархический кластерный анализ и многомерное шкалирование (см., например, Merluzzi, 1991; Ogilvie, & Ashmore, 1991). Эта методика, однако, имеет столь много вариантов, что просто невозможно сделать какие-либо обобщения об ее эффективности и психометрических качествах.

Воспринимаемая среда и социальный климат. Понятие среды {environment) проникает в психологию с многих сторон.2 Мы уже обсуждали важную роль оценок среды наблюдателями в связи с тестированием особых популяций (глава 9) и рассматривали воздействие культурных и ситуационных переменных на проявление когнитивных и аффективных черт (главы 9, И, 12 и 13). С феноменологической точки зрения, оценка различных сред и социального климата путем анализа восприятий {perceptions), сообщенных лицами, находящимися в каждой среде, может к тому же внести существенный вклад в понимание отдельных людей и групп.

Для описания и оценки физических и социальных аспектов среды был разработан ряд измерительных инструментов (критический разбор некоторых из них см. в работе Walsh, & Betz, 1995, chap. 11). Десять Шкал социального климата {Social Climate Scales), разработанные Рудольфом Мусом (Moos, 1974, 1993а, 1993b, 1993c, 1994а; Moos, & Spinrad, 1984) в Стэнфордском университете, входят в число наиболее часто используемых и универсальных инструментов этого типа. Шкалы социального климата применимы к таким видам непосредственного окружения {contexts), как лечебные программы госпитализированных и живущих на попечении общины психически больных, приюты и исправительные учреждения, армейская обстановка, университетские студенческие общежития, классы средней школы, рабочая среда и семья. Кроме того, в число этих шкал входят более общие шкалы оценки групповой среды для проблемно-ориентированных групп, социальных групп и групп взаимной поддержки. Большинство этих шкал состоят из 90 или 100 пунктов с ответами типа «верно—неверно», с помощью которых респондент описывает свое восприятие данной среды. Формулировки пунктов первоначально составлялись таким образом, чтобы «простучать» теоретически выбранные измерения {dimensions) среды, такие как принудительное вовлечение {press toward involvement), автономность или порядок. Окончательные формулировки отбирались эмпирически, исходя из их способности диффе-

1 Конструктивизм представляет собой активное и вызывающее много споров направление в психологии, которое рассматривает людей как проактивных деятелей (agents), стремящихся к осмыслению своего опыта, и провозглашает множественность взглядов на (по)знание — помимо прагматизма (Ger-gen, 1985; Mahoney, 1991; G. J. Neimeyer, 1993; R. A. Neimeyer, & Mahoney, 1995).

2 Фактически, за три десятилетия своего развития учение об окружающей среде и поведении превратилось в междисциплинарную область исследований, быстро разрастающуюся не только в Америке, но и в других частях света (см., например, Bonnes, & Secchiaroli, 1995; Groat, 1995; McAndrew, 1993; Stokols, 1995; Stokols, & Altman, 1987).

Глава 16. Прочие методики психологической оценки

505

ренцировать разные среды, а также на основе внутренней согласованности пунктов в рамках подшкал. Каждая из 10 шкал пересматривалась и обновлялась не менее одного раза (Moos, 1994b; Moos, & Moos, 1994; Trickett, & Moos, 1995). Шкалы социального климата могут предъявляться в трех разных формах, которые измеряют: а) актуальные восприятия реальной среды; б) восприятия идеальной среды; в) ожидания в отношении незнакомой среды определенного типа.

Каждое непосредственное окружение (context) характеризуется 7-10 показателями подшкал, которые оценивают различные измерения, или параметры данной среды. Некоторые из этих измерений повторяются в шкалах для разных видов непосредственного окружения. Фактически, несмотря на широкое разнообразие видов ближайшего окружения, охватываемых Шкалами социального климата, подшкалы для каждого вида окружения полностью укладываются в одну и ту же троичную классификацию, включающую: а) параметры отношений (например, Вовлеченность, Поддержка, Сплоченность членов своего круга); б) параметры личного роста (например, Независимость, Целеустремленность, Соперничество); в) параметры изменения и системы поддержки (например, Порядок и организация, Ясность, Новшество). Примечательно, что Шкалы социального климата разрабатывались для оценки относительно мелких единиц внутри сложных и разнородных образований, например, класса, а не всей школы; лечебной программы, а не всей больницы; университетского общежития, а не всего университета. В этом отношении они дают легче интерпретируемые и менее неопределенные данные, чем те, которые могли бы быть получены в результате комбинированной оценки целой организации. Хотя в Руководстве пользователя (User's Guide), входящего в комплект Шкал социального климата, указаны такие области их применения, как клиническая оценка, организационное консультирование и оценка программ, некоторые критики считают, что эти шкалы более подходят для исследования детерминант и следствий различий в восприятии среды (Allison, 1995; Loyd, 1995; R. О. Mueller, 1995; Saudargas, 1989; Sheehan, 1995; С. R. Smith, 1989).

Отчеты наблюдателей

Обсуждавшиеся до сих пор тесты дают достаточное представление о разнообразии подходов к оценке личности. Однако по поводу большинства из них в лучшем случае можно сказать, что они являются перспективными экспериментальными методиками, пригодными для исследовательских целей, или же полезными измерительными инструментами при условии, что полученные с их помощью данные интерпретируются опытным клиницистом, увязывающим их с другой информацией об индивидууме. К настоящему времени стало очевидным: при оценке личности мы не можем всецело полагаться на стандартизованные тесты. Другие источники информации необходимы нам для того, чтобы развивать или дополнять «наводки» (leads) тестовых показателей, оценивать черты личности, для которых нет пока адекватных тестов, и добывать критериальные данные для разработки и валидизации личностных тестев.

Непосредственное наблюдение за поведением играет существенную роль в оценивании личности, будь то в клинике, в консультационном центре, в классе, в отделе кадров или в любой другой ситуации, требующей индивидуальных оценок. Чтобы показать место подобных наблюдений за поведением в правильной перспективе, напомним, что все тесты сами по себе являются оценками малых выборок поведения.

506

Часть 4. Тестирование личности

Конечно, эти выборки получают и оценивают в стандартизованных условиях. Но очевидные достоинства таких стандартизованных методик мы должны взвесить относительно достоинств гораздо более обширного выборочного изучения поведения благодаря доступности методик наблюдения в естественной обстановке. Если взять предельный случай, то, имей мы подробнейшую биографию какого-либо человека от рождения до 30 лет, нам, вероятно, удалось бы предсказать его последующее поведение с большей точностью, нежели при использовании любого теста или тестовой батареи. Такую запись всех мелочей и обстоятельств его жизни получить практически невозможно, но если бы она все-таки была, то мы могли бы делать прогнозы на основе 30-летней выборки поведения, а не на основе одно- или двухчасовой выборки, обеспечиваемой тестами.

Во всех рассматриваемых в этом разделе методиках информация о том, что делает конкретный человек в естественном окружении на протяжении относительно продолжительных периодов времени, передается через посредство одного или нескольких наблюдателей. Многое делается, чтобы повысить точность и полноту передачи таких наблюдений.

Натуралистическое наблюдение. Методики непосредственного наблюдения за поведением в естественной обстановке наиболее широко использовались специалистами по детской психологии, особенно в работе с детьми дошкольного возраста. Хотя подобные методики применимы к лицам любого возраста, чем младше наблюдаемый, тем менее вероятно, что на его поведение повлияет присутствие наблюдателя или что он покажет «социальный фасад» (socialfacade), затрудняющий интерпретацию поведения. Такие методики наблюдения оказались также полезными в классе, особенно если наблюдателем выступает сам учитель или кто-то еще, кто естественно вписывается в обычную школьную обстановку. Важное применение методик оценки этого типа можно найти в программах модификации поведения, осуществляемых в школах, семьях, детских садах (child care centers), клиниках (clinics), больницах (hospitals) или любых других условиях (Hartmann, & Wood, 1990; Kent, & Foster, 1977; Lalli, & Goh, 1993). Несколько оригинальных приложений натуралистического наблюдения было придумано для социальной психологии (Webb, Campbell, Schwartz, Sechrest, & Grove, 1981) и кросс-культурных исследований (Bochner, 1986).

Метод натуралистического наблюдения представлен широким разнообразием конкретных методик (Adler, & Adler, 1994; Jones, Reid, & Patterson, 1975; Sattler, 1988, chap. 17), начиная от комплексных, долговременных процедур, примером которых может служить дневниковый метод, и кончая узконаправленными, более короткими и лучше контролируемыми способами наблюдения, такими как методика временной выборки (time sampling). Временная выборка включает репрезентативное распределение коротких периодов наблюдения. В зависимости от характера и целей наблюдения такие периоды могут варьировать от долей минут до нескольких часов, причем наиболее часто используемыми являются 5-минутные или еще более короткие периоды. Сами наблюдения могут быть сконцентрированы в рамках одного дня или проводиться с интервалами в несколько месяцев. Они могут охватывать все поведение, имеющее место во время заданного периода, но чаще ограничиваются каким-то конкретным видом поведения, таким как речь, локомоция, общение или агрессия. Контрольные перечни (checklists) того, что следует искать, оказывает существенную помощь при ведении наблюдения. К другим вспомогательным средствам относятся графики на-

Глава 16. Прочие методики психологической оценки 507

блюдений, бланки протоколов, системы кодирования и автоматические регистрирующие устройства (W. W. Тгуоп, 1985, chap. 7, 8). Когда это практически целесообразно, для регистрации наблюдаемого поведения можно воспользоваться магнитофоном, кино- или видеокамерой.1 Сейчас, кроме того, имеются в наличии портативные микрокомпьютерные системы, расширяющие возможности сбора и анализа данных наблюдения (Kratochwill, Doll, & Dickson, 1991, p. 137-141; Repp, & Felce, 1990).

Можно также отметить, что натуралистические наблюдения имеют много общего с ранее обсуждавшимися ситуационными тестами, но при этом принципиально отличаются в двух отношениях: при натуралистических наблюдениях никак не контролируется стимульная ситуация и, по крайней мере, для большей части методик наблюдения характерно использование более обширной выборки исследуемого поведения. Интерес к исследованиям с помощью методик натуралистического наблюдения неуклонно растет, особенно в связи с их экологической валидностью и полезностью при оценке изменений во времени (см., например, Barkley, 1991; Kaminer, Feinstein, & Seifer, 1995).

Интервью. Следует также упомянуть об освященном веками источнике информации, пополняемом методами интервьюирования. Интервьюирование служит разнообразным целям в клинической психологии, консультировании, психологии персонала и образовании. Обсуждение методик, приложений и эффективности интервьюирования, а также исследований процесса интервью можно найти во многих литературных источниках.2 По форме интервью могут варьировать от высокоструктурированных (не отличающихся по сути от зачитывания вслух опросника), через спланированные или направленные интервью, охватывающие заранее выбранные области, до ненаправленных и глубинных интервью, в которых интервьюер просто выступает в качестве «постановщика» (set the stage) и поощряет интервьюируемого говорить как можно непринужденнее. Применение структурированных интервью для клинических и исследовательских целей в области психиатрической диагностики стало уже привычным делом. Эти инструменты стандартизуются и, как правило, предусматривают получение количественных показателей в добавление к диагностическим ярлыкам; поэтому их нужно оценивать по тем же психометрическим стандартам надежности и валидности, которые применяются ко всем тестам. Критический разбор протоколов различных структурированных интервью можно найти в работах Hodges, & Zeman (1993), Kamp-haus, & Frick (1996, chap. 12) и Rogers (1995).

Интервью дают, главным образом, два вида информации. Во-первых, они предоставляют возможность для непосредственного наблюдения довольно ограниченной выборки поведения, проявляемого в ситуации интервьюирования. Например, можно

1 Необыкновенно полным примером оценочной системы, почти целиком основанной на данных наблюдения, служит система, разработанная Готтманом (Gottman, 1994, 1996), для анализа процессов супружеских отношений. Эта система, которая включает элементы, напоминающие методологию оценки в центрах, разрабатывалась и испытывалась в ходе долгосрочной программы исследований, нацеленной на выделение факторов, предсказывающих возможный исход брака.

2 Обширная литература по интервьюированию включает периодические обзоры соответствующих исследований (Eder, Kacmar, & Ferris, 1989; Graves, 1993; Groth-Marnat, 1990, chap. 3; Landy et al., 1994; McDaniel, Whetzel, Schmidt, & Maurer, 1994), а также инструкции и рекомендации по совершенствованию методик интервьюирования, особенно в клинической (Bierman, 1990; Lukas, 1993; Morrison, 1995; Rogers, 1995; Shea, 1998) и кадровой (Fear, & Chiron, 1990; Webster, 1982) работе. Модель обучения базисным навыкам, применимым в большинстве ситуаций интервьюирования, можно найти в работе Gorden (1992).

508

Часть 4. Тестирование личности

отмечать речь индивидуума, его владение языком, манеру держать себя и общаться с незнакомым человеком. Второй — и, возможно, более важной — функцией интервьюирования является выявление фактов, относящихся к истории жизни человека. Прошлые действия и поступки конкретного человека — хороший показатель того, что он может сделать в будущем, особенно если они интерпретируются в свете сопутствующих обстоятельств и комментариев этим человеком своих поступков. Интервью должно касаться не только того, что происходило с данным человеком, но также восприятия им этих событий и их оценок с его стороны в настоящий момент.

От интервьюера этот метод требует высокой квалификации в получении и интерпретации данных. Интервью может привести к ошибочным заключениям, если не удалось выявить важные сведения или если полученные данные были неадекватно или некорректно интерпретированы. Критическим условием успешности интервьюера является чувствительность к идентифицирующим признакам в поведении интервьюируемого или в сообщаемых им фактах. Такие признаки подсказывают направление дальнейшего зондирования других фактов, которые или подтверждают первоначальное предположение, или опровергают его.

Рейтинги. Хотя рейтинги можно использовать во многих ситуациях и для различных целей, в настоящем разделе рассматривается использование рейтингов как оценки индивидуума лицом, высказывающим это мнение, на основе совокупных неконтролируемых наблюдений в повседневной жизни. Подобные субъективные оценки отличаются от натуралистических наблюдений тем, что данные накапливаются случайно и бессистемно; к тому же, рейтинги скорее содержат в себе интерпретацию и суждение, нежели простую регистрацию наблюдений. Однако по сравнению с натуралистическим наблюдением и интервью, рейтинги охватывают более продолжительный период наблюдения и отражают информацию, полученную в условиях, приближенных к реальным. Рейтинги широко используются при оценивании конкретных лиц в системе образования и в промышленности, при сборе критериальных данных для валидизации тестов и во многих других исследовательских целях. После 1970-х гг. существенно возросло количество исследований способов получения субъективных оценок, причем основной упор в них делается на получении всесторонних, систематических сведений и достаточной стандартизации формулировок и процедур для повышения сопоставимости данных разных исследований (Borman, 1991; Landy, & Farr, 1983; Ozer, & Reise, 1994, p. 370-371; Saal, Downey, & Lahey, 1980; Sulsky, & Balzer, 1988).

Многое можно сделать, чтобы повысить точность рейтингов. Обычно трудности возникают из-за неопределенности названий черт (свойств, качеств и т. д.), единиц шкалы или того и другого вместе. Чтобы решить эту проблему, каждую черту следует определять в точных и конкретных терминах, а субъективные оценки должны выражаться в форме, которая бы одинаково интерпретировалась всеми оценщиками. Вместо использования чисел или общих описательных характеристик, в которые различные оценщики вкладывают разный смысл, степень выраженности той или иной черты лучше определять через тщательно сформулированные поведенческие эталоны, или привязки (Dickinson, & Zellinger, 1980). Получены также данные, что относительная точность шкал разного формата может варьировать вместе с характером работы или выполняемой функцией, которые подлежат оцениванию (Borman, 1979; J. M. Feldman, 1986).

Одним hj условий, влияющих на наличность рейтингов, является степень релевантной связи (relevant contact) оценщика с оцениваемым человеком (Freeberg, 1969; Landy.

Глава 16. Прочие методики психологической оценки

509

& Farr, 1980; Paulhus, & Bruce, 1992; Wiggins, & Pincus, 1992, p. 493-496). Недостаточно просто долгое время знать человека; оценщик должен был иметь возможность наблюдать его в таких ситуациях, где могло проявиться изучаемое поведение. Например, если у работника не было возможности принимать решения в ходе выполнения своих функциональных обязанностей, эта способность не может оцениваться его непосредственным начальником. Во многих ситуациях проведения рейтингов желательно оставить время для проверки оценок другими способами, если оценщик не имел возможности наблюдать конкретное свойство у данного человека.

Рейтинги, подобно всем субъективным оценкам, подвержены ряду ошибок.1 Хорошо известный пример — гало-эффект. Традиционно этот феномен определялся как склонность оценщиков поддаваться чрезмерному влиянию какой-то одной приятной или неприятной черты, окрашивающей все их суждения о других чертах индивидуума. Наличие гало-эффекта обычно выводится из наблюдаемых интеркорреляций оценок, данных разным измерениям (dimensions) функционирования оцениваемого человека. Хотя гало-эффект все еще рассматривается традиционным образом и считается большинством исследователей унитарным конструктом, с некоторых пор стали появляться другие возможные способы концептуализации этого феномена и, соответственно, другие подходы к его операциональному определению (Balzer, & Sulsky, 1992; Kozlowski, Kirsch, & Chao, 1986; Murphy, & Anhalt, 1992; Nathan, 1986).2

Другая ошибка, которая может влиять на данные рейтингов, называется ошибкой центральной тенденции (error of central tendency), или тенденции использовать при оценке людей середину шкалы, избегая крайних участков. Еще одной ошибкой, которой подвержены рейтинги, является ошибка снисходительности (leniency error), указывающая на нежелание многих оценщиков давать неблагоприятные оценки. В первом случае оценки группируются в центре шкалы, а во втором — в верхней ее части. Обе ошибки уменьшают рабочую область шкалы и снижают различительную способность оценок. Один из способов исключить эти ошибки состоит в использовании ранжирования или других процедур упорядочивания оценок качества (order-of-meritprocedures), которые вводят принудительное различение оцениваемых лиц и, следовательно, максимизируют информацию, даваемую рейтингами. Впрочем, естественно, что методики, применимые в тех случаях, когда сравнения проводятся внутри одной группы, не допускают прямых сравнений между группами, оцененными разными лицами.

Неожиданным результатом накопившихся исследований ошибок рейтинга стало признание того, что связи между мерами таких ошибок, как гало-эффект или снисходительность, и другими более прямыми показателями точности оценок, отнюдь не просты и часто противоречат интуитивным предположениям. Ряд исследователей, которые провели критический анализ литературы и метаанализ накопленных в этой области данных, пришли к заключению, что теоретические и методологические проблемы, свойственные оценке характеристик функционирования человека путем рейтингов, препятствуют использованию средств измерения таких ошибок, как меры точности рейтингов (Balzer, & Sulsky, 1992; Borman, 1991; Murphy, & Anhalt, 1992; Murphy, & Balzer, 1989).

1 Большая часть исследований ошибок рейтинга публикуется в Journal of Applied Psychology. (Краткая, но информативная сводка типичных ошибок рейтинга дана в кн.: Психология труда: Пер. со словац. — М.: Профиздат, 1979. — С. 153-155. — Примеч. науч. ред.)

2 В некоторых из этих концептуализации гало-эффект рассматривается как зависящий, по крайней мере частично, от оцениваемого и даже специфической ситуации оценивания, а не только от оценщика.

510

Часть 4. Тестирование личности

Тем не менее качество процесса оценивания можно обычно повысить путем специального обучения оценщиков. Исследования проведения рейтингов в различных ситуациях доказали эффективность такого обучения в том, что касается повышения надежности и валидности оценок и снижения распространенных ошибок суждения (Bernardin, & Buckley, 1981; Mclntyre, Smith, & Hassett, 1984; Pulakos, 1986; Stamoulis, & Hauenstein, 1993; Sulsky, & Day, 1992,1994). Следует заметить, однако, что в программы подготовки оценщиков (судей, экспертов и т. д.) включались многие виды и способы обучения, и их результаты различаются по характеру, величине и длительности. Такая подготовка может включать снабжение оценщиков единообразными опорными эталонами оценивания, анализ распространенных ошибок рейтинга и способов минимизации их влияния, а также совершенствование навыков наблюдения. Для конкретных условий и целей проведения рейтингов оптимальным может оказаться использование какого-то одного вида подготовки или их сочетания. Однако улучшение навыков наблюдения, по-видимому, дает благоприятные результаты в большинстве ситуаций.

Клиническая оценка (clinical assessment) часто требует сбора данных от информантов, знакомых с формами поведения оцениваемого индивидуума. Рейтинговые шкалы обеспечивают эффективный способ сбора таких данных и особенно полезны при обследовании детей и подростков. В последние годы был опубликован ряд стандартизованных шкал для получения оценок от родителей и учителей, и теперь эти шкалы доступны для приобретения.1 Один особенно показательный пример — Система для оценки поведения детей (Behavior Assessment System for Children [BASC] — Reynolds, & Kamphaus, 1992). Эта система включает в качестве составных частей данные самоотчета и отчета наблюдателя в дополнение к Оценочным шкалам учителя (Teacher Rating Scales) и Оценочным шкалам родителей (Parent Rating Scales), имеющимся в трех формах, перекрывающих диапазон от дошкольного до подросткового возраста (что касается рецензии, см. R. В. Kline, 1994).

Методика выдвижения кандидатур. Оценочной процедурой, особенно полезной при сборе мнений равных по положению людей, является методика выдвижения кандидатур (nominating technique). Впервые разработанная в социометрии (J. L. Moreno, 1953) для исследования структуры группы, эта методика может использоваться в любой группе лиц, которые находились вместе достаточно долго, чтобы познакомиться друг с другом, например в школьном кЛассе, на небольшом предприятии, в клубе или воинском подразделении. Каждого человека просят выбрать одного или более членов группы, с которым он хотел бы учиться, работать, провести время за ленчем, играть или выполнять любую другую из перечисляемых в методике функций. Респондентов можно попросить выбрать столько членов группы, сколько они пожелают, или же назвать их в определенном порядке (первый, второй, третий выбор), или указать только одно лицо для каждой функции.

Когда эта методика используется для индивидуальной оценки, количество выборов, полученных любым отдельным человеком, может помочь распознать потенциальных лидеров (получивших много выборов), равно как и членов группы, оказавшихся в изоляции (редко или совсем не упоминавшихся). В дополнение можно рассчитать

1 Обсуждение инструментов этого типа и критический разбор некоторых из них можно найти работах Kamphaus, & Frick (1996), Piacentini (1993) и Witt, Heffer, & Pfeiffer (1990).

Глава 16. Прочие методики психологической оценки

511

ряд индексов для более точной оценки каждого члена группы. Проще всего подсчитать сколько раз человека выбрали для выполнения конкретной функции, что можно трактовать как его внутригрупповую оценку. Методику выдвижения кандидатов можно применять по отношению к любому интересующему нас аспекту поведения. Например, респондентов можно попросить назвать человека с наиболее оригинальными идеями, или человека, на которого можно положиться в работе, или лучшего спортсмена. Кроме того, респондентов можно попросить назвать не только того, кто больше всего соответствует данной характеристике, но и того, кто менее всего соответствует ей. В последнем случае при подсчете суммарного показателя каждого члена группы положительным выборам можно было бы приписать весовой коэффициент +1, а отрицательным — весовой коэффициент -I.1 Следует добавить, что оценки индивидуума членами его круга (peer assessments) можно получить и другими способами, такими как ранжирование или рейтинг, но методика выдвижения кандидатур, по-видимому, оказалась наиболее успешной и потому использовалась чаще других.

Независимо от способа, оценивание индивидуума членами его круга обычно выделялось как одна из самых надежных методик получения оценок в столь различных группах, как военнослужащие, руководители среднего звена на промышленных предприятиях, волонтеры Корпуса мира, школьники и студенты (Cole, & White, 1993; Gre-sham, & Little, 1993; Hughes, 1990; Kamphaus, & Frick, 1996, chap. 10; Kane, & Lawler, 1978; J. S. Wiggins, 1973/1988, p. 356-363). При проверке относительно разнообразных практических критериев межличностных отношений, такие оценки обнаружили хорошую текущую и прогностическую валидность. Эти результаты будут понятны, если принять во внимание некоторые особенности такого рода оценок. Во-первых, число людей, дающих оценку друг другу, достаточно велико и включает, в пределе, всех членов группы. Во-вторых, дающие друг другу оценку члены группы чаще всего находятся в наиболее благоприятных условиях для наблюдения за типичным поведением каждого. Они таким образом могут лучше судить о некоторых особенностях межличностных отношений, чем учителя, начальники и другие внешние наблюдатели. В-третьих, что, вероятно, наиболее важно, выборы членов группы — правильные или ошибочные — влияют на их поступки и, следовательно, хотя бы отчасти определяют характер последующих взаимоотношений каждого члены группы с остальными. Можно предположить, что и другие, сопоставимые с исследуемой, группы будут реагировать на оцениваемого индивидуума аналогичным образом. Итак, можно сказать, что социометрические оценки обладают содержательной валидностью в том же смысле, что и выборки действий (work samples).

Контрольные списки и Q -сортировки. Любой инструмент, основанный на самоотчетах, наподобие обсуждавшихся в главах 13 и 14 личностных опросников и инвента-рей интересов, может использоваться наблюдателем при описании других лиц.2 Средства измерения, предназначенные для оценки Я-концепции, особенно подходят для

1 В тех случаях, когда допускаются отрицательные номинации, следует быть особенно осторожным, чтобы предотвратить любые потенциально вредные воздействия методики выдвижения кандидатур на участников исследования. Обсуждение этических вопросов проведения оценки детей и подростков их знакомыми сверстниками см. в Gresham, & Little (1993, p. 174-175) и Kamphaus, & Frick (1996, p. 201-203).

2 Личностный опросник для детей (PIC) и Личностный опросник для юношества (PIY), охарактеризованные в главе 13, являются, фактически, параллельными инструментами, в а) форме стандартизованного самоотчета (PIY) и б) в форме инвентаря наблюдаемого поведения (PIC).

512

Часть 4. Тестирование личности

этих целей. Контрольный список прилагательных (A CL) широко использовался для получения оценок наблюдателей в исследовательской программе IPAR (Gough, & Не-ilbrun, 1983). Специально обученные психологи, которые наблюдали за участником программы в течение двух- или трехдневного периода обследования, отмечали свои оценки, подчеркивая соответствующие прилагательные из контрольного списка.

Q-сортировка также широко использовалась для оценок наблюдателя. Дж. Блок (J. Block, 1961/1978) первоначально разработал Калифорнийскую колоду карт для Q-сортировки (California Q-Sort Deck) в целях обеспечения стандартного языка для всесторонней оценки личности профессионально подготовленными наблюдателями. Эта колода потом издавалась для более широкого распространения и неоднократно пересматривалась для того, чтобы сделать ее язык пригодным как для профессиональных пользователей, так и для пользователей-непрофессионалов. Имеется также ее адаптация — California Child Q-Set — для использования в работе с детьми младшего возраста (что касается рецензии, см. Heilbrun, 1985). Во всех формах стимульный материал состоит из 100 карточек с утверждениями, которые нужно разложить на 9 кучек в строгом соответствии с оговоренным количеством карточек в каждой из них. Утверждения сортируются с точки зрения их «заметности» (salience) у оцениваемого лица, т. е. их важности в определении его неповторимых и существенных характеристик. Таким образом сохраняется типичная для Q-сортировок ипсативная система отсчета, при которой индивидуум не сравнивается с внешними нормативными критериями.

Наличие таких унифицированных наборов для Q-сортировки облегчает сообщение и сравнимость данных, полученных разными наблюдателями. Стандартный комплект Q-сортировки можно также применять при решении ряда других исследовательских задач (см., например, Caspi et al., 1992; Reise, & Oliver, 1994; Wink, 1992). Еще одно применение этой методики связано с индивидуальным оцениванием. В этой связи Дж. Блок (J. Block, 1961/1978) приводит примеры трех «определяющих Q-сорти-ровок», представляющих согласованное оценивание нормального индивидуума и двух психиатрических синдромов, с которыми можно сравнить Q-сортировку этого человека. Аналогичные определяющие Q-сортировки можно разработать для любой интересующей исследователя категории людей.