Использование тестов в сфере труда

Как следует из изложенного выше, правомерность использования тестов при принятии кадровых решений не может рассматриваться независимо от специфических целей, ситуаций и популяций, включенных в данный контекст.1 Следует также отметить, что если мы и можем сгруппировать тесты по типам ради удобства рассмотрения, на практике демаркационные линии между знаниями, способностями (abilities), навыками и чертами личности не всегда столь отчетливы, как нам хотелось бы. Поэтому, возможно, было бы более продуктивно считать трудовую деятельность определяемой потенциальными возможностями реагирования (response capabilities), как предлагали некоторые специалисты (Lubinski, & Dawis, 1992).2 Кроме того, хотя валид-ность теста часто анализируют изолированно, сами тесты едва ли когда-нибудь применяются подобным образом. Большинство кадровых решений, принимаемых с учетом результатов тестирования, опираются на совокупную информацию, полученную с помощью одного или нескольких измерительных инструментов в сочетании с другими способами оценки — такими, как интервью или биографические опросники.3 Помня обо всех этих предуведомлениях, перейдем к рассмотрению использования тестов в сфере профессиональной деятельности.

Роль академического интеллекта. «Интеллект» — широкий термин, имеющий множество определений. То, что включается в состав интеллекта, бесспорно, зависит от конкретной культуры, исторической эпохи и стадии возрастного развития (см. главы 11 и 12). Традиционные тесты интеллекта, напротив, охватывают более ограниченный кластер поддающихся раздельной оценке когнитивных умений и знаний, которые в большинстве своем оказались неплохими прогнозирующими параметрами

' Краткое рассмотрение многообразия переменных, влияющих на успешность взаимодействия «человек х контекст», дано в работе Sternberg (1994a).

Сравнительный анализ понятий skill, ability, aptitude и capacity в контексте психологии труда можно найти в книге «Экспериментальная психология» под ред. С. С. Стивенса (гл. XXXVI. Р. А'. Сишор. Работа и ее моторное исполнение. — С. 1011-1012). — Примеч. науч. ред.

' См. работу Guion (1991), где дан прекрасный обзор процесса оценки, отбора и расстановки кадров, включая данные о валидности и справедливости различных тестов и других типов предикторов.

Глава 17. Основные области применения тестов в наше время

543

уровня учебной и трудовой деятельности в современном индустриальном обществе. Вследствие того что в этот кластер входят, в основном, знания, умения и навыки, приобретенные в ходе обязательного в таком обществе школьного обучения, данный кластер часто описывают как академический интеллект или академические способности. Его содержание сводится, главным образом, к вербальному пониманию, количественному рассуждению и другим аспектам абстрактного мышления.

Хорошо известно, что показатели выполнения тестов академического интеллекта существенно коррелируют с объемом полученного образования. Почему бы тогда вместо применения этих тестов не ввести требования к объему образования, покрывающие квалификационные требования в области такого важного кластера знаний и навыков к кандидату на рабочее место? Однако на этом пути решения проблемы есть определенные трудности. Объем образования является косвенным показателем когнитивного статуса индивидуума на данный момент, и его корреляция с показателями тестов академического интеллекта далека от полной. Сам факт формального обучения еще не гарантирует одинакового усвоения учащимися всего того, чему учили в школе или колледже; более того, знания и умения, обычно формируемые в период формального обучения, могут приобретаться иными путями. Поэтому более справедливо тестировать знания и когнитивные умения конкретного человека, чем принимать или отказывать в приеме на работу на основе объема формального образования.

Среди серийно издаваемых инструментов есть несколько коротких тестов академического интеллекта, которые специально разрабатывались для применения в промышленности. Пример — Кадровый тест Вандерлика (Wonderlic Personnel Test, Inc., 1992). Появившийся в результате переработки одного из первых групповых тестов интеллекта — Самоприменяемых тестов умственных способностей Отиса (Otis Self-Administering Tests of Mental Ability), созданный Вандерликом инструмент представляет собой состоящий из 50 заданий 12-минутный тест. Он включает разные типы заданий с вербальным, числовым и пространственным содержанием, представленные в спиральном формате (in a spiral-omnibus format), и дает только один показатель. За несколько десятков лет использования теста Вандерлика, имеющего множество форм, по нему накоплены обширные нормативные данные для различных профессиональных групп, а его прогнозирующая сила в отношении успешности профессионального обучения и работы получила документальное подтверждение (что касается рецензий, см. Belcher, 1992; Schmidt, 1985; Schoenfeldt, 1985).

Интерес к потенциальной полезности общих тестов академического интеллекта для отбора персонала возобновился благодаря исследованиям, посвященным обобщению валидности (см., например, Hunter, 1986). В частности, были получены данные о том, что тесты вербального и числового рассуждения обладают в той или иной степени прогностической валидностью для широкого разнообразия профессиональных занятий. Вдобавок ко всему, эта валидиость повышается для таких видов работы, которая требует более частого принятия решений и более полной обработки информации. Однако хотя тесты общих когнитивных способностей существенно облегчают предсказание уровня выполнения работы (jobperformance), особенно сложной, точность прогнозов можно повысить путем оценки дополнительных переменных. Главными среди таких переменных являются более специализированные знания и навыки, требующиеся для выполнения конкретных видов работы (в том числе психомоторные навыки и не выраженные в словах, или процедурные знания), а также некогнитивные переменные, такие как свойства темперамента и особенности аттитюдов (см., например,

544

Часть 5. Области применения тестирования

Таблица 17-1 Факторы и комбинированные меры Батареи тестов общих способностей (GATB)

Факторы

G. Общая способность S. Пространственная способ- К. Моторная координация к обучению (General ность (Spatial Aptitude) (Motor Coordination)

Learning Ability)

V. Вербальная способ- Р. Восприятие форм F. Быстрота и ловкость

ность (Verbal Aptitude) (Form Perception) движений пальцев (Finger

Dexterity)

N. Числовая способность Q. Восприятие канцелярских М. Быстрота и ловкость (Numerical Aptitude) документов (Clerical Perception) движений рук (Manual

Dexterity) Комбинированные меры Когнитивная = G + V + N Перцептивная = S + Р + Q Психомоторная = К + F+ М

Факторы    
G. Общая способность к обучению {General Learning Ability) S. Пространственная способность {Spatial Aptitude) К. Моторная координация {Motor Coordination)
V. Вербальная способность (Verbal Aptitude) Р. Восприятие форм {Form Perception) F. Быстрота и ловкость движений пальцев {Finger Dexterity)
N. Числовая способность ( Numerical Aptitude) Q. Восприятие канцелярских документов ( Clerical Perception) М. Быстрота и ловкость движений рук {Manual Dexterity)
Комбинированные меры    
Когнитивная = G + V + N Перцептивная = S + Р + Q Психомоторная = К + F '+ М

Ackerman, 1992; J. P. Campbell, 1990 b; Carroll, 1992; Kanfer, Ackerman, Murtha, & Goff, 1995; Sternberg, Wagner, Williams, & Horvath, 1995). Многие из этих связей были вскрыты и подтверждены в крупномасштабных исследовательских проектах с применением классификационных батарей, используемых в вооруженных силах и в некоторых агентствах по найму гражданских госслужащих.

Батареи способностей для специальных программ.' Батарея тестов общих способностей (General Aptitude Test Battery [GATB]) была разработана Управлением размещения и регулирования рабочей силы США (USES) для использования консультантами по вопросам трудоустройства, работающими в организованных в каждом штате бюро по найму рабочей силы (U. S. Department of Labor, 1970). Кроме того, эту батарею могут получить некоммерческие организации, такие как средние школы, колледжи и тюрьмы. В настоящее время GA ТВ включает 12 тестов, 4 из которых требуют для проведения простого оборудования, а остальные 8 относятся к тестам типа «бумага-карандаш». Проведение всей батареи тестов занимает примерно 2,5 ч. GATB дает показатели по 9 факторам и трем комбинированным мерам, получаемым из этих факторов, — все они перечислены в табл. 17-1.

Применение показателей GATB может строиться в соответствии с двумя различными подходами. Первый основан на использовании множественных критических показателей по наиболее важным способностям, необходимым для относительно однородных групп профессиональных занятий. Одним из механизмов реализации этого подхода является система Паттернов профессиональной пригодности (Occupational Aptitude Pattern [ОАР]), разработанная в 1970-х гг. (U. S. Department of Labor, 1979, 1980). Паттерны профпригодности (ОАР) были подготовлены для более 60 семейств профессий, охватывающих тысячи конкретных специальностей. Для каждой группы профессий были вычислены критические показатели высокого, среднего и низкого уровней пригодности по соответствующим способностям, которые могут использо-

1 Предварительные сведения к этому разделу см. в главах 10 и 11.

Глава 17. Основные области применения тестов в наше время

545

ваться в профконсультировании.1 Второй подход к использованию GATB сложился в результате применения процедур обобщения валидности (VG) к данным из более 500 ранее проведенных USES исследований валидности. Эта процедура, которую стали называть VG-GATB, использует оценки валидности, основанные на соответствующих комбинациях показателей для всех специальностей, входящих в каждое семейство профессий (U. S. Department of Labor, 1983а, 1983с, 1983d). Предсказания строятся на основе трех комбинированных мер — когнитивной, перцептивной и психомоторной, — выводимых из показателей по первичным факторам. Из этих трех мер когнитивная комбинированная оценка дает наибольшие коэффициенты валидности для большинства специальностей, но психомоторная комбинированная мера может улучшать прогноз в тех случаях, когда снижается уровень сложности выполняемых работ (Hunter, & Hunter, 1984).

Благодаря возможностям такой мощной организации, как USES, был накоплен обширный корпус данных no GA ТВ, большей частью подтверждающих исключительную надежность и существенную прогностическую валидность этой батареи (см. рецензии В. Bolton, 1994; Kirnan, & Geisinger, 1986). Однако практика субгруппового нормирования, введенная в 1980-х гг. вместе с VG-GATB для обеспечения сопоставимости относительного количества направлений на работу, полученных белыми, черными и испаноязычными кандидатами, привела к горячим политическим дебатам по поводу справедливости тестирования перед направлением на работу (Hartigan, & Wigdor, 1989). Споры достигли кульминации с принятием закона о гражданских правах от 1991 г. (Civil Rights Act of 1991 — P.L. 102-166), запрещающего установление норм для подгрупп. Этот законодательный акт повлиял на использование Батареи тестов общих способностей и сделал ее будущее неопределенным (L. S. Gottfredson, 1994; Wigdor, & Sackett, 1993 — см. также главу 18). Тем не менее исследовательская программа, включающая разработку двух новых форм и экспериментального образца компьютеризованной адаптивной версии GATB, продолжает выполняться.

Другим важным средством отбора и распределения персонала является Батарея профессиональной пригодности вооруженных сил США (Armed Services Vocational Aptitude Battery [ASVAB]), разработанная совместно для использования во всех родах войск США (Bayroff, & Fuchs, 1970). Эта батарея проводится с учащимися средних школ, проявляющим интерес к военным специальностям, а также со всеми, кто обратился с заявлением о желании поступить на армейскую службу. Современные формы ASVAB включают 10 субтестов, перечисленных в табл. 17-2.2 Квалификационный тест вооруженных сил (Armed Forces Qualification Test [AFQT]) есть не что иное, как комбинированный показатель, используемый всеми армейскими службами в качестве меры общей обучаемости (general trainability) при предварительном отборе по-

1 Группы Батареи тестов специальных способностей {Special Aptitude Test Battery [SATB]) обеспечивают альтернативный механизм для использования критических показателей наряду с GATB. Стратегия мультикритериалыюго отсева более подробно обсуждается в главе 6. В области профотбора, в отличие от профконсультирования, наиболее подходящим применением критических показателей считается предварительный отсев кандидатов по одному или более необходимым для конкретной работы навыкам.

2 Имеется также компьютеризованная адаптивная версия ASVAB {CAT-ASVAB), разработка которой велась с 1979 г. Теперь она введена в эксплуатацию и используется для обработки входных данных по некоторым военным специальностям (Т. L. Russell, Reynolds, & Campbell, 1994). Описание CAT-ASVAB и особенностей ее разработки см. в работе Wiskotf, & Schratz (1989).

546

Часть 5. Области применения тестирования

Таблица 17-2 Батарея профессиональной пригодности вооруженных сил США (ASVAB)

Субтесты ASVAB

Общие естественнонаучные знания ( General Science [ GS] ) Знание слов (Word Knowledge [WK])* Арифметическое рассуждение (Arithmetic Reasoning[AR])* Математические знания (Mathematics Knowledge [MK])*
Понимание параграфов инструкций (Paragraph Comprehension {PC])* Осведомленность в электронике (Electronics Information \ЕГ\) Скорость кодирования (CodingSpeed [CS])** Понимание механических закономерностей (Mechanical Comprehension [МС]) Компетентность в автотехнике (Auto and Shop Information [AS]) Числовые операции (Numerical Operations [NO]) **

* — Составная часть комбинированного показателя AFQT. ** — Скоростной тест.

тенциальных новобранцев. В добавление к этому, каждая из служб объединяет субтесты таким образом, чтобы создавать комбинированные показатели для отбора и распределения персонала в соответствии с собственными нуждами. Например, для боевых подразделений комбинированный показатель образуется путем суммирования показателей следующих субтестов: AR + CS + AS + МС. Стандартные показатели для ASVAB основываются на нормах, полученных при обследовании репрезентативной выборки американских юношей (U. S. Department of Defense, 1982). Факторная структура батареи изучена довольно подробно. Типичные результаты в этом случае свидетельствуют о наличии одного общего фактора, объясняющего 60 % полной дисперсии ASVAB, и четырех групповых факторов, которые неоднократно выделялись разными исследователями (J. R. Welsh, Watson, & Ree, 1990). Эти четыре фактора вместе с субтестами, по которым они имеют наибольшие нагрузки, таковы: 1) Вербальный (WK и PC), 2) Скоростной (N0 и CS), 3) Количественный (AR и МК) и 4) Технический (AS, МС и ЕГ).

Валидность субтестов ASVAB и получаемых на их основе комбинированных показателей исследовалась относительно широкого множества критериев учебной и профессиональной деятельности. Нетрудно догадаться, что коэффициенты валидности существенно различаются в зависимости от типа и количества используемых критериев. В общем, коэффициенты валидности выше для критериев «исполнения» (can-do), таких как общий срок службы в армии и техническая квалификация, чем для критериев «намерения» (will-do), — наподобие служебного рвения, лидерства и личной дисциплины. Как и следовало ожидать, первые оцениваются при помощи мер профессиональных знаний и «реальных дел» (hands-on), тогда как последние — с помощью самооценок и рейтингов военнослужащих, получаемых от их непосредственных начальников и сослуживцев (McHenry, Hough, Toquam, Hanson, & Ashworth, 1990; Т. L. Russell etal., 1994).

Самое обширное исследование ASVAB было начато министерством обороны США в 1980 г. как часть Проекта объединенной комиссии по разработке стандартов измерения выполнения работы и зачисления на военную службу (Joint-Service Job Performance Measurement/Enlistment Standards [/PA/] Project — Wigdor, & Green, 1991 a, 199 lb). Цель этого крупного проекта — разработать устойчивые («робастные») меры выполнения работы для начального уровня военных специальностей и на их основе устано-

Глава 17. Основные области применения тестов в наше время

547

вить значимые и обоснованные стандарты для зачисления добровольцев на службу во все рода войск. Первая фаза реализации проекта JPM дала все основания считать ASVAB хорошим предиктором воспроизводимых с высокой точностью, основанных на выполнении реальной работы признаков профессионального мастерства.1 Кроме того, были получены данные, подтверждающие дифференциальную валидность комбинированных показателей ASVAB в отношении разных специальностей. Однако величина различий в средних показателях между черными и не принадлежащими к меньшинствам испытуемыми оказалась существенно больше по AFQTn бланковым тестам профессиональных знаний, чем по результатам выборочных проверок реальной деятельности (hands-onjob sample tests). Следовательно, существует возможность того, что некоторые из мер ASVAB могут переоценивать величину фактических групповых различий в выполнении работы. Если это предположение подтвердится, данная ситуация будет иметь сходство с некоторыми результатами, полученными при применении GATB (Hartigan, & Wigdor, 1989). К тому же, коэффициенты валидности ASVAB относительно различных критериев оказались достаточно умеренными, чтобы оправдать поиск дополнительных предикторов. Вторая фаза проектаJPM посвящена предварительному исследованию моделей стандартов для зачисления на военную службу, которые, предположительно, должны повысить общую полезность решений по отбору и классификации персонала, — как с точки зрения затрат, так и с позиции уровней выполнения профессиональных функций.

Проект отбора и распределения специалистов сухопутных войск США (Проект А) охватывает другой важный сегмент исследований ASVAB и новых предикторов выполнения профессиональных функций военными специалистами. Проект А возник как позиционный ответ армии на полномочия проекта/РМи, по-видимому, действительно является самым крупным и дорогостоящим из всех когда-либо осуществлявшихся проектов исследований отбора персонала (Schmidt et al., 1992). В дополнение к своему вкладу в построение теории профессиональной деятельности (обсуждавшейся выше в этой главе), Проект А связан с разработкой и оценкой многих новых предикторов, которые выходят за пределы традиционных когнитивных функций ASVAB. Создаваемая в рамках армейского проекта батарея включает компьютеризованные перцептивные и психомоторные тесты; специально сконструированные опросники для оценки параметров личности, темперамента и жизненного опыта, а также инвента-ри интересов (McHenry et al., 1990; N. G. Peterson et al., 1990). Кроме того, масштабность и лонгитюдный характер Проекта А обеспечили беспрецедентную возможность изучения временных изменений валидности (J. P. Campbell, 1990b).2

Тесты специальных способностей. Еще до создания комплексных батарей способностей многие специалисты сознавали, что тесты интеллекта охватывают далеко не все человеческие способности, и вскоре были предприняты попытки заполнить основные пробелы с помощью тестов специальных способностей, предназначенных для измерения более конкретных и практических способностей, наподобие механических.

' Теоретическая и методологическая работа, проведенная в ходе разработки прямых мер выполнения профессиональной деятельности, является ценным вкладом проекта JPM в область измерений, включая измерения в образовании.

2 Заключительный отчет по Проекту А в виде коллективной монографии под совместной редакцией Дж. Кэмпбелла (J. P. Campbell) и Д. Нэппа (D. Кпарр) планируется опубликовать в конце 1990-х гг.

548

Часть 5. Области применения тестирования

Требования профотбора и профконсультирования тоже стимулировали разработку средств измерения пространственных, канцелярских, музыкальных и художественных способностей. С другой стороны, тесты зрения, слуха, мышечной работы (muscular performance) и ловкости движений (motor dexterity) широко использовались при отборе и классификации персонала для промышленных и военных целей.1

Нужно добавить несколько слов о самом понятии специальные способности (special aptitudes). Термин возник в то время, когда главное место в тестировании отводилось измерению общего интеллекта. Технические, музыкальные и другие специальные способности рассматривались, таким образом, лишь как дополнение к IQ при характеристике конкретного человека. Однако с появлением факторного анализа пришло постепенное осознание того, что сам интеллект состоит из ряда относительно независимых способностей, таких как вербальное понимание, числовое рассуждение, оперирование пространственными образами и т. д. Более того, ряд способностей, традиционно рассматриваемых как специальные, например механические и канцелярские, теперь включаются в некоторые комплексные батареи способностей.

Какова же в таком случае роль тестов специальных способностей? Во-первых, такие области, как зрение, слух, ловкость движений (сноровка) и художественное дарование, редко включаются в комплексные батареи способностей. Ситуации, требующие тестирования именно этих областей, являются слишком специализированными, чтобы было оправдано включение подобных тестов в стандартные батареи. Тем не менее тесты специальных способностей используются и в тех областях, которые охватываются комплексными батареями способностей, например, таких как канцелярские и механические способности. В некоторых программах тестирования тесты академического интеллекта объединяют со специально отобранными тестами других, соответствующих целям конкретной программы, способностей. Одна из причин такой практики — получить доступ к широким нормативным и валидационным данным, пригодным для некоторых широко используемых тестов специальных способностей. Другой причиной, бесспорно, является гибкость такого подхода, проявляющаяся не только в . выборе релевантных способностей, но и в полноте измерения каждой отдельной способности для конкретных целей.

Довольно много тестов было придумано для измерения скорости и координации движений, а также других психомоторных навыков (psychomotor skills). Большинство тестов оценивает мануальную ловкость (manual dexterity), и лишь несколько — движения ног или ступней, необходимые при выполнении конкретных видов работы. Некоторые тесты измеряют комбинацию моторики с перцептивными, пространственными и механическими способностями. В основном, эти тесты применялись для отбора персонала в промышленности и армии. Психомоторные тесты, как правило, относятся к типу аппаратурных тестов, хотя несколько их адаптации типа «бумага—карандаш» были разработаны для группового проведения. Примером выпускаемого в настоящее время инструмента для оценки нескольких простых манипулятивных навыков может служить Тест ловкости оперирования мелкими деталями Кроуфорда (Crawford Small Parts Dexterity Test[CSPDT] - Crawford, & Crawford, 1981), общий вид которого показан на рис. 17-2. В первой части этого теста испытуемый должен, пользуясь пинцетом, вставить штифты в точно соответствующие их диаметру отверстия, а затем

1 Обзор методик отбора кадров для специальностей, предъявляющих требования к физическим данным, имеется в работе J. С. Hogan (1992).

Глава 17. Основные области применения тестов в наше время 549

Рис. 17-2. Тест ловкости оперирования мелкими деталями Кроуфорда.

(С любезного разрешения Психологической корпорации)

на каждый штифт надеть маленькую узкую втулку. Во второй части маленькие винтики вставляются в имеющие резьбу отверстия и завинчиваются с помощью отвертки. Показателем является время, затраченное на выполнение каждой части теста.

Что можно сказать об эффективности психомоторных тестов в целом? Наиболее важным моментом, который необходимо отметить при оценивании таких тестов, является высокая степень специфичности измеряемых с их помощью моторных функций. Корреляционный и факторный анализ большого количества моторных тестов не выявил широких групповых факторов, наподобие тех, что обнаружены для интеллектуальных функций (Fleishman, 1975; Fleishman, & Quaintance, 1984, chap. 12). При рассмотрении валидности психомоторных тестов нужно различать сложные моторные тесты, имеющие тесное сходство с конкретной критериальной деятельностью, и тесты простых моторных функций, предназначенные для общего использования. Первые относятся к разрабатываемым по индивидуальному заказу и, как правило, теперь уже компьютеризованным тестам, которые воспроизводят сочетание моторных способностей, предполагаемых критерием, и демонстрируют достаточную валидность. Так, например, было обнаружено, что некоторые тесты ВВС США улучшают предсказание уровня пилотирования после окончания летных курсов (см., например, R. Н. Сох, 1989; Kantor, & Carretta, 1988). Но для большинства целей использовать подобные тесты практически невозможно, так как пришлось бы придумывать очень большое число тестов, согласующихся с многообразными критериями. Что касается серийно выпускаемых и доступных для приобретения моторных тестов, то измеряемые ими функции весьма просты, а их валидность относительно большинства критериев не слишком высока. Вот почему такие тесты предпочтительней применять в составе используемой для отбора батареи, а не в качестве отдельных предикторов.

Тесты механических способностей (mechanical aptitude) охватывают целый ряд функций. Психомоторные факторы входят в некоторые тесты этой категории либо потому, что выполнение теста требует умения быстро манипулировать с тестовым материалом, либо потому, что специальные субтесты для измерения ловкости движений включаются в тот или иной бланковый тест. Перцептивные и пространственные способности также играют важную роль во многих таких тестах. И, наконец, в ряде тестов механических способностей господствующее положение отводится осведомленности в области механики и умению рассуждать на этом материале.

550

Часть 5. Области применения тестирования

Важно отдавать себе отчет в разнообразии функций, объединенных под рубрикой механических способностей, так как каждая функция может быть по-разному связана с другими переменными. Например, тесты на осведомленность в области механики гораздо больше зависят от прошлого опыта обращения с механическими устройствами, чем абстрактные пространственные или перцептивные тесты. Аналогично этому, половые различия могут приобретать прямо противоположный характер при переходе от одной функции к другой. Так, в тестах на мануальную ловкость и перцептивное различение женщины обычно превосходят мужчин; в абстрактных пространственных тестах обычно выявляются небольшие, но значимые средние различия в пользу мужчин, а в тестах на механическое рассуждение и осведомленность в области механики мужчины демонстрируют уже заметное преимущество (Anastasi, 1981c; Hedges, & No-well, 1995).

Среди способностей, включаемых в состав всех комплексных батарей способностей, оказывается пространственная способность (spatial aptitude) или, иначе говоря, способность оперирования пространственными образами. Именно эта способность измеряется тестом «Пространственные отношения» из батареи DAT (см. главу 10), и она же, как оказалось, имеет высокую нагрузку во многих тестах действия и неязыковых тестах общего интеллекта. Одним из самых простых средств измерения этой способности является Пересмотренный миннесотский бланковый тест «Доска форм» (Revised Minnesota Paper Form Board Test [RMPFBT] — Likert, & Quasha, 1995).

Другой важный тип тестов механических способностей касается осведомленности в области механики, механических рассуждений и понимания механических закономерностей. Хотя эти тесты требуют некоторого знакомства с механическими орудиями труда и законами механики, они предполагают у тестируемых лишь такой объем технических знаний, который можно приобрести из повседневного опыта жизни в современных промышленно развитых странах. Некоторые из ранних тестов в этой области требовали от испытуемого собрать из предлагавшихся деталей простые, широко используемые механические устройства. Когда проводится неспециализированное тестирование, вместо таких тестов теперь широко применяются групповые тесты типа «бумага-карандаш». Известным примером этого типа тестов является Тест понимания механических закономерностей Беннетта (Bennett Mechanical Comprehension Test [BMCT] — G. К. Bennett, 1994). Используемые в этом тесте короткие вопросы по картинкам требуют для ответа на них понимания законов механики, применяемых в самых разных ситуациях повседневной жизни. Два ознакомительных задания из этого теста воспроизведены на рис. 17-3.

Тесты, предназначенные для измерения канцелярских способностей (clerical aptitudes), характеризуются общим акцентом на скорости и точности восприятия. Типичный пример — Миннесотский канцелярский тест (Minnesota Clerical Test [MCT] — Andrew, Paterson, & Longstaff, 1979), состоящий из двух раздельно оцениваемых по времени выполнения субтестов: Сравнение чисел (Number Comparison) и Сравнение названий (Name Comparison). В первом субтесте испытуемому даются 200 пар чисел, каждая из которых содержит от 3 до 12 цифр. Если числа, составляющие пару, одинаковы, то испытуемый ставит между ними галочку. Во втором субтесте задача та же самая, но вместо чисел испытуемому предъявляются слова.

Такие относительно однородные тесты, как Миннесотский канцелярский тест, измеряют только один аспект работы служащего. Конторские же работы связаны с выполнением многочисленных функций. Более того, число и конкретное сочетание обя-

Глава 17. Основные области применения тестов в наше время

551

Какой мужчина несет больший вес? (Если одинаковый, отметьте букву С.)

Какой из букв отмечено место в автобусе, где пассажира во время езды будет трясти меньше всего?

Рис. 17-3. Пробные задания из Теста понимания механических закономерностей Беннетта. Ответы записываются на отдельном бланке для ответов

(Воспроизводится с разрешения. Copyright © 1967-1970, 1994 by The Psychological Corporation. All rights reserved)

занностей канцелярского работника сильно зависят от типа и уровня выполняемой им работы. Однако несмотря на такое разнообразие занятий, анализ содержания работы клерка показывает, что относительно большая часть времени тратится на выполнение заданий, требующих скорости и точности в восприятии деталей.

Разумеется, перцептивная скорость и точность необходимы не только в конторской работе. Инспекторам, контролерам, упаковщикам и многим другим работникам промышленных предприятий явно нужна эта способность, хотя большинство таких видов работы теперь выполняют электронные сканеры.

Некоторые тесты канцелярских способностей предполагают сочетание перцептивной скорости и точности с другими функциями, необходимыми для конторской работы. К числу используемых инструментов такого рода относятся тесты выборочных образцов реальной работы (Job-sample tests) для оценки та^сих видов деятельности, как упорядочение материалов по алфавиту, классификация, кодирование и т. п. В добавление к этому, могут включаться некоторые средства измерения вербальных и числовых способностей, которые служат вместо тестов общего интеллекта. Другие тесты канцелярских способностей предполагают оценку таких навыков канцелярской работы, как знание деловой терминологии, владение деловой информацией, умение писать и говорить без ошибок. Некоторые канцелярские тесты более правильно классифицировать как тесты достижений или тесты выборочных образцов работы, так как они измеряют навыки, приобретенные после прохождения специального обучения. Примеры включают тесты стенографических навыков и навыков машинописи, так же как и тесты более современных навыков ввода данных и поиска информации в базах данных, наподобие Теста навыков работы с видеотерминалом Объединения научных исследований (CRTSkills Test by Science Research Associates — SRA, 1990).

552

Часть 5. Области применения тестирования

Быстрый рост использования компьютеров в канцелярской работе привел к тому, что был выпущен целый ряд тестов для оценки способностей, связанных с применением вычислительных машин (computer-related aptitudes). Многие из них предназначались для консультирования или отбора потенциальных операторов-учеников. Примерами могут служить Тесты теоретических и практических знаний в области вычислительной техники (Computer Literacy and Computer Science Tests) и Батарея способностей программиста ЭВМ (Computer Programmer Aptitude Battery)} Хотя эти тесты представляли собой передовые приложения психометрии в области оценки персонала в то время, когда они разрабатывались, — в период между 1960-ми и началом 1980-х гг., — технический прогресс идет настолько быстрыми темпами, что некоторые из этих инструментов уже полностью устарели. Постепенно появляются новые инструменты для тестирования пригодности к обучению и компетентности пользователей конкретного программного обеспечения, скажем, dBASE, WordPerfect и Lotus 1-2-3.2

Наблюдающийся в последнее время прогресс в признании важности когнитивных измерений (dimensions) межличностного и личностного функционирования (см., например, Н. Gardner, 1983; Salovey, & Mayer, 1990), по-видимому, стимулирует разработку стандартизованных объективных инструментов для оценки социальных и эмоциональных аспектов интеллекта в контексте трудовой деятельности. Раньше таких инструментов практически не было, так как адекватность межличностного и личностного функционирования в рабочей обстановке традиционно измерялась либо тестами личности, либо с помощью интервью и методик оценки в центрах. Тест бригадной работы-К5Л (Teamwork-KSA Test) — недавно выпущенная бланковая методика для предсказания эффективности коллективной работы — является одним из первых инструментов в составе этой новой категории тестов. Опираясь на анализ литературы по групповой работе в организациях, авторы данного теста попытались создать стандартизованное средство для измерения знаний, навыков и способностей работников в таких областях, как межличностное взаимодействие и организация собственной деятельности (self-management). Задания с множественным выбором предлагают тестируемым гипотетические вопросы, касающиеся разрешения конфликтов, коммуникации и совместного решения проблем, а также постановки целей, планирования и других навыков самоорганизации (М. J. Stevens, & Campion, 1994). Дальнейшая работа и экспериментирование с этим и другими аналогичными инструментами, безусловно, будут продолжены.

Тестирование личности работнинов

В середине 1980-х гг. Бернардин и Боунас (Bernardin, & Bownas, 1985) отметили, что, в то время как методики оценки личности работников (включая такие ненаучные методы, как анализ почерка) широко использовались в промышленности, научное сообщество на протяжении почти двух десятков лет, по существу, игнорировало эту

1 Что касается критических раэборов этих инструментов, см. Mahurin (1992), Marco (1992), Schafer (1992).

2 Эти и некоторые другие инструменты такого типа можно заказать в SRA Product Group of McGraw-Hill / London House (см. приложение Б). (Перечисленные авторами программные продукты устарели уже на момент выхода оригинала этой книги, а в настоящее время практически вышли из употребления. — Примеч. науч. ред.)

Глава 17. Основные области применения тестов в наше время

553

тему.1 С того времени произошло невиданное оживление исследований в этой области, подсказываемых методологическими и теоретическими достижениями. С методологической точки зрения, применение метаанализа и использование методов причинного моделирования (см. главу 5) стимулировали изучение тех некогнитивных черт, которые могут влиять на выполнение работы. Метаанализ применялся, главным образом, для исследования валидности и полезности конструктов личности в разной обстановке. Методы путевого анализа и моделирования структурными уравнениями (см. главу 5) использовались для изучения взаимосвязей между предикторами и выявления характеристик и состояний, приводящих к различным уровням выполнения работы. Изучается и то, в какой степени некоторые критические переменные, наподобие уровня способности и автономности работы, ослабляют взаимосвязь между личностью и деятельностью. В общем, цели этих исследований идут дальше прогнозирования, к пониманию конструктов и процессов, обусловливающих те значительные вариации, которые имеют место в выполнении работы (Barrick, & Mount, 1991,1993; Hough, Eaton, Dunnette, Kamp, & McCloy, 1990; Matthews, Jones, & Chamberlain, 1992; McHenry etal., 1990; Schmidt & Hunter, 1992; Tett, Jackson, & Rothstein, 1991).

Более изощренные в методологическом отношении исследования последних двух десятилетий оказали существенную поддержку применению тщательно сконструированных личностных тестов при принятии кадровых решений в разнообразных контекстах. Важный и пока еще недостаточно исследованный вопрос касается определения наиболее релевантных измерений {dimensions) личности по отношению к конкретным специальностям или семействам специальностей. Например, в то время как одни виды работы могут требовать высокой степени общительности, другие требуют от работника прямо противоположного качества. Даже такая характеристика, как сознательность {conscientiousness), которая на первый взгляд может показаться желательной для всякой работы, при более глубоком рассмотрении вдруг оказывается связанной с характеристиками, мешающими определенным занятиям, — таким, например, как творческие искания, — по меньшей мере в некоторых отношениях. В результате учета подобных соображений в настоящее время начинает уделяться внимание установлению требований конкретной работы к особенностям темперамента и межличностным характеристикам работников (R. Hogan, Hogari, & Roberts, 1996; Landy et al., 1994).

Значительная часть текущих исследований сосредоточена на выяснении полезности «Пятифакторной модели» структуры личности — в ее различных формах — для предсказания критериев выполнения работы (см. главу 13 и R. Hogan, 1991). Популярность этой модели в исследованиях отбора персонала не случайна. В конце концов, эти пять (± 2) факторов были извлечены в результате обработки обширных массивов данных описания личности и представляют собой модель для характеристики нормальных личностей, в отношении которой существует довольно высокая степень согласия среди специалистов. Каждая из областей, охватываемых данной моделью, широко применима ко всем видам повседневного поведения, включая выполнение профессиональных обязанностей. Например, измерение «Эмоциональная устойчивость»

1 См. работу Anastasi (1985e), где дан исторический обзор тестирования личности в промышленности и рассматриваются основные методологические и практические проблемы, связанные с этой областью тестирования. В работе Kanfer et al. (1995) проведен анализ прогресса в приложении понятии различных теорий личности и интеллекта к области промышленной и организационной психологии.

554

Часть 5. Области применения тестирования

(Emotional Stabilityi)1 является существенным в работе, связанной с быстрым принятием решений в условиях психического напряжения, такой как охрана правопорядка, пилотирование самолета, вождение большегрузных автомобилей и скорая медицинская помощь. С другой стороны, «Уживчивость» (Agreeableness) является совершенно необходимым качеством для любой работы, которая предполагает широкие контакты с людьми. Впрочем, неудивительно, что именно фактор «Сознательность» (Conscientiousness) выявился в целом ряде метааналитических исследований как наиболее универсальный и существенный личностный предиктор выполнения работы (Barrick, & Mount, 1991,1993; Schmidt, & Hunter, 1992). Тем не менее пока еще далеко до полного согласия как по поводу определения конструкта «Сознательность», так и в отношении признания его первенства (см., например, Loevinger, 1994; Tett et al., 1991).

Тесты честности. Применение тестов честности, или правдивости, при принятии решений о приеме на работу приобрело особую актуальность после принятия закона о защите наемных работников от проверки на полиграфе от 1988 г. (Employee Polygraph Protection Act of 1988 [P. L. 100-347]), который запретил использование детекторов лжи при отборе персонала, за исключением особых условий, как при приеме служащих в правительственные организации.2 Одним из очевидных результатов принятия этого закона стало быстрое распространение бланковых средств измерения надежности работников, получивших широкую известность как «тесты честности» (integrity tests). Эти средства, которые обычно представляют собой набор вопросов, нацеленных на выяснение аттитюдов кандидата в отношении воровства и других видов незаконного поведения, а также его возможной замешанности в прошлом в такого рода поведении, сами быстро оказались предметом тщательной проверки в психологии и за ее пределами.3 В одном из наиболее полных исследований тестов честности Оунс, Вис-вешваран и Шмидт (Ones, Viswesvaran, & Schmidt, 1993) провели метаанализ, базирующийся на 665 коэффициентах валидности. Их исследование позволило подсчитать, что средняя рабочая валидность (operational validity) тестов честности в отношении предсказания даваемых начальниками оценок выполнения работы равна 0,41 и свидетельствует о ценности этих тестов для прогнозирования поведения, вредящего работе.

Несмотря на весьма внушительную степень поддержки применения тестов честности, правда, в рамках определенных границ, их использование в отборе персонала — на этапе принятия решений о приеме на работу или отказе — остается проблематичным. В настоящее время специалистов заботит возможная подверженность тестов честно-

' Рассматриваемая как свойство, противоположное нейротизму (эмоциональной неустойчивости). — Примеч. науч. ред.

2 Книга Ликкена (Lykken, 1981) — одна из первых попыток критического анализа проблемы распознавания лжи и применения для этой цели психофизиологических методов, предпринятая психологом. Более краткое и современное рассмотрение проблем применения полиграфов можно найти в работах DePaulo (1994), Honts (1994), Kircher, & Raskin (1992), Lykken (1992), Saxe (1994).

3 См., например, отчет специальной комиссии, сформированной Американской психологической ассоциацией для углубленного изучения данного вопроса (L. R. Goldberg, Grenier, Guion, Sechrest, & Wing, 1991). Более подробную информацию содержит объемный труд К. Мёрфи (К. R. Murphy, 1993), посвященный общей проблеме честности на рабочем месте. Краткое, но содержательное обсуждение проблем тестирования честности при отборе персонала, можно найти в работах Camara, & Schneider (1994), Sackett (1994) и в разделе «Критика» июньского номера журнала American Psychologist за 1995 г.

Глава 17. Основные области применения тестов в наше время

555

сти влиянию натаскивания на «правильные» ответы и сознательным попыткам кандидатов создать о себе благоприятное мнение, а также относительной неэффективностью этих тестов в предсказании конкретных форм вредящего работе поведения, например воровства (см., например, Alliger, Lilienfeld, & Mitchell, 1996; Camara & Schneider, 1995).

Лидерство. Отбор эффективных лидеров1 ставит еще одну важную проблему в области кадровых решений. Лидерство — одно из наиболее востребованных качеств работников, потому что оно включает в себя способность склонить других к работе ради общего дела. Эффективное лидерство может значительно улучшить функционирование организации, тогда как неэффективное лидерство может привести к гибельным последствиям. Поэтому вряд ли стоит удивляться, что многие типы средств измерения когнитивных и личностных переменных, а также методики оценки в центрах, интервью, моделирования и сбора биографических данных применяются для подбора высшего исполнительного руководства. Чаще всего процесс оценки, входящий составной частью в отбор руководителей высшего звена, предполагает использование многих методов и длится несколько часов или даже дней. Такие процедуры очень напоминают клиническое тестирование и обычно являются дорогостоящими.

Очевидно, что в большинстве случаев средства, выделяемые на тщательный отбор лиц, включаемых в кадровый резерв организации и постепенно продвигаемых по служебной лестнице до ключевых руководящих должностей, оказываются весьма скудными по сравнению с потенциальным воздействием этих решений. Возможно, что именно вследствие такого положения дел управленческая некомпетентность достигла невероятных масштабов (R. Hogan, Curphy, & Hogan, 1994). Хотя интерес к изучению разных видов лидерства имеет давнюю историю в прикладной психологии, — о чем свидетельствует обширная литература по данной теме, — многое еще предстоит сделать в области выявления и уточнения эмпирических коррелятов эффективного лидерства. Более полную информацию о средствах измерения лидерства, а также о теоретических и методологических успехах в изучении лидерства в организациях можно найти в работах Bass (1990), Clark, & Clark (1990), Yukl, & Van Fleet (1992).

Инструменты. За исключением методик интенсивной оценки, применяемых при отборе высшего исполнительного руководства крупных организаций и некоторых категорий специалистов, — таких как разведчики, астронавты и т. п., — подавляющему большинству кандидатов, которым в ходе собеседования предлагают пройти тестирование личности, дают для заполнения опросники наподобие тех, что обсуждались в главе 13. Такие опросники, как MMPI, нацеленные на обнаружение психопатологии, все еще применяются для целей предварительного отсеивания в области некоторых профессий, связанных с государственной или военной тайной, но беспокойство общественности по поводу вмешательства в личную жизнь граждан и злоупотребления результатами тестирования привело к преобладающему использованию инструментария, специально разработанного для оценки личности нормальных людей (см. главу 18). Фактически, несколько относительно старых многомерных опросников, построенных в форме стандартизованных самоотчетов и изначально предназначавшихся для нормальных испытуемых, — например, Калифорнийский психологический

' Разумеется, речь идет о формальных лидерах. — Примеч. науч. ред.

556

Часть 5. Области применения тестирования

опросник (CPI), — были недавно пересмотрены с целью сделать их более подходящими для применения в сфере труда. Тем временем был разработан ряд более новых инструментов, наподобие Личностного опросника Хогана (Hogan Personality Inventory [HPI] — R. Hogan, & Hogan, 1992), предназначенных в первую очередь для использования в профконсультировании и профотборе. Другие тесты разрабатываются для решения более узких задач; примеры включают PDI опросник службы работы с покупателями (PDI Customer Service Inventory) и PDI опросник службы по трудоустройству (PDI Employment Inventory). Оба являются инструментами для предварительного отбора наемных служащих, от которых работа потребует в любых ситуациях внушать своими действиями доверие и проявлять стойкость (см. Paajanen, Hansen, & McLellan, 1993).

Заключительные замечания. Достижения современных технологий преобразуют характер труда в направлениях, далеко выходящих за пределы изменений, вызванных промышленной революцией. Быстрый темп этих перемен ставит перед специалистами в области психологии труда проблемы огромной важности, а прогресс в методологии, ставший возможным благодаря новым технологиям, предлагает невиданные ранее возможности для решения таких проблем.1 Теперь, когда появилась возможность проводить масштабные и методологически изощренные исследования, позволяющие получить, в известной степени, окончательные ответы на вопросы, занимавшие специалистов в течение долгого времени, начинают изменяться сами эти вопросы. Между тем влияние компьютерных технологий на тестирование персонала хотя и заметно, но пока еще слабо и носит скорее общий характер (Bartram, 1993; Burke, 1993; Schoen-feldt, & Mendoza, 1991). Некоторые из наиболее интересных приложений современных технологий к тестированию — такие, как интерактивные мультимедийные тесты, — только начинают развиваться (Desmarais, Masi, Olson, Barbera, & Dyer, 1994; Drasgow et al., 1996). В этой области гораздо больше прогнозов и ожиданий, чем реальных достижений. В целом, однако, в настоящее время существует больше чем когда-либо благоприятных возможностей для продуманного применения психологических принципов и методов в такой сфере, как улучшение использования трудовых ресурсов (Bray et al., 1991; Gatewood, & Feild, 1993).