Независимые переменные. Фактор, изменяемый самим экспериментатором, называется независимой переменной (НП).
1. Организационно-подготовительный этап. Его главное назначение - формулировка цели, задач (проблемы) объекта и предмета исследования. Формулировка проблемы должна привести к осознанию того, что между объективно возникающей в ходе развития психологического знания потребностью и существующими средствами ее достижения имеются противоречия. Задачи исследования представляют собой последовательность фрагментов в общем процессе решения проблемы.
В формулировке цели (или целей) должны просматриваться ожидаемые результаты исследования. Цель - это опережающее отражение действительности, модель будущего результата. Четкость целевой формулировки исключает разбросанность исследования, концентрирует усилия на актуальных вопросах, устанавливает границы исследования, привлекает все наиболее важное и отбрасывает несущественное. Цель - это маяк исследователя в многомерном бушующем океане человеческой психики. По словам Гете, тот, кто хочет достичь многого, должен уметь себя ограничивать.
Пример формулировки цели исследования: «Разработать концепцию групповой готовности операторов к сложным видам совместной деятельности и использовать методические средства этой концепции для оптимизации механизма влияния феномена групповой готовности на успешность совместной деятельности». Из этой формулировки следуют два ограничения:
- из всего спектра проблем совместной деятельности исследованию подлежит лишь один феномен - групповая готовность к деятельности;
- приоритет в исследовании отдается изучению механизмов взаимосвязи групповой готовности с успешностью деятельности.
Объектом исследования выступает какой-либо фрагмент психической реальности (психические процессы, феномены, состояния и др.), например групповая деятельность операторов сложной системы управления, адаптация личности к условиям социальной изоляции и т. п.
Предмет исследования требует погружения в детали, ограничивающие научный поиск рамками выбранного объекта (для групповой деятельности это может быть, например, динамика межличностных отношений в условиях конфликта; для адаптации личности к психологически сложным условиям — механизмы формирования стратегий психологической защиты личности от депрессивных состояний).
2. Этап разработки рабочей гипотезы. Рабочая гипотеза - выраженное в словесной форме утверждение (наиболее вероятный вариант решения задачи), которое еще не имеет достаточного обоснования. У рабочей гипотезы характер рисковый, отчаянный. Ее удел - заглядывать в будущее, балансируя на ниточке, связывающей истину и умозаключение. Поэтому гипотеза как инструмент исследования вызывала бурное негодование И. Ньютона («Гипотез не измышляю!») и И. Канта («Все, что имеет хотя бы малейшее сходство с гипотезой, есть товар запрещенный!»). Но по иронии судьбы именно гипотетические приемы проложили дорогу открытиям, сделанным этими великими мыслителями. Гипотеза - это поводырь исследователя в хитроумном лабиринте психических процессов. Да, она хрупка и наивна, неуклюжа и робка. Но именно она позволяет делать первые шаги к истине. «Гипотезы - это леса, которые возводят перед зданием и сносят, когда здание построено» (И. Гете).
Выдвижение гипотезы - ответственный этап, требующий от психолога не только научной интуиции, но порой и мужества для противостояния своим оппонентам. «Все во всем!» - воскликнул Дж. Бруно, подчеркивая единство мира, и после 8-летнего тюремного заточения был сожжен на костре. Современный психолог, выдвигая гипотезы, не рискует жизнью. Но неверно сформулированная гипотеза может завести в тупик. Все придется начинать сначала, с новой гипотезы.
Научная гипотеза - это карта местности в хитроумном лабиринте психических явлений. Именно она позволяет психологу делать первые шаги в незнакомом мире истин.
Пример гипотезы исследования: «Процесс формирования групповой готовности операторов к сложным видам совместной деятельности заключается в движении совокупного субъекта деятельности к такому активно-действенному состоянию, которое служит регулятором целесообразного и эффективного его поведения в напряженных ситуациях и одновременно уравновешивает требования со стороны совместной деятельности».
3. Методический этап. В соответствии с целью и задачами исследования производится выбор или разработка методического инструментария. Особое внимание уделяется свойствам надежности, валидно-сти и репрезентативности. Здесь же строится общая схема проведения исследования: планируется последовательность процедур, обдумываются возможности по привлечению технических средств и др.
4. Экспериментальный этап предусматривает:
- сбор материала для конкретизации причин появления самой проблемы;
- проведение поисковых (пилотажных) экспериментов для уточнения некоторых деталей;
- подтверждение выдвинутой рабочей гипотезы, т.е. того факта, что исследуемый психический процесс будет развиваться сог ласно принятым гипотетическим положениям.
К этому этапу у психолога особое отношение. Ведь психология - наука преимущественно экспериментальная. Энциклопедическая формулировка эксперимента звучит так: «Это метод познания, при помощи которого в контролируемых и управляемых условиях исследуются явления действительности». Вроде бы строго и лаконично. Но к термину «действительность» следует относиться с позиций здравого смысла. Истинный эксперимент имеет место там, где снимается неопределенность знаний или получаются новые факты и знания.
5. Аналитический этап. Это этап научных размышлений о том, что удалось выявить в ходе исследования. Здесь осуществляется обработка материала методами математической статистики. Наиболее ответственным моментом этого этапа является интерпретация полученных данных. Психолог должен призвать себе на помощь все свои аналитические и синтетические способности, привлечь математические приемы извлечения полезной информации из полученных результатов. Наконец, сделать выводы и рекомендации в соответствии с целями и задачами исследования.
Опыт показывает, что в процессе интерпретации теряется 20-40 % информации, значимой относительно разрабатываемой проблемы. Основные причины такого положения заключаются в следующем. Во-первых, как подчеркивалось, в недооценке роли математики в психологии. Многие психологи еще не осознали очевидного парадокса: самый сложный объект в мире (человек) изучается самыми древними методами (умозаключениями). Во-вторых, психические закономерности пытаются выстроить на одном-един-ствениом испытуемом или на многих, но без статистической оценки доверия к результатам. В-третьих, психология, как выразился один ученый, это невеста без приданого, не имеющая ни своих собственных единиц измерения, ни специфического аппарата обработки данных. «Чужие» же приемы обработки подвергаются критике со стороны психологов, чаще справедливо, но и нередко по причине абсолютной математической неподготовленности и даже бравирования своей математической неграмотностью.
4.4. Экспериментальные переменные и способы их контроля
Для уточнения соотношения всех факторов, входящих в эксперимент, введено понятие «переменная». Выделяют три вида переменных: независимые, зависимые и дополнительные.
Независимые переменные. Фактор, изменяемый самим экспериментатором, называется независимой переменной (НП).
В качестве НП в эксперименте могут выступать условия, в которых осуществляется деятельность испытуемого, характеристика заданий, выполнение которых требуется от испытуемого, характеристики самого испытуемого (возрастные, половые, иные различия испытуемых, эмоциональные состояния и другие свойства испытуемого или взаимодействующих с ним людей). Поэтому принято выделять следующие типы НП: ситуационные, инструктивные и персональные.
Ситуационные НП чаще всего не входят в структуру экспериментального задания, выполняемого испытуемым. Тем не менее они оказывают непосредственное воздействие на его деятельность и могут варьироваться экспериментатором. К ситуационным НП относятся различные физические параметры, например освещенность, температура, уровень шума, а также размер помещения, обстановка, размещение аппаратуры и т. п. К социально-психологическим параметрам ситуационных НП может быть отнесено выполнение экспериментального задания в изоляции, в присутствии экспериментатора, внешнего наблюдателя или группы людей. В.Н. Дружинин указывает на особенности общения и взаимодействия испытуемого и экспериментатора как на особую разновидность ситуационных НП.[58]Этому аспекту уделяется большое внимание. В экспериментальной психологии существует отдельное направление, которое называется «психология психологического эксперимента».
Инструктивные НП связаны непосредственно с экспериментальным заданием, его качественными и количественными характеристиками, а также способами его выполнения. Инструктивной НП экспериментатор может манипулировать более или менее свободно. Он может варьировать материал задания (например, числовой, словесный или образный), тип ответа испытуемого (например, вербальный или невербальный), шкалу оценивания и т. п. Большие возможности заключаются в способе инструктирования испытуемых, информирования их о цели экспериментального задания. Экспериментатор может изменять средства, которые предлагаются испытуемому для выполнения задания, ставить перед ним препятствия, использовать систему поощрений и наказаний в ходе выполнения задания и т. д.
Персональные НП представляют собой управляемые особенности испытуемого. Обычно в качестве таких особенностей выступают состояния участника эксперимента, которые исследователь может менять, например различные эмоциональные состояния или состояния работоспособности-утомления.
Каждый испытуемый, участвующий в эксперименте, обладает множеством уникальных физических, биологических, психологических, социально-психологических и социальных признаков, которыми экспериментатор управлять не может. В некоторых случаях следует считать эти неуправляемые признаки дополнительными переменными и применять к ним способы контроля, о которых будет рассказано ниже. Однако в дифференциально-психологических исследованиях при применении факторных планов неуправляемые персональные переменные могут выступать в качестве одной из независимых переменных (подробно о факторных планах см. 4.7).
Исследователи различают также разные виды независимых переменных. В зависимости от шкалы представления можно выделить качественные и количественные НП. Качественным НП соответствуют различные градации шкал наименований. Например, эмоциональные состояния испытуемого могут быть представлены состояниями радости, гнева, страха, удивления и т. п. Способы выполнения заданий могут включать наличие или отсутствие подсказок испытуемому. Количественные НП соответствуют ранговым, пропорциональным или интервальным шкалам. Например, время, отведенное на выполнение задания, количество заданий, размер вознаграждения по результатам решения задач могут быть использованы как количественные НП.
В зависимости от количества уровней проявления независимых переменных различают двухуровневые и многоуровневые НП. Двухуровневые НП имеют два уровня проявления, многоуровневые – три или более уровней. В зависимости от количества уровней проявления НП строятся различные по сложности экспериментальные планы.
Зависимые переменные. Фактор, изменение которого является следствием изменения независимой переменной, называется зависимой переменной (ЗП). Зависимая переменная – это компонент в составе ответа испытуемого, который непосредственно интересует исследователя. В качестве ЗП могут выступать физиологические, эмоциональные, поведенческие реакции и другие психологические характеристики, которые можно зарегистрировать в ходе психологических экспериментов.
В зависимости от способа, с помощью которого можно зарегистрировать изменения, выделяют ЗП:
S наблюдаемые непосредственно;
S требующие физической аппаратуры для измерения;
S требующие психологического измерения.
К ЗП, наблюдаемым непосредственно, относятся вербальные и невербальные поведенческие проявления, которые четко и однозначно могут быть оценены внешним наблюдателем, например отказ от деятельности, плач, определенное высказывание испытуемого и т. п. К ЗП, требующим физической аппаратуры для регистрации, относятся физиологические (пульс, величина артериального давления и т. д.) и психофизиологические реакции (время реакции, латентное время, длительность, скорость выполнения действий и т. п.). К ЗП, требующим психологического измерения, относятся такие характеристики, как уровень притязаний, уровень развития или сформированности тех или иных качеств, форм поведения и т. п. Для психологического измерения показателей могут быть использованы стандартизированные процедуры – тесты, опросники и т. п. Некоторые поведенческие параметры могут быть измерены, т. е. однозначно распознаны и интерпретированы только специально обученными наблюдателями или экспертами.
В зависимости от количества параметров, входящих в зависимую переменную, различают одномерные, многомерные и фундаментальные ЗП. Одномерная ЗП представлена единственным параметром, изменения которого и изучаются в эксперименте. Примером одномерной ЗП может служить скорость сенсомоторной реакции. Многомерная ЗП представлена совокупностью параметров. Например, внимательность может оцениваться объемом просмотренного материала, количеством отвлечений, числом правильных и ошибочных ответов и т. д. Каждый параметр может фиксироваться независимо. Фундаментальная ЗП представляет собой переменную комплексного характера, параметры которой имеют некоторые известные отношения между собой. В этом случае одни параметры выступают как аргументы, а собственно зависимая переменная – как функция. Например, фундаментальное измерение уровня агрессии может рассматриваться как функция ее отдельных проявлений (мимических, вербальных, физических и др.).
Зависимая переменная должна обладать такой базовой характеристикой, как сензитивность. Сензитивность ЗП – это ее чувствительность к изменению уровня независимой переменной. Если при изменении независимой переменной зависимая переменная не изменяется, то последняя несензитивна и проводить эксперимент в таком случае не имеет смысла. Известны два варианта проявления несензитивности ЗП: «эффект потолка» и «эффект пола». «Эффект потолка» наблюдается, например, в том случае, когда предъявляемая задача настолько проста, что ее выполняют все испытуемые независимо от возраста. «Эффект пола», напротив, возникает в том случае, когда задание настолько сложно, что с ним не может справиться ни один из испытуемых.
Существуют два основных способа фиксации изменений ЗП в психологическом эксперименте: непосредственный и отсроченный. Непосредственный способ применяется, например, в экспериментах по кратковременному запоминанию. Экспериментатор непосредственно после повторения ряда стимулов фиксирует их количество, воспроизведенное испытуемым. Отсроченный способ используется в том случае, когда между воздействием и эффектом проходит определенный промежуток времени (например, при определении влияния количества заученных иностранных слов на успешность перевода текста).
Дополнительные переменные (ДП) – это сопутствующая стимуляция испытуемого, оказывающая влияние на его ответ. Совокупность ДП состоит, как правило, из двух групп: внешних условий опыта и внутренних факторов. Соответственно их принято называть внешними и внутренними ДП. К внешним ДП относят физическую обстановку опыта (освещенность, температурный режим, звуковой фон, пространственные характеристики помещения), параметры аппаратуры и оборудования (дизайн измерительных приборов, рабочий шум и т. п.), временные параметры эксперимента (время начала, продолжительность и др.), личность экспериментатора. К внутренним ДП относят настроение и мотивацию испытуемых, их отношение к экспериментатору и опытам, их психологические установки, склонности, знания, умения, навыки и опыт в данном виде деятельности, уровень утомления, самочувствие и т. п.
В идеале исследователь стремится все дополнительные переменные свести на нет или хотя бы к минимуму, чтобы выделить «в чистом виде» связь между независимой и зависимой переменными. Существует несколько основных способов контроля влияния внешних ДП: 1) элиминация внешних воздействий; 2) константность условий; 3) балансировка; 4) контрбалансировка.
Элиминация внешних воздействий представляет собой наиболее радикальный способ контроля. Он состоит в полном исключении из внешней среды каких бы то ни было внешних ДП. В лаборатории создаются условия, изолирующие испытуемого от звуков, света, вибрационных воздействий и т. п. Наиболее ярким примером может служить эксперимент по сенсорной депривации, проводимый на добровольцах в специальной камере, полностью исключающей поступление каких-либо раздражителей из внешней среды. Следует отметить, что элиминировать воздействия ДП практически невозможно, да и не всегда нужно, так как результаты, полученные в условиях элиминации внешних воздействий, вряд ли могут быть перенесены в реальность.
Следующий способ контроля – создание константных условий. Суть этого способа состоит в том, чтобы сделать воздействия ДП постоянными и одинаковыми для всех испытуемых на протяжении всего опыта. В частности, исследователь стремится сделать постоянными пространственно-временные условия эксперимента, технику его проведения, оборудование, предъявление инструкции и т. д. При тщательном применении этого способа контроля удается избежать больших погрешностей, однако проблема переноса результатов эксперимента в условия, сильно отличающиеся от экспериментальных, остается проблематичной.
В тех случаях, когда нет возможности создать и поддерживать постоянные условия на протяжении всего эксперимента, прибегают к способу балансировки. Этот способ применяется, например, в ситуации, когда внешняя ДП не поддается идентификации. В этом случае балансировка будет состоять в использовании контрольной группы. Исследование контрольной и экспериментальной групп проводится в одних и тех же условиях с той лишь разницей, что в контрольной группе отсутствует воздействие независимой переменной. Тем самым изменение зависимой переменной в контрольной группе обусловлено лишь внешними ДП, а в экспериментальной – совместным действием внешних дополнительных и независимой переменной.
Если внешняя ДП известна, то балансировка заключается в воздействии каждого ее значения в сочетании с каждым уровнем независимой переменной. В частности, такая внешняя ДП, как пол экспериментатора, в сочетании с независимой переменной (пол испытуемого) приведет к созданию четырех экспериментальных серий:
1) мужчина-экспериментатор – мужчины испытуемые;
2) мужчина-экспериментатор – женщины испытуемые;
3) женщина-экспериментатор – мужчины испытуемые;
4) женщина-экспериментатор – женщины испытуемые.
В более сложных экспериментах может применяться балансировка нескольких переменных одновременно.
Контрбалансировка как способ контроля внешних ДП практикуется чаще всего тогда, когда эксперимент включает в себя несколько серий. Испытуемый оказывается в разных условиях последовательно, однако предыдущие условия могут изменять эффект воздействия последующих. Для ликвидации возникающего в этом случае «эффекта последовательности» разным группам испытуемых экспериментальные условия предъявляются в различном порядке. Например, в первой серии эксперимента первой группе предъявляется решение интеллектуальных задач от более простых к более сложным, а второй – от более сложных к более простым. Во второй серии, напротив, первой группе предъявляется решение интеллектуальных задач от более сложных к более простым, а второй – от более простых к более сложным. Контрбалансировка применяется в тех случаях, когда есть возможность проведения нескольких серий эксперимента, однако следует учитывать, что большое число попыток вызывает утомление испытуемых.
Внутренние ДП, как указывалось выше, – это факторы, кроющиеся в личности испытуемого. Они оказывают весьма значительное влияние на результаты эксперимента, их воздействие достаточно трудно проконтролировать и учесть. Среди внутренних ДП можно выделить постоянные и непостоянные. Постоянные внутренние ДП в течение эксперимента существенно не изменяются. Если эксперимент проводится с одним испытуемым, то постоянными внутренними ДП будут его пол, возраст, национальность. К этой группе факторов также можно отнести темперамент, характер, способности, склонности испытуемого, его интересы, взгляды, убеждения и другие компоненты общей направленности личности. В случае проведения эксперимента с группой испытуемых эти факторы приобретают характер непостоянных внутренних ДП, и тогда для нивелировки их влияния прибегают к специальным способам формирования экспериментальных групп (см. 4.6).
К непостоянным внутренним ДП относятся психологические и физиологические характеристики испытуемого, которые могут либо значительно изменяться по ходу эксперимента, либо актуализироваться (или исчезать) в зависимости от целей, задач, вида, формы организации эксперимента. Первую группу таких факторов составляют физиологические и психические состояния, утомляемость, привыкание, приобретение опыта и навыков в процессе выполнения экспериментального задания. В другую группу входят установка на данный опыт и данное исследование, уровень мотивации к данной экспериментальной деятельности, отношение испытуемого к экспериментатору и своей роли подопытного и т. п.
Для уравнивания эффекта воздействия этих переменных на ответы в разных пробах существует ряд способов, успешно применяемых в экспериментальной практике.
Для устранения так называемого серийного эффекта, в основе которого лежит привыкание, используется особая очередность предъявления стимулов. Эта процедура получила название «уравновешенного чередного порядка», когда стимулы разных категорий предъявляются симметрично относительно центра стимульного ряда. Схема такой процедуры выглядит так: А В В А, где А и В – стимулы разных категорий.
Чтобы предупредить влияние на ответ испытуемого тревожности или неопытности, проводятся ознакомительные или предварительные эксперименты. Их итоги не учитываются при обработке данных.
Для предупреждения изменчивости ответов из-за накопления опыта и навыков в процессе эксперимента испытуемому предлагается так называемая «исчерпывающая практика». В результате такой практики у испытуемого до начала собственно эксперимента вырабатываются устойчивые навыки, и в дальнейших экспериментах показатели испытуемого от фактора накопления опыта и навыков уже напрямую не зависят.
В тех случаях, когда необходимо свести к минимуму влияние на ответ испытуемого утомления, прибегают к «методу вращения». Суть его состоит в том, что каждой подгруппе испытуемых предъявляется определенная комбинация стимулов. Совокупность таких комбинаций полностью исчерпывает все множество возможных вариантов. Например, при трех типах стимулов (А, Б, В) каждому из них представляется первое, второе и третье место в предъявлении испытуемым. Таким образом, первой подгруппе стимулы предъявляются в порядке АБВ, второй – АВБ, третьей – БАВ, четвертой – БВА, пятой – ВАБ, шестой – ВБА.
Приведенные способы процедурного уравнивания внутренних непостоянных ДП применимы как для индивидуальных, так и для групповых экспериментов.
Установка и мотивация испытуемых как внутренние непостоянные ДП должны поддерживаться на одном и том же уровне во время всего опыта. Установка как готовность воспринимать раздражитель и отвечать на него определенным образом создается через инструкцию, которую экспериментатор дает испытуемому. Чтобы установка была именно такой, какая требуется по задаче исследования, инструкция должна быть доступна испытуемым и адекватна задачам эксперимента. Однозначность и легкость понимания инструкции достигаются ее ясностью и простотой. Во избежание вариативности предъявления инструкцию рекомендуется зачитывать дословно или давать в письменном виде. Поддержание исходной установки контролируется экспериментатором путем постоянного наблюдения за испытуемым и корректируется путем напоминания при необходимости соответствующих указаний инструкции.
Мотивация испытуемого рассматривается главным образом как интерес к данному эксперименту. Если интерес отсутствует или слаб, то трудно рассчитывать на полноценность выполнения испытуемым предусмотренных в эксперименте заданий и на надежность его ответов. Слишком высокий интерес, «перемотивация», также чревата неадекватностью ответов испытуемого. Поэтому для получения исходно приемлемого уровня мотивации экспериментатор должен самым серьезным образом подойти к формированию контингента испытуемых и подбору стимулирующих их мотивацию факторов. В качестве таких факторов могут выступать состязательность, различные виды вознаграждения, интерес к своим показателям, профессиональный интерес и др.
Психофизиологические состояния испытуемых рекомендуется не только поддерживать на одном уровне, но и оптимизировать этот уровень, т. е. испытуемые должны находиться в «нормальном» состоянии. Следует убедиться, что до проведения опыта у испытуемого не было сверхзначимых для него переживаний, у него достаточно времени для участия в эксперименте, он не голоден и т. п. Во время проведения эксперимента не следует излишне возбуждать или подавлять испытуемого. Если же эти условия выполнить не удается, то проведение эксперимента лучше отложить.
Из рассмотренных характеристик переменных и способов их контроля становится понятой необходимость тщательной подготовки эксперимента при его планировании. В реальных условиях экспериментирования добиться 100 %-го контроля всех переменных невозможно, однако различные психологические эксперименты значительно отличаются друг от друга степенью контроля переменных. Рассмотрению вопроса оценки качества эксперимента посвящен следующий раздел.
2.3. Реальный эксперимент и "эксперимент полного соответствия".
Реальный эксперимент отличается как от эксперимента идеального, так и от самой реальности, которую он призван моделировать. Это отличие фиксируется таким понятием, как "внешняя валидность" психологического эксперимента.
Внешняя валидность определяет, в какой мере результаты, полученные в эксперименте, будут соответствовать жизненной ситуации, послужившей "первообразом" для эксперимента. Кроме того, внешняя валидность характеризует возможность обобщения, переноса результатов, полученных в эксперименте, на весь класс жизненных ситуаций, к которому принадлежит "первообразная", и на любые другие.
Надо сказать, что внешняя валидность имеет особое значение на эмпирической стадии развития науки. В принципе возможны такие эксперименты, которые не соответствуют никаким реальным жизненным ситуациям, а служат лишь для проверки гипотез, источником которых является развитая теория. В развитых науках стремятся избегать "прямого замыкания" экспериментальный результат - реальность, так как понятно, что эксперимент строится исходя из требований проверяемой теории, а не из требований соответствия реальности. Моделирование некоторых условий, например, в экспериментах по сенсорной депривации или выработке классических условных рефлексов не соответствует никакой жизненной реальности. При условии, если под реальностью понимать то, что было, а не то, что потенциально может быть. Поэтому многостраничные рассуждения такого солидного автора, как Готтсданкер, по поводу "экспериментов полного соответствия" или "экспериментов, улучшающих реальность", кажутся надуманными и архаичными.
Но нельзя отрицать значение "внешней валидности" для эксперимента, если учитывать общее состояние психологической науки, а не "передовой" край психологической теории.
Внешняя валидность иногда трактуется как характеристика эксперимента, определяющая возможность переноса (обобщения) результатов на различные времена, места, условия и группы людей (или животных). Однако возможность переноса является следствием двух причин: 1) соответствия условия эксперимента его "первообразной" жизненной ситуации ("репрезентативность" эксперимента); 2) типичности самой "первообразной" ситуации для реальности ("репрезентативность" ситуации). Выбранная для моделирования в эксперименте ситуация может быть совершенно нерепрезентативной с точки зрения жизни той группы испытуемых, которая участвует в эксперименте, или является редкой и нетипичной.
Внешняя валидность, как определяет ее Готтсданкер, влияет прежде всего на достоверность выводов, которую дают результаты реального эксперимента, по сравнению с экспериментом полного соответствия. Для достижения высокой внешней валидности нужно, чтобы уровни дополнительных экспериментальных переменных соответствовали их уровням в реальности. Эксперимент, который не имеет внешней валидности, считается неверным. Добавим, что он неверен, если источником гипотезы является реальность, обыденное знание, а не теория. Эксперимент, не соответствующий реальности, может обладать совершенной внутренней и операциональной валидностью. Другое дело, что прямой перенос его результатов в реальность невозможен без учета влияния на зависимую переменную помимо независимой и дополнительных переменных.
Очевидно, что достижение полной внешней валидности невозможно в принципе, поэтому любое "чистое" аналитическое исследование является внешне невалидным. Вместе с тем рекомендуется максимально учитывать влияние дополнительных переменных на экспериментальный эффект, так как неизвестно, когда будет построена теория для их объяснения, а данные, возможно, придется использовать на практике.
Заботу о внешней валидности эксперимента особо проявляют исследователи, работающие в прикладных областях: клинической психологии, педагогической и организационной психологии. Это понятно, ибо для решения своих повседневных задач им чаще приходится прибегать к постановке экспериментов, имитирующих реальность. По сути, историческая дискуссия сторонников лабораторного эксперимента и "естественного эксперимента" была отражением разного методического подхода специалистов, занимавшихся фундаментальной и прикладной психологией. В настоящее время факторами, влияющими на внешнюю валидность, считают неустранимые особенности эксперимента, отличающие его от реальной ситуации. Кемпбелл ставит знак равенства между внешней валидностью, репрезентативностью эксперимента и возможностью генерализации его результатов. Он относит к факторам, угрожающим внешней валидности, в первую очередь эффекты, связанные с особенностями объекта исследования: обучаемость, наличие памяти, способность эмоционально реагировать на ситуации. Кемпбелл называет главные причины нарушения внешней валидности:
1. Эффект тестирования - уменьшение или увеличение восприимчивости испытуемых к экспериментальному воздействию под влиянием тестирования. Например, предварительный контроль знаний учеников может повысить их интерес к новому учебному материалу. Поскольку генеральная совокупность предварительному тестированию не подвергается, то результаты для нее могут быть нерепрезентативными.
2. Условия проведения исследования. Они вызывают реакцию испытуемого на эксперимент. Следовательно, его данные нельзя переносить на лиц, не принимавших участие в эксперименте; этими лицами является вся генеральная совокупность, кроме экспериментальной выборки.
3. Взаимодействие факторов отбора и содержания экспериментального воздействия. Их следствия - артефакты (в экспериментах с добровольцами или испытуемыми, участвующими по принуждению).
4. Интерференция экспериментальных воздействий. Испытуемые обладают памятью и обучаемостью. Если эксперимент состоит из нескольких серий, то первые воздействия не проходят для них бесследно и сказываются на появлении эффектов от последующих воздействий.
Большинство причин нарушения внешней валидности связано с особенностями психологического эксперимента, проводимого с участием человека, которые отличают психологическое исследование от эксперимента, осуществляемого специалистами других наук.
На взаимодействие процедуры тестирования и содержания экспериментального воздействия первым обратил внимание в 1949 году Р.Л. Соломон при проведения исследования школьников: предварительное тестирование снижало эффективность обучения. Исследование социальных установок показало, что предварительное тестирование оказывало влияние на установки личности и ее подверженность убеждению, а в экспериментах Ховленда, наоборот, оно ослабляло убеждающее воздействие фильмов.
Эффект тем больше, чем необычайнее процедура тестирования и чем более сходно по содержанию экспериментальное воздействие с тестом. Для того, чтобы избежать эффекта предварительного тестирования, Кемпбелл рекомендует применять экспериментальные планы с предварительно не тестируемыми группами.
Как уже отмечалось, "взаимодействие состава группы и воздействия" связано с неслучайным участием испытуемых в эксперименте. Реакция может быть двух типов: готовность добровольцев "подвергнуться воздействию" и отказ, негативная реакция тех, кто принудительно привлечен к участию в эксперименте. В исследованиях по научению могут согласится участвовать только интеллектуально одаренные. Выбывание испытуемых в ходе эксперимента может вызываться экспериментальным воздействием. К примеру, лица, потерпевшие неудачу при выполнении заданий на мотивацию достижения, могут отказаться от участия в последующих сериях.
Естественно, практически невозможно элиминировать лишь фактор "реакции на эксперимент". Еще раз отметим, что проблема внутренней валидности разрешима в принципе, так как можно подобрать соответствующие процедуры планирования эксперимента и математической обработки результатов, чтобы обеспечить заданный уровень их достоверности.
Согласно Кэмпбеллу, проблема внешней валидности как репрезентативности эксперимента по отношению к реальности неразрешима, так как индукция, т.е. обобщение, никогда не может быть полностью объективна.
Проблема внешней валидности как адекватности ситуации эксперимента его "первообразной" жизненной ситуации также неразрешима логическими и математическими средствами: она требует привлечения всей совокупности научных психологических знаний для описания ситуации в целом.
5.2. Шкалы наименований или номинативные шкалы.
Шкала наименований получается путем присвоения "имен" объектам. При этом нужно разделить множество объектов на непересекающиеся подмножества.
Иными словами, объекты сравниваются друг с другом и определяется их эквивалентность - неэквивалентность. В результате процедуры образуется совокупность классов эквивалентности. Объекты, принадлежащие одному классу, эквиваленты друг другу и отличны от объектов, относящихся к другим классам. Эквивалентным объектам присваиваются одинаковые имена.
Операция сравнения является первичной для построения любой шкалы. Для построения такой шкалы нужно, чтобы объект был равен или подобен сам себе (х=х для всех значений х), т.е. на множестве объектов должно быть реализовано отношение рефлексивности. Для психологических объектов, например испытуемых и психических образов, это отношение реализуемо, если абстрагироваться от времени. Но поскольку операции попарного (в частности) сравнения множества всех объектов эмпирически реализуются неодновременно, то в ходе эмпирического измерения даже это простейшее условие не выполняется.
Следует запомнить: любая шкала есть идеализация, модель реальности, даже такая простейшая, как шкала наименований.
На объектах должно быть реализовано отношение симетрии (R(X=Y)->R(Y=X) и транзитивности R(X=Y,Y=Z)->R(X=Z). Но на множестве результатов психологических экспериментов эти условия могут нарушаться.
Кроме того, многократное повторение эксперимента (накопление статистики) приводит к "перемешиванию" состава классов: в лучшем случае мы можем получить оценку, указывающую на вероятность принадлежности объекта к классу.
Таким образом, нет оснований говорить о шкале наименований (номинативной шкале или шкале строгой классификации) как простей-
шей шкале, начальном уровне измерения в психологии.
Существуют более "примитивные" (с эмпирической, но не с математической точки зрения) виды шкал: шкалы, основанные на отношениях толерантности; шкалы "размытой" классификации и т.п.
О шкале наименований можно говорить в том случае, когда эмпирические объекты просто "метятся" числом. Примером являются номера на майках футболистов: цифру "1" по традиции получает вратарь, и это указывает на то, что по своей функции он отличен от всех остальных игроков; но его функция на футбольном поле эквивалентна функции других вратарей, если не учитывать качество игры.
В принципе вместо чисел при использовании шкалы наименований необходимо применять другие символы, ибо числовая шкала (натуральный ряд чисел) характеризуется разными системами операций.
Итак, если объекты в каком-то отношении эквивалентны, то мы имеем право отнести их к одному классу. Главное, как говорил Стивенс, не приписывать один и тот же символ разным классам или разные символы одному и тому же классу.
Для этой шкалы допустимо любое взаимно однозначное преобразование.
Несмотря на тенденцию "завышать" мощность шкалы, психологи очень часто применяют шкалу наименований в исследованиях. "Объективные" измерительные процедуры при диагностики личности приводят к типологизации: отнесению конкретной личности к тому или иному типу. Примером такой типологии является классификация темперамента: холерик, сангвиник, меланхолик и флегматик.
В "субъективной" психологии измерения используются также как классификации. Примеры: сортировка объектов по Гарднеру, метод константных стимулов в психофизике и т.д.
Исследователь, пользующийся шкалой наименований, может применять следующие инвариантные статистики: относительные частоты, моду, корреляции случайных событий, критерий x2.
5.3. Шкалы порядка или ординарные шкалы.
Порядковая шкала образуется, если на множестве реализовано одно бинарное отношение - порядок (отношения "не больше" и " меньше"). Построение шкалы порядка - процедура более сложная, чем создание шкалы наименований.
На шкале порядка объект может находится "между" двумя другими, причем если а "больше" b, b "больше" с, то а "больше" с (правило транзитивности отношений).
Классы эквивалентности, выделенные при помощи шкалы наименований, могут быть упорядочены по некоторому основанию. Различают шкалу строгого порядка (строгая упорядоченность) и шкалу слабого порядка (слабая упорядоченность). В первом случае на элементах множества реализуются отношения "не больше" и "меньше", а во втором - "не больше или равно" и "меньше или равно".
Шкала порядка сохраняет свои свойства при изотонических преобразованиях. Все функции, которые не имеют максимума (монотонные), отвечают этой группе преобразований.
Значения величин можно заменять квадратами, логарифмами, нормализовать и т.д. При таких преобразованиях значений величин, определенных по шкале порядка, место объектов на шкале не изменяется, т.е. не происходит инверсий.
Еще Стивенс высказал точку зрения, что результаты большинства психологических измерений в лучшем случае соответствуют лишь шкалам порядка.
Шкалы порядка широко распространяются в психологии познавательных процессов, экспериментальной психосемантике, социальной психологии: ранжирование, оценивание, в том числе педагогическое, дают порядковые шкалы. Классическим примером использования порядковых шкал является тестирование личностных черт, а также способностей. Большинство же специалистов в области тестирования интеллекта полагают, что процедура измерения этого свойства позволяет использовать интервальную шкалу и даже шкалу отношений.
Как бы то ни было, эта шкала позволяет ввести линейную упорядоченность объектов на некоторой оси признака. Тем самым вводится важнейшее понятие - измеряемое свойство, или линейное свойство, тогда как шкала наименований использует "вырожденный" вариант интерпретации понятия "свойство": "точечное" свойство (свойство есть - свойства нет).
Переходным вариантом шкалы можно считать дихотомическую классификацию, проводимую по принципу "есть свойство - нет свойства" (1;0) при 1>0. Дихотомическое разбиение множества позволяет применять не только порядок, но и метрику. Для интерпретации данных, полученных посредством порядковой шкалы, можно использовать более широкий спектр статистических мер (в дополнение к тем, которые допустимы для шкалы наименований).
В качестве характеристики центральной тенденции можно использовать медиану, а в качестве характеристики разброса - процентили. Для установления связи двух измерений допустима порядковая корреляция (t-Кенделла и p-Спирмена).
Числовые значения порядковой шкалы нельзя складывать, вычитать, делить и умножать.
Шкала интервалов является первой метрической шкалой. Собственно, начиная с нее, имеет смысл говорить об измерениях в узком смысле этого слова - о введении меры на множестве объектов. Шкала интервалов определяет величину различий между объектами в проявлении свойства. С помощью шкалы интервалов можно сравнивать два объекта. При этом выясняют, на сколько более или менее выражено определенное свойство у одного объекта, чем у другого.
Шкала интервалов очень часто используется исследователями. Классическим примером применения этой шкалы в физике является измерение температуры по Цельсию. Шкала интервалов имеет масштабную единицу, но положение ноля на ней произвольно, поэтому нет смысла говорить, во сколько раз больше или меньше утренняя температура воздуха, измеренная шкалой Цельсия, чем дневная.
Значения интервальной шкалы инвариантны относительно группы аффинных преобразований прямой. То есть мы имеем право изменять масштаб шкалы, умножая каждое значение на константу, и производить ее сдвиг относительно произвольно выбранной точки на любое расстояние вправо или влево (прибавлять и отнимать константу).
Интервальная шкала позволяет применять практически всю параметрическую статистику для анализа данных, полученных с ее помощью. Помимо медианы и моды для характеристики центральной тенденции используется среднее арифметическое, а для оценки разброса
- дисперсия. Можно вычислять коэффициенты асимметрии и эксцесса и другие параметры распределения. Для оценки величины статистической связи между переменными применяется коэффициент линейной корреляции Пирсона и т.д.
Большинство специалистов по теории психологических измерений полагают, что тесты измеряют психические свойства с помощью шкал интервалов. Прежде всего это касается тестов интеллекта и достижений. Численные значения одного теста можно переводить в численные значения другого теста с помощью линейного преобразования: xi = ax + b.
Ряд авторов полагают, что относить тесты интеллекта к шкалам интервалов нет оснований. Во-первых, каждый тест имеет "нуль" - любой индивид может получить минимальный балл, если не решит ни одной задачи в отведенное время. Во-вторых, тест имеет максимум шкалы - балл, который испытуемый может получить, решив все задачи за минимальное время. В-третьих, разница между отдельными значениями шкалы не одинакова. По крайней мере, нет никаких теоретических и эмпирических оснований утверждать, что 100 и 120 баллов по шкале IQ отличаются на столько же, на сколько 80 и 100 баллов.
Скорее всего, шкала любого теста интеллекта является комбинированной шкалой, с естественным минимумом и\или максимумом, но порядковой. Однако эти соображения не мешают тестологам рассматривать шкалу IQ как интервальную, преобразуя "сырые" значения в шкальные с помощью известной процедуры "нормализации" шкалы.
5.5. Шкалы отношений.
Шкала отношений - наиболее часто используемая в физике. По крайней мере, идеалом измерительной процедуры является получение таких данных о выраженности свойств объекта, когда можно сказать, во сколько раз один объект больше или меньше другого.
Это возможно лишь тогда, когда помимо определения равенства, рангового порядка, равенства интервалов известно равенство отношений. Шкала отношений отличается от шкалы интервалов тем, что на ней определено положение "естественного" нуля. Классический пример - шкала температур Кельвина.
В психологии шкалы отношений практически не применяются. Одним из исключений являются шкалы оценки компетентности, основанные на модели Раша. Действительно, вполне можно представить уровень "нулевой" осведомленности испытуемого в какой-то области знаний или же "нулевой" уровень владения каким-либо навыком. Авторы стохастической теории теста доказывают, что, ведя единую шкалу "трудности задачи - способности испытуемого", модно измерить во сколько раз одна задача труднее другой или же один испытуемый компетентнее другого.
Значения шкалы отношений инвариантны относительно преобразования вида: xi=ax. Значения шкалы можно умножать на константу. К ним применимы статистические меры.
Измерения массы, времени реакции и выполнения тестового задания - области применения шкалы отношений.
Отличием этой шкалы от абсолютной является отсутствие "естественной" масштабной единицы.