Вторая форма стандартизации заключается в создании единообразной оценки выполнения теста: стандартной интерпретации полученных результатов и предварительной стандартной обработки.
Результаты психологических тестов чаще всего интерпретируются сопоставлением их с нормами выполнения теста в выборке стандартизации.
Третья форма стандартизации предполагает определение норм выполнения теста для сопоставления с ними показателей, полученных в результате обработки данных тестирования. На этом этапе происходит преобразование нормальной (или искусственно нормализованной) шкалы оценок в новую шкалу, основанную уже не на количественных эмпирических закономерностях, а на его относительном месте в распределении результатов в выборке обследуемых.
В процессе стандартизации теста его проводят на большой репрезентативной выборке лиц определенного типа, для работы с которыми он предназначен. Эта группа, называемая выборкой стандартизации, как раз и служит для установления норм (Анас-тази А., Урбина С, 2003, с. 20).
Также данная форма стандартизации предполагает сравнение полученных показателей с нормой выполнения этого теста для данного возраста (например, в тестах интеллекта), пола и т. д.
В стандартизованных методах психодиагностики наличие нормативных данных (норм) является их важной характеристикой. Нормы рассматриваются в качестве эталона, с которым сравниваются результаты тестирования (первичные показатели).
При отсутствии устойчивых норм теста результаты использования конкретной психодиагностической методики признаются отрицательными, и в дальнейшем исследователи прибегают к обследованию более широкой выборки испытуемых или вообще отказываются от такого теста. 4.2. Надежность как устойчивость к побочным факторам
Понятие «надежность» часто используется в повседневной речи. Например, можно говорить о человеке как о надежном или ненадежном. В психодиагностике понятие «надежность» относит-ся в большинстве случаев к характеристике тестов, процедур и способов оценивания.
Еще в 1928 г. Хартшорн и Мэй попытались оценить индивидуальные различия людей по характеристике «надежность». По общему мнению, успех не сопутствовал исследователям при измерении этой характеристики, так как она оказалась слишком зависимой от ситуации. Однако в одной из интерпретаций данного исследования эта характеристика была названа стабильной, а нестабильность результатов была приписана низкому методическому уровню сбора и обработки данных (Rushton, Brainerd, Press-ley, 1983).
Надежность — характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов.
На понятии «надежность» основывается вычисление «ошибки измерения», которая служит для указания вероятных пределов коле-баний измеряемой величины, возникающих под действием посторонних случайных факторов.
Надежность теста определяется в практической психологии как устойчивость (стабильность) результатов при повторном тестировании на той же выборке обследуемых. Считается, что при коэффициенте корреляции более 0,75 уровень надежности теста вполне приемлем. Чем выше надежность теста, тем относительно свободнее он от погрешностей измерений.
Основное положение концепции надежности состоит в том, что при оценивании различных феноменов (биологических, фишологических, психологических) неизбежны ошибки измерения.
При повторном измерении никогда не будут получены те же баллы или та же сумма баллов, что и в первом измерении. Под надежноетью в психодиагностике понимается повторяемость результатов измерения (Runkel & McGrath, 1972; Nunnally & Bernstein, 1994) или согласованность результатов измерения (Feldt & Brennan, 1989, Stanley, 1971). Таким образом, понятие «надежность» показывает степень свободы результатов тестирования от ошибок измерения, а также степень согласованности и повторяемости полученных результатов.
Любое руководство по теории тестов должно перечислять множество возможных источников случайных ошибок. В качестве таких источников могут быть названы: сам человек, колебания внимания и работоспособности, забывчивость, легкомысленное отношение, импульсивность. Второй источник — это среда. Окружение различается объективно и субъективно. Оно по-разному влияет на субъекта, работающего с тестом. Наконец, и сами методики, и процедуры, и даже сами исследователи могут быть источниками ошибок. В той мере, в какой можно учесть или устранить эти факторы, они не являются источниками «ненадежности» теста, но всегда остаются иные, неконтролируемые ошибки.
Надежность измерительного инструмента или процедуры измерения определяется с помощью двух конкретных показателей: ошибки измерения и коэффициента надежности. Первый отражает расхождение тестовых баллов, получаемых у одного человека. Если величина этого расхождения мала, то измерение может быть признано надежным. Стандартная ошибка рассматривается как стандартное отклонение в процессе большого числа измерений на одном и том же человеке. Практически это недостижимо, так как невозможно много раз предлагать работу с одним и тем же тестом одному и тому же человеку. Выходом из этой ситуации стало введение коэффициента надежности. Коэффициент надежности является выражением двух отношений: постоянства—непостоянства и стабильности—нестабильности.
В настоящее время исследователи уже не делают предположений о существовании неизменных истинных показателей, но требование надежности тестовых показателей остается, поскольку истинные или надежные показатели рассматриваются как предполагаемая оценка многих независимых повторных процедур тестирования. Однако эти истинные или надежные баллы могут изменяться с течением времени.
Надежность — важный критерий качества любого психодиагностического теста, относящийся к точности психологических измерений. Если надежность определяется относительно предмета психодиагностического исследования (психологических свойств или черт личности), то валидность — относительно объекта исследования (применительно к испытуемым).
Сказанное выражается формулой в виде выражения отношений истинной дисперсии к дисперсии эмпирической зарегистрированных баллов. Эта формула легко преобразуется в формулу Рюлона а = 1 - S 2 e / S 2 x , где S 2 e — это дисперсия ошибки.
Величина ошибки дисперсии — обратный индикатор точности измерения, т. е. чем больше ошибка, тем шире диапазон неопределенности на шкале, т. е. доверительный интервал индивидуального балла, внутри которого оказывается статистически возможной локализация истинного балла истинного обследуемого.
Выделяются следующие виды надежности: надежность-устойчивость (ретестовая), надежность-согласованность (надежность параллельных форм), надежность-константность (надежность субъективных оценок).
Надежность-устойчивость. Она измеряется с помощью повторного проведения теста на той же выборке испытуемых обычно через две недели после проведения первого теста. Требования этой надежности являются корректными лишь по отношению к таким психологическим характеристикам индивида, которые сами являются устойчивыми во времени. Рассчитывается коэффициент корреляции между тестовыми результатами одних и тех же испытуемых, при этом желательно, чтобы коэффициент корреляции был равным или превышающим значение 0,8.
Надежность-согласованность. Она предполагает создание эквивалентных форм опросника и предъявление их одним и тем же испытуемым для того, чтобы затем оценить корреляцию между полученными результатами по эквивалентным формам. Основная проблема, препятствующая распространению этого способа определения надежности, — это необходимая подготовка двух одинаковых наборов заданий или сходных по смыслу вопросов, что чрезвычайно сложно, поскольку требуются убедительные доказательства их эквивалентности. В данном случае r > 0,75 - 0,8, что соответствует удовлетворительной величине внутренней согласованности теста.
Надежность-константность. Измеряется независимость результатов от личности экспериментатора и определяется коэффициент корреляции результатов теста, проведенных разными экспериментаторами, при г > 0,9 говорят, что это надежный по константности тест.