Вторая форма стандартизации заключается в создании еди­нообразной оценки выполнения теста: стандартной интерпрета­ции полученных результатов и предварительной стандартной об­работки.

Результаты психологических тестов чаще всего интерпретиру­ются сопоставлением их с нормами выполнения теста в выборке стандартизации.

Третья форма стандартизации предполагает определение норм выполнения теста для сопоставления с ними показателей, полученных в результате обработки данных тестирования. На этом этапе происходит преобразование нормальной (или искусст­венно нормализованной) шкалы оценок в новую шкалу, основан­ную уже не на количественных эмпирических закономерностях, а на его относительном месте в распределении результатов в выбор­ке обследуемых.

В процессе стандартизации теста его проводят на большой репрезентативной выборке лиц определенного типа, для работы с которыми он предназначен. Эта группа, называемая выборкой стандартизации, как раз и служит для установления норм (Анас-тази А., Урбина С, 2003, с. 20).

Также данная форма стандартизации предполагает сравнение полученных показателей с нормой выполнения этого теста для данного возраста (например, в тестах интеллекта), пола и т. д.

В стандартизованных методах психодиагностики наличие нор­мативных данных (норм) является их важной характеристикой. Нормы рассматриваются в качестве эталона, с которым сравнива­ются результаты тестирования (первичные показатели).

При отсутствии устойчивых норм теста результаты исполь­зования конкретной психодиагностической методики признают­ся отрицательными, и в дальнейшем исследователи прибегают к обследованию более широкой выборки испытуемых или вообще отказываются от такого теста. 4.2. Надежность как устойчивость к побочным факторам

Понятие «надежность» часто используется в повседневной речи. Например, можно говорить о человеке как о надежном или ненадежном. В психодиагностике понятие «надежность» относит-ся в большинстве случаев к характеристике тестов, процедур и способов оценивания.

Еще в 1928 г. Хартшорн и Мэй попытались оценить индиви­дуальные различия людей по характеристике «надежность». По общему мнению, успех не сопутствовал исследователям при из­мерении этой характеристики, так как она оказалась слишком за­висимой от ситуации. Однако в одной из интерпретаций данно­го исследования эта характеристика была названа стабильной, а нестабильность результатов была приписана низкому методичес­кому уровню сбора и обработки данных (Rushton, Brainerd, Press-ley, 1983).

Надежность — характеристика методики, отражающая точ­ность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов.

На понятии «надежность» основывается вычисление «ошибки из­мерения», которая служит для указания вероятных пределов коле-баний измеряемой величины, возникающих под действием посто­ронних случайных факторов.

Надежность теста определяется в практической психологии как устойчивость (стабильность) результатов при повторном тес­тировании на той же выборке обследуемых. Считается, что при коэффициенте корреляции более 0,75 уровень надежности теста вполне приемлем. Чем выше надежность теста, тем относительно свободнее он от погрешностей измерений.

Основное положение концепции надежности состоит в том, что при оценивании различных феноменов (биологических, фишологических, психологических) неизбежны ошибки измерения.

При повторном измерении никогда не будут получены те же баллы или та же сумма баллов, что и в первом измерении. Под надежноетью в психодиагностике понимается повторяемость результатов измерения (Runkel & McGrath, 1972; Nunnally & Bernstein, 1994) или согласованность результатов измерения (Feldt & Brennan, 1989, Stanley, 1971). Таким образом, понятие «надежность» пока­зывает степень свободы результатов тестирования от ошибок из­мерения, а также степень согласованности и повторяемости полу­ченных результатов.

Любое руководство по теории тестов должно перечислять множество возможных источников случайных ошибок. В качест­ве таких источников могут быть названы: сам человек, колебания внимания и работоспособности, забывчивость, легкомысленное отношение, импульсивность. Второй источник — это среда. Ок­ружение различается объективно и субъективно. Оно по-разному влияет на субъекта, работающего с тестом. Наконец, и сами мето­дики, и процедуры, и даже сами исследователи могут быть источ­никами ошибок. В той мере, в какой можно учесть или устранить эти факторы, они не являются источниками «ненадежности» тес­та, но всегда остаются иные, неконтролируемые ошибки.

Надежность измерительного инструмента или процедуры из­мерения определяется с помощью двух конкретных показателей: ошибки измерения и коэффициента надежности. Первый отража­ет расхождение тестовых баллов, получаемых у одного человека. Если величина этого расхождения мала, то измерение может быть признано надежным. Стандартная ошибка рассматривается как стандартное отклонение в процессе большого числа измерений на одном и том же человеке. Практически это недостижимо, так как невозможно много раз предлагать работу с одним и тем же тестом одному и тому же человеку. Выходом из этой ситуации стало вве­дение коэффициента надежности. Коэффициент надежности яв­ляется выражением двух отношений: постоянства—непостоянства и стабильности—нестабильности.

В настоящее время исследователи уже не делают предположе­ний о существовании неизменных истинных показателей, но тре­бование надежности тестовых показателей остается, поскольку истинные или надежные показатели рассматриваются как предпо­лагаемая оценка многих независимых повторных процедур тести­рования. Однако эти истинные или надежные баллы могут изме­няться с течением времени.

Надежность — важный критерий качества любого психоди­агностического теста, относящийся к точности психологических измерений. Если надежность определяется относительно предмета психодиагностического исследования (психологических свойств или черт личности), то валидность — относительно объекта ис­следования (применительно к испытуемым).

Сказанное выражается формулой в виде выражения отноше­ний истинной дисперсии к дисперсии эмпирической зарегистри­рованных баллов. Эта формула легко преобразуется в формулу Рюлона а = 1 - S 2 e / S 2 x , где S 2 e — это дисперсия ошибки.

Величина ошибки дисперсии — обратный индикатор точности измерения, т. е. чем больше ошибка, тем шире диапазон неопреде­ленности на шкале, т. е. доверительный интервал индивидуально­го балла, внутри которого оказывается статистически возможной локализация истинного балла истинного обследуемого.

Выделяются следующие виды надежности: надежность-устой­чивость (ретестовая), надежность-согласованность (надежность параллельных форм), надежность-константность (надежность субъективных оценок).

Надежность-устойчивость. Она измеряется с помощью пов­торного проведения теста на той же выборке испытуемых обыч­но через две недели после проведения первого теста. Требования этой надежности являются корректными лишь по отношению к таким психологическим характеристикам индивида, которые сами являются устойчивыми во времени. Рассчитывается коэффициент корреляции между тестовыми результатами одних и тех же испы­туемых, при этом желательно, чтобы коэффициент корреляции был равным или превышающим значение 0,8.

Надежность-согласованность. Она предполагает создание эк­вивалентных форм опросника и предъявление их одним и тем же испытуемым для того, чтобы затем оценить корреляцию между полученными результатами по эквивалентным формам. Основная проблема, препятствующая распространению этого способа оп­ределения надежности, — это необходимая подготовка двух оди­наковых наборов заданий или сходных по смыслу вопросов, что чрезвычайно сложно, поскольку требуются убедительные дока­зательства их эквивалентности. В данном случае r > 0,75 - 0,8, что соответствует удовлетворительной величине внутренней согласо­ванности теста.

Надежность-константность. Измеряется независимость ре­зультатов от личности экспериментатора и определяется коэффи­циент корреляции результатов теста, проведенных разными экс­периментаторами, при г > 0,9 говорят, что это надежный по конс­тантности тест.