Тема: «Анализ алгоритма вычислений итоговых величин двухфакторного иерархического дисперсионного анализа»

Лабораторная работа № 5

 

Тема: «Анализ алгоритма вычислений итоговых величин двухфакторного иерархического дисперсионного анализа»

 

Ключевые слова: дисперсия, варианса, дисперсионное отношение, дисперсионный анализ, иерархия, иерархические комплексы.

 

Форма проведения занятия – аудиторные занятия, лабораторная работа.

Бюджет времени – 2 часа.

Количество двухчасовых занятий – 1.

Распределение бюджета времени:

- 1 час на освоение теоретических основ вычисления величин двухфакторного иерархического анализа;

- 1 час на самостоятельное практическое освоение материала.

 

Вводная часть

Основное назначение дисперсионного анализа – это разложение общей изменчивости признака на изменчивость частную, возникающую в совокупности объектов (у членов популяции или между раметами клонов на ЛСП) под влиянием многообразных факторов. Указанное свойство дисперсионного анализа имеет большое значение при анализе изменчивости, наблюдаемой у биологических объектов, в том числе и у древесных растений и кустарников.

Второе свойство дисперсионного анализа заключается в том, что он позволяет определить статистическую достоверность доли влияния изучаемых факторов. Важной особенностью дисперсионного метода является то, что его можно применять на разных типах выборок (больших и малых) и, что особенно важно, он позволяет обрабатывать совокупности, включающие в себя разнородный материал: разнополые особи у двудомных растений (тополя, ивы, облепиха и др.); совокупности, состоящие из групп особей растений разного генетического происхождения (особи из естественных насаждений, гибриды, сорта и т.п.). При этом дисперсионный анализ является методом анализа количественной информации (преимущественно).

При проведении дисперсионного анализа исходят из предположения о том, что некоторая совокупность объектов под действием какого либо фактора (или нескольких факторов) разделяется на несколько (две и более) групп. При этом каждая из групп объектов отличается от других групп величиной среднего группового значения признака и характером его изменчивости – дисперсией или вариансой (вариансный анализ) в пределах группы. Учитывается также и то, что изменчивость признака у объектов возможна как внутри таких групп, так и между ними.

Если в имеющейся совокупности объектов изменчивость (рассеянье, дисперсия) признака в любой из её частей одинакова, то совокупность не разделена на группы. Совокупность признается однородной. Это единая совокупность – одно и тоже. Если же разные части анализируемой совокупности характеризуются разными дисперсиями – разным характером рассеянья признака – то совокупность не рассматривается как единая, и в её составе признается наличие некоторых внутренних групп. Разделение совокупности на части происходит под действием какого-либо фактора.

Отношение факториальной дисперсии к остаточной дисперсии при условии, что факториальная дисперсия больше или равна остаточной, называется дисперсионным отношением или критерием Фишера. По его величине, соотнесенной с табличным значением, судят об эффективности действия фактора (например, фактора А). В случае, когда остаточная дисперсия больше факториальной, допускается расчет дисперсионного отношения как отношения остаточной дисперсии к факториальной дисперсии.

 

Порядок проведения занятия

1. Прочитать текст.

2. Скопировать исходный файл (Лист-1) на следующий лист (Лист-2).

3. Разделить исходную совокупность на 3 – 5 разных по размеру частей.

4. Отметить их разноцветной заливкой и более жирной линией окантовки.

5. Рассчитать «долю», взвешенную по численности объектов в каждой выделенной группе.

6. Проверить правильность расчетов, вычислив сумму долей: должна быть «1».

7. Рассчитать «частоту», взвешенную по численности объектов в каждой выделенной группе.

8. Проверить правильность расчетов, вычислив сумму частот: должна быть «n».

9. Рассчитать «долю», взвешенную по среднему значению диаметра ствола на высоте 1.3 м для каждой выделенной группе.

10. Проверить правильность расчетов, вычислив сумму долей: должна быть «1».

11. Рассчитать «частоту», взвешенную по среднему значению диаметра ствола на высоте 1,3 м для каждой выделенной группе.

12. Проверить правильность расчетов, вычислив сумму частот: должна быть «n».

13. Сравнить значения «долей» и «частот» при взвешивании по разным признакам».

14. Самостоятельно выбрать любой другой признак для «взвешивания» и осуществить определение «долей» и «частот», взвешенных по нему.

15. Выбрать два признака для «взвешивания» по их произведению.

16. Повторить работу с большим числом признаков.

17. Выбрать для взвешивания признаки, значимым эффектом взвешивания для которых выступает их сумма, затем их разность, затем их отношение и т.д.

 

 

5.1. Порядок вычислений итоговых величин двухфакторного иерархического дисперсионного анализа

 

Порядок вычисления итоговых величин двухфакторного иерархического дисперсионного анализа рассмотрим на примере анализа двухфакторного иерархического неравномерного (не ортогонального) комплекса. Принципиально, алгоритм расчетов неравномерных комплексов применим и для равномерных комплексов, но не наоборот.

 

Постановка задачи. Пусть требуется оценить влияние исходных родительских форм на продуктивность гибридов тополей, получаемых для создания промышленных плантаций. Напомним, что тополя относятся к двудомным растениям, т.е. их особи являются разнополыми. Учитываемым признаком будет объем ствола к установленному возрасту (20 лет). Планом гибридизации было предусмотрено использование в качестве отцовских особей (опылителей) 3-х перспективных форм тополя белого, а в качестве материнских (опыляемых растений) – 8 особей тополя Болле. При этом схема скрещивания и количество оставшихся к моменту учета гибридов по каждой комбинации скрещивания будет отражена в таблице 5.1.

Примечание. В нижеприведенных таблицах и алгоритмической части к ним изложен материал, представляющий собой реконструкцию сведений по учебнику Г.Ф. Лакина (1980). Это сделано намеренно для адаптации текста учебника к решению конкретных задач лесоводственных исследований бакалавров, магистров и аспирантов. Комментарии к таблицам и их алгоритмической части, а также соответствующая коррекция отдельных формул и их интерпретаций наша (В.П. Бессчетнов, Н.Н. Бессчетнова).

 

 

Таблица 5.1.

Двухфакторный иерархический дисперсионный анализ

Показа-тели

Отцы (опылители)

Сумма

А1

А2

А3

Матери (опыляемые особи)

В1 В2 В3 В4 В5 В6 В7 В8
1 2 3 4 5 6 7 8 9 10 11
1. Запас древеси-ны 1,0 0,8 0,6 0,8 0,9 0,7 0,8 0,7 0,5 1,0 1,1 0,9 1,0 1,2 1,0 1,0 0,9 1,0 1,1 0,8 0,9 0,9 1,0 0,8 1,1 1,2 1,0 0,9 1,0 0,8 1,0 1,1 1,1 0,8 0,9 0,9 0,9 0,8 1,1 0,6 a=3 b=8
2. 4 5 4 7 4 6 5 5 40 Σn=N
3. 3,2 3,6 4,0 7,0 3,6 6,0 4,9 4,3 36,6
4. 10,24 12,96 16,0 49,0 12,96 36,0 24,01 18,49 1339,56
5. 2,56 2,59 4,0 7,0 3,28 6,0 4,80 3,70 33,93
6. 2,64 2,68 4,02 7,10 3,26 6,10 4,87 3,83 34,50
7.

9

15

16

40
8.

6,8

14,6

15,2

36,6
9.

46,24

213,16

231,04

-
10.

5,14

14,21

14,44

33,79

 

Порядок вычислений

1. На первом этапе, используя исходные данные таблицы 5.1, выполняем расчеты показателей, которые позволяют осуществить дисперсионный анализ.

2. Используя результаты статистической обработки материалов первичных наблюдений, приведенные в таблице 5.1, вычисляем промежуточные вспомогательные величины.

 

2.1. Средний квадрат суммы вариант:

.

 

3. Затем находим суммы квадратов отклонений.

3.1. Общая сумма квадратов отклонений:

.

 

3.2. Межгрупповая сумма квадратов отклонений:

.

 

3.3. Остаточная сумма квадратов отклонений:

.

 

3.4. Сумма квадратов отклонений по фактору А:

.

 

3.5. Сумма квадратов отклонений по фактору В:

.

 

4. Определяем числа степеней свободы для вычисления соответствующих величин дисперсии.

 

4.1. Общее число степеней свободы (для общей дисперсии):

.

 

4.2. Число степеней свободы по фактору А (для вычисления дисперсии по фактору А):

.

 

4.3. Число степеней свободы по фактору В (для вычисления дисперсии по фактору В):

.

 

4.4. Число степеней свободы по случайным факторам (для остаточной дисперсии или фактора Z):

.

 

5. Находим средние квадраты отклонений по факторам, используя полученные величины соответствующих сумм квадратов отклонений и числа степеней свободы.

5.1. По фактору А – фактору высшего уровня иерархии:

 

5.2. По фактору В – фактору низшего уровня иерархии:

 

5.3. По остаточной вариации – по случайным факторам – Z:

 

5.4. Полученный в ходе выполненных расчетов результат записываем в таблицу (табл. 5.2):

 

 

Таблица 5.2.

Результаты дисперсионного анализа гибридов тополей

Вариация

Степени свободы

Суммы квад-ратов

Средние квад-раты

Дисперсионные отношения

Fфакт

Fст

5% 1%
1 2 3 4 5 6 7
По фактору А 2 0,30 0,150 FA = S21/S22 = 0,150/0,028 = 5,4 3,3 5,3
По фактору В 5 0,14 0,028 FB = S22/S2Z = 0,028/0,018 = 1,6 2,7 3,7
Остаточная 32 0,57 0,018 - - -
Общая 39 1,01 - - - -

 

Статистически доказанным оказалось влияние фактора А.

 

6. Определяем усредненные значения степеней свободы для неравномерных комплексов, позволяющие учесть различия в числе степеней свободы по градациям организованных факторов. Необходимость такого преобразования вызвана тем, что в расчетах факториальных дисперсий при неодинаковой численности вариант в градациях комплекса используются усредненные значения числа степеней свободы, а именно: bn и n.

6.1. Усредненное значение для расчета дисперсии по первому фактору – фактору А:

.

 

6.2. Усредненное значение для расчета дисперсии по второму фактору – фактору В:

, где

 

6.3. Усредненное значение числа наблюдений по фактору А (а - 1 – адекватно числу степеней свободы по фактору А) – коррекция неравномерности градаций фактора высшей иерархи

Примечание. В учебнике Г.Ф. Лакина (1980, стр. 251) приведена некорректная запись данного алгоритма вычислений. В нашем случае исправлено.

;

6.4. Усредненное значение числа наблюдений по фактору В (b – a – адекватно числу степеней свободы по фактору В) – коррекция неравномерности градаций фактора низшей иерархи.

Примечание. В учебнике Г.Ф. Лакина (1980, стр. 251) приведена некорректная запись данного алгоритма вычислений. В нашем случае исправлено.

.

6.5. После чего:

.

 

7. На следующем этапе рассчитываем факториальные и общую дисперсии.

 

7.1. Дисперсия по фактору А:

.

 

7.2. Дисперсия по фактору В:

.

 

7.3. Общая дисперсия:

.

 

8. Далее рассчитываем силу влияния каждого из факторов на формирование общей дисперсии.

 

8.1. Сила влияния фактора А (отцовский эффект):

.

 

8.2. Сила влияния фактора В, включая совместное влияние АВ (материнский эффект совместно с эффектом взаимодействия материнской и отцовской компоненты):

.

 

8.3. Сила влияния неорганизованных факторов

.

 

8.4. Проверяем правильность расчета показателей силы влияния факторов, исходя из того, что сумма оценок доли влияния каждого из факторов должна быть равна «единице»:

.

 

Примечание.

9. В данной ситуации более корректным является расчет по следующей схеме, исключающей расчет силы влияния по фактору В и предусматривающей расчет общей «исправленной дисперсии» без учета величины или доли дисперсии по фактору В.

9.1. Рассчитываем общую «исправленную дисперсию» как сумму «исправленной дисперсии» по фактору А и остаточной дисперсии:

.

 

9.2. Сила влияния фактора А (отцовский эффект) рассчитывается как:

.

 

9.3. Сила влияния фактора В, включая и совместное влияние АВ (материнский эффект совместно с эффектом взаимодействия отцовского и материнского факторов) не рассчитывается. Эффект от совместного влияния факторов А и В не учитывается на том основании, что один из компонентов совместного влияния, а именно фактор В, не имеет достоверного влияния.

 

9.4. Сила влияния неорганизованных факторов будет вычислена как:

.

 

9.4. Проверяем правильность расчета показателей силы влияния факторов, исходя из того, что сумма оценок доли влияния каждого из факторов должна быть равна «единице»:

.

 

Исходное условие удовлетворяется, следовательно, анализ выполнен верно.

 

Полученные оценки силы влияния факторов можно выразить в процентном отношении, для чего каждую из оценок умножают на 100%. В этом случае при интерпретации полученных результатов можно говорить о том, на сколько процентов изменчивость результирующего признака обусловлена влиянием каждого из учтенных факторов.

Таким образом, удается разложить общую дисперсию комплекса на составляющие её компоненты и выяснить силу влияния каждого компонента на общую изменчивость результативного признака.