Эксперт по сдаче вступительных испытаний в ВУЗах
Лабораторная работа № 5. Дисперсионный анализ факторных эффектов
Назначение. Метод предназначен для решения задач, связанных с исследованием влияния одной или нескольких
качественных переменных (факторов) на одну зависимую
количественную переменную (отклик). Метод применим и в случае количественных факторов, если их значения могут быть сгруппированы в классы или блоки.
Пример 1. Рассмотрим влияние g-излучения в дозах 15 сГр, 1 Гр, 6,5 Гр, которое использовали для облучения семян, на высоту растений бархатца отклоненного на 10 день после посадки в грунт (табл. 37).
Обратите внимание, что значения изучаемого признака (высота растения) при данном значении воздействующего фактора (доза облучения) располагаются в
столбцах. Неправильное заполнение таблицы приводит к получению ошибочных результатов!
Таблица 37
Высота растений бархатца отклоненного (см), облученных различными дозами γ-радиации, на 10 день после посадки в грунт
| № п/п |
Контроль |
Доза γ -облучения |
| 15 сГр |
1 Гр |
6,5 Гр |
| 1 |
1,0 |
2,0 |
1,5 |
2,0 |
| 2 |
5,0 |
7,5 |
8,0 |
5,0 |
| 3 |
1,0 |
3,5 |
2,5 |
4,9 |
| 4 |
1,7 |
3,9 |
2,9 |
4,9 |
| 5 |
2,5 |
2,5 |
3,8 |
2,9 |
| 6 |
2,6 |
7,0 |
6,5 |
3,5 |
| 7 |
2,3 |
7,3 |
7,8 |
3,9 |
| 8 |
4,9 |
5,6 |
4,5 |
3,7 |
| 9 |
4,3 |
6,5 |
4,9 |
3,8 |
| 10 |
2,9 |
6,8 |
2,9 |
3,9 |
| 11 |
3,6 |
6,1 |
3,9 |
5,1 |
| 12 |
1,9 |
4,9 |
4,6 |
4,0 |
| 13 |
3,5 |
5,0 |
5,9 |
3,9 |
| 14 |
3,1 |
5,5 |
6,7 |
3,8 |
| 15 |
2,4 |
4,9 |
7,0 |
3,1 |
| 16 |
2,6 |
4,7 |
7,5 |
3,3 |
| 17 |
3,8 |
3,8 |
6,9 |
4,1 |
| 18 |
4,2 |
5,6 |
6,3 |
2,7 |
| 19 |
4,6 |
5,1 |
6,4 |
5,1 |
| 20 |
2,8 |
2,9 |
5,9 |
4,3 |
| 21 |
2,3 |
2,8 |
5,9 |
2,9 |
| 22 |
4,1 |
2,3 |
5,4 |
3,9 |
| 23 |
3,8 |
2,1 |
4,8 |
4,5 |
| 24 |
2,6 |
4,5 |
4,9 |
4,0 |
| 25 |
4,0 |
5,6 |
4,6 |
4,9 |
| 26 |
2,7 |
5,3 |
5,3 |
4,5 |
| 27 |
1,9 |
5,7 |
2,9 |
3,3 |
| 28 |
2,5 |
6,2 |
1,9 |
3,9 |
| 29 |
1,5 |
3,8 |
3,8 |
3,1 |
| 30 |
3,6 |
2,9 |
5,9 |
4,4 |
Чтобы определиться с выбором критериев дисперсионного анализа для выявления влияния γ-облучения на высоту растений (параметрические или непараметрические), проверим распределение контрольной и облученных выборок на нормальность.
Контрольная выборка:
Колмогоров=0,1062, Значимость=0,4029, степ.своб = 30
Гипотеза 0: Распределение не отличается от нормального
Омега-квадрат=0,05504, Значимость=0,4459, степ.своб = 30
Гипотеза 0: Распределение не отличается от нормального
Хи-квадрат=3,271, Значимость=0,3516, степ.своб = 3
Гипотеза 0: Распределение не отличается от нормального
Доза 15 сГр:
Колмогоров=0,1076, Значимость=0,05707, степ.своб = 30
Гипотеза 0: Распределение не отличается от нормального
Омега-квадрат=0,05561, Значимость=0,438, степ.своб = 30
Гипотеза 0: Распределение не отличается от нормального
Хи-квадрат=12,53, Значимость=0,005767, степ.своб = 3
Гипотеза 1: Распределение отличается от нормального
Доза 1 Гр:
Колмогоров=0,1176, Значимость=0,4784, степ.своб = 30
Гипотеза 0: Распределение не отличается от нормального
Омега-квадрат=0,03826, Значимость=0,2818, степ.своб = 30
Гипотеза 0: Распределение не отличается от нормального
Хи-квадрат=5,017, Значимость=0,1706, степ.своб = 3
Гипотеза 0: Распределение не отличается от нормального
Доза 6,5 Гр:
Колмогоров=0,1104, Значимость=0,3931, степ.своб = 30
Гипотеза 0: Распределение не отличается от нормального>
Омега-квадрат=0,05545, Значимость=0,4402, степ.своб = 30
Гипотеза 0: Распределение не отличается от нормального
Хи-квадрат=3,342, Значимость=0,3418, степ.своб = 3
Гипотеза 0: Распределение не отличается от нормального
Распределение в контроле и при облучении дозами 1 и 6,5 Гр не отличается от нормального. По
χ2-критерию распределение отличается от нормального при облучении в дозе 15 сГр что (P<0,001).
Сравним параметрический и непараметрический дисперсионный анализ для выявления влияния фактора облучения на высоту растений.
В табл. 38 приведены результаты 1-факторного параметрического дисперсионного анализа. В строках представлены значения внутригрупповой (факт. 1), остаточной (остат.) и межгрупповой (общая) дисперсий, в столбцах — сумма квадратов отклонений, число степеней свободы, средняя сумма квадратов, критерий Фишера, значимость (Р), сила влияния фактора (по Снедекору).
Таблица 38
Результаты однофакторного параметрического дисперсионного анализа
| Источник |
Сум.квадр |
Ст.своб |
Ср.квадр |
F |
Значимость |
Сила влияния |
| Факт. 1 |
77,42 |
3 |
25,81 |
13,86 |
5,2х10-6 |
–0,0257 |
| Остат. |
216 |
116 |
1,862 |
|
|
|
| Общая |
293,4 |
119 |
2,466 |
|
|
|
F (фактор1)=13,86, Значимость=5,2х10
-6, степ.своб = 3,116
Гипотеза 1: Есть влияние фактора на отклик.
Затем рассчитываются значения параметров однофакторной модели с доверительными интервалами:
Параметры модели:
Среднее = 4,176, доверит. инт.=9,528
Эффект 1 = -1,186, доверит. инт.=6,3
Эффект 2 = 0,5675, доверит. инт.=6,3
Эффект 3 = 0,8842, доверит. инт.=6,3
Эффект 4 = -0,2658, доверит. инт.=6,3
Вывод: g-облучение оказывает влияние на высоту растений (P<0,001), однако сила его воздействия на изучаемый показатель невелика — 2,57 %.
Воспользуемся апостериорными (post hoc) тестом Шеффе (табл. 39), позволяющим провести множественное сравнение (группы сравнивают попарно).
Таблица 39
Результаты парных сравнений с использованием теста Шеффе
| Сравниваемые дозы |
Разность |
Интервал |
Значимость |
Гипотеза H1 |
| Контроль — 15 сГр |
1,753 |
0,9966 |
0,0001521 |
Да |
| Контроль — 1 Гр |
2,07 |
0,9966 |
1,76х10-5 |
Да |
| Контроль — 6,5 Гр |
0,92 |
0,9966 |
0,08248 |
Нет |
| 15 сГр — 1 Гр |
0,3167 |
0,9966 |
0,8487 |
Нет |
| 15 сГр — 6,5 Гр |
0,8333 |
0,9966 |
0,138 |
Нет |
| 1 Гр — 6,5 Гр |
1,15 |
0,9966 |
0,01649 |
Да |
Вывод: отсутствие облучения (P<0,001) и доза 6,5 Гр (P<0,05) достоверно отличаются по силе влияния на высоту растений от доз 15 сГр и 1 Гр. Следовательно, малые дозы облучения оказывают более выраженное действие на интенсивность ростовых процессов, чем большие.
Применение непараметрического дисперсионного анализа Крускала-Уоллиса подтверждает результаты параметрического анализа:
Крускал-Уоллис=30,17, Значимость=6,559х10
-6, степ.своб = 3
Гипотеза 1: Есть влияние фактора на отклик.
В связи с тем, что факторные эффекты были расположены в порядке возрастания (дозы облучения ранжированы по столбцам от меньшей к большей), можно применить J-cтатистику Джонкхиера. Расчеты показали влияние облучения на рост сеянцев бархатцев на высоком уровне значимости (Р=0):
Джонкхиер=3209, Значимость=0, степ.своб = 4,120
Гипотеза 1: Есть влияние фактора на отклик.
Теперь рассмотрим более сложную задачу, когда на изучаемый параметр влияют одновременно два фактора. Для анализа таки воздействий применяют двухфакторный дисперсионный анализ. Имеются две разновидности метода в зависимости от того, проводились ли
повторные изменения при каждом сочетании двух исследуемых факторов или нет. В нашем примере мы воспользуемся усредненными результатами, т.е. проанализируем данные без повторных измерений.
Пример 2. Нами было исследовано влияние УФ-облучения в дозах 151, 453, 906, 1359, 2265 и 4530 Дж/м
2 и малых неионных лигандов — оксида азота и оксида углерода — на спектральные характеристики белкового компонента молекулы гемоглобина человека. Выясним вклад каждого из факторов (УФ-радиация или замена лиганда (CO и NO)) в изменения конформации глобинового компонента молекул гемопротеида. Результаты экспериментов представлены в табл. 40.
Таблица представляет собой матрицу 7х2, в которой столбцы отвечают разным уровням фактора 1 (УФ-облучение), а строки — различным уровням фактора 2 (малый неионный лиганд).
Таблица 40
Изменения оптической плотности нативных и УФ-модифицированных образцов нитрозо- и карбоксигемоглобина человека в области поглощения ароматических аминокислот
| Образец |
Доза облучения, Дж/м2 |
| 0 |
151 |
453 |
906 |
2265 |
1359 |
4530 |
| HbNO |
0,347 |
0,361 |
0,350 |
0,353 |
0,367 |
0,355 |
0,364 |
| HbCO |
0,337 |
0,332 |
0,317 |
0,314 |
0,314 |
0,312 |
0,282 |
В соответствии с рассматриваемой разновидностью 2-факторного дисперсионного анализа из меню предлагаемых планов выберем неповторяемый.
В табл. 41 приведены результаты 2-факторного параметрического дисперсионного анализа. В строках представлены значения, внутригрупповой (факт. 1), остаточной (остат.) и межгрупповой (общая) дисперсий, в столбцах — сумма квадратов отклонений, число степеней свободы, средняя сумма квадратов, критерий Фишера, значимость (Р), сила влияния фактора (по Снедекору).
Таблица 41
Результаты двухфакторного параметрического дисперсионного анализа
| Источник |
Сум.квадр |
Ст.своб |
Ср.квадр |
F |
Значимость |
Сила влияния |
| Факт. 1 |
0,0007084 |
6 |
0,0001181 |
0,4721 |
0,8088 |
-0,6355 |
| Факт. 2 |
0,005966 |
1 |
0,005966 |
23,85 |
3,53х10-5 |
0,881 |
| Остат. |
0,001501 |
6 |
0,0002501 |
|
|
|
| Общая |
0,008175 |
13 |
0,0006288 |
|
|
|
F(фактор1)=0,4721, Значимость=0,8088, степ.своб = 6,6
Гипотеза 0: <Нет влияния фактора на отклик>
F(фактор2)=23,85, Значимость=3,53х10
-5, степ.своб = 6
Гипотеза 1: <Есть влияние фактора на отклик>
Затем рассчитываются значения параметров двухфакторной модели с доверительными интервалами:
Параметры модели:
Среднее = 0,3361, доверит.инт.=0,01153
Эффект1-1 = 0,005929, доверит.инт.=0,03059
Эффект1-2 = 0,01043, доверит.инт.=0,03059
Эффект1-3 = -0,002571, доверит.инт.=0,03059
Эффект1-4 = -0,002571, доверит.инт.=0,03059
Эффект1-5 = 0,004429, доверит.инт.=0,03059
Эффект1-6 = -0,002571, доверит.инт.=0,03059
Эффект1-7 = -0,01307, доверит.инт.=0,03059
Эффект2-1 = 0,02064, доверит.инт.=0,1061
Эффект2-2 = -0,02064, доверит.инт.=0,1061
Вывод: Таким образом, УФ-облучение в исследованном диапазоне доз (151 — 4530 Дж/м
2) не вносит заметного вклада в изменения конформации апобелкового компонента молекул гемоглобина человека. Возможно, что именно присутствие неионных лигандов делает гемоглобин устойчивым к воздействию УФ-радиации.
Замена лиганда (NO на CO) оказывает статистически достоверное воздействие (Р<0,001) на спектральные характеристики гемопротеида. Сила влияния фактора составляет 88,1 % (т.е. изменения оптической плотности образцов гемоглобина на 88,1 % обусловлены сменой лиганда в активном центре молекулы).
При эксперименте с
повторными измерениями исходные данные должны представлять собой псевдоматрицу, в которой переменные (столбцы) располагаются в порядке изменения уровней сначала первого фактора, а затем второго фактора. Необходимо также указать число уровней первого фактора.
Задание.
- Повторите теоретический материал раздела «Дисперсионный анализ».
- Проанализируйте, оказывает ли влияние посещаемость занятий на успеваемость по дисциплине. Для этого разделите группу на 2-3 подгруппы: «не пропускают занятия без уважительной причины», «пропускают 2-3 занятия в семестр», «пропускают более 3 занятий в семестр», рассчитайте средний балл успеваемости, заполните матрицу данных.
- Оформите работу в тетради. Сделайте выводы.
- Если у вас есть собственные данные, представляющие собой экспериментальные зависимости, попытайтесь установить для них наличие факторных эффектов.
Ссылка на первоисточник:
http://www.izak.ru/