Задача 7 (Тема 8)
Данные о рыночной цене коттеджей (которые строит фирма), а также об их площади, вместимости гаража и количестве комнат приведены в таблицах 7, 8 и 9.
Требуется:
1) построить линейную регрессионную модель для оценки рыночной стоимости коттеджей, и с помощью этой модели оценить рыночную стоимость коттеджа с 4 комнатами, площадью 200 кв.м., и с вместимостью гаража – 1 автомобиль;
2) с помощью t-статистик проверить гипотезы о незначимости каждого в отдельности объясняющего фактора при уровне значимости 0,1.
3) С помощью F-статистики проверить гипотезу о незначимости всех объясняющих факторов одновременно при уровне значимости 0,1.
4) Выбрать объясняющие факторы, обеспечивающие наибольшее значение скорректированного коэффициента детерминации и с помощью соответствующей модели оценить рыночную стоимость коттеджа с характеристиками, приведенными в п.1.
Таблица 7
Номер наблюдения | Цена, ден.ед. | |||||||||
Номер варианта | ||||||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
1 | 150995 | 146510 | 152490 | 167440 | 161460 | 173420 | 168935 | 159965 | 153985 | 174915 |
2 | 169579 | 164542 | 171258 | 188048 | 181332 | 194764 | 189727 | 179653 | 172937 | 196443 |
3 | 197455 | 191590 | 199410 | 218960 | 211140 | 226780 | 220915 | 209185 | 201365 | 228735 |
4 | 202101 | 196098 | 204102 | 224112 | 216108 | 232116 | 226113 | 214107 | 206103 | 234117 |
5 | 227654 | 220892 | 229908 | 252448 | 243432 | 261464 | 254702 | 241178 | 232162 | 263718 |
6 | 243915 | 236670 | 246330 | 270480 | 260820 | 280140 | 272895 | 258405 | 248745 | 282555 |
7 | 220685 | 214130 | 222870 | 244720 | 235980 | 253460 | 246905 | 233795 | 225055 | 255645 |
8 | 290375 | 281750 | 293250 | 322000 | 310500 | 333500 | 324875 | 307625 | 296125 | 336375 |
9 | 290375 | 281750 | 293250 | 322000 | 310500 | 333500 | 324875 | 307625 | 296125 | 336375 |
10 | 318251 | 308798 | 321402 | 352912 | 340308 | 365516 | 356063 | 337157 | 324553 | 368667 |
11 | 348450 | 338100 | 351900 | 386400 | 372600 | 400200 | 389850 | 369150 | 355350 | 403650 |
Таблица 8
Номер наблю-дения | Площадь, кв.м. | |||||||||
Номер варианта | ||||||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
1 | 101 | 98 | 102 | 112 | 108 | 116 | 113 | 107 | 103 | 117 |
2 | 111,1 | 107,8 | 112,2 | 123,2 | 118,8 | 127,6 | 124,3 | 117,7 | 113,3 | 128,7 |
3 | 116,15 | 112,7 | 117,3 | 128,8 | 124,2 | 133,4 | 129,95 | 123,05 | 118,45 | 134,55 |
4 | 141,4 | 137,2 | 142,8 | 156,8 | 151,2 | 162,4 | 158,2 | 149,8 | 144,2 | 163,8 |
5 | 171,7 | 166,6 | 173,4 | 190,4 | 183,6 | 197,2 | 192,1 | 181,9 | 175,1 | 198,9 |
6 | 181,8 | 176,4 | 183,6 | 201,6 | 194,4 | 208,8 | 203,4 | 192,6 | 185,4 | 210,6 |
7 | 191,9 | 186,2 | 193,8 | 212,8 | 205,2 | 220,4 | 214,7 | 203,3 | 195,7 | 222,3 |
8 | 191,9 | 186,2 | 193,8 | 212,8 | 205,2 | 220,4 | 214,7 | 203,3 | 195,7 | 222,3 |
9 | 212,1 | 205,8 | 214,2 | 235,2 | 226,8 | 243,6 | 237,3 | 224,7 | 216,3 | 245,7 |
10 | 212,1 | 205,8 | 214,2 | 235,2 | 226,8 | 243,6 | 237,3 | 224,7 | 216,3 | 245,7 |
11 | 232,3 | 225,4 | 234,6 | 257,6 | 248,4 | 266,8 | 259,9 | 246,1 | 236,9 | 269,1 |
Таблица 9
Номер наблюдения | Вместимость гаража | К-во комнат |
1 | 0 | 3 |
2 | 0 | 3 |
3 | 1 | 3 |
4 | 0 | 4 |
5 | 1 | 4 |
6 | 1 | 5 |
7 | 0 | 4 |
8 | 1 | 5 |
9 | 2 | 5 |
10 | 2 | 5 |
11 | 2 | 5 |
Решение
Пусть – число наблюдений,
– цена коттеджа для наблюдения
,
,
,
– площадь, вместимость гаража и количество комнат для наблюдения
.
Прогнозные значения (при
) находятся по формуле:
, где
,
,
и
– параметры.
В качестве оценки точности прогноза используется сумма квадратов отклонений прогнозных значений от реальных: .
Для нахождения значений параметров ,
,
и
минимизируется
.
Оценка рыночной стоимости коттеджа при известных значениях показателей
,
и
производится по формуле:
.
Требуется:
1) построим линейную регрессионную модель для оценки рыночной стоимости коттеджей, и с помощью этой модели оценим рыночную стоимость коттеджа с 4 комнатами, площадью 200 кв.м., и с вместимостью гаража – 1 автомобиль;
При выполнении задачи в Excel следует использовать модуль «Регрессия» в «Анализе данных». «Анализ данных» находится в меню «Сервис».
Получили уравнение регрессии:
Оценим рыночную стоимость коттеджа с 4 комнатами, площадью 200 кв.м., и с вместимостью гаража – 1 автомобиль:
ден. ед.
2) с помощью t-статистик проверить гипотезы о незначимости каждого в отдельности объясняющего фактора при уровне значимости 0,1.
Случайная величина имеет распределение Стьюдента со степенями свободы
:
Статистики можно использовать для проверки гипотез.
Пусть .В условиях нашего примера
,
и
.
Как видно из таблицы, значимым коэффициентом является только , все остальные факторы – незначимы.
3) С помощью F-статистики проверить гипотезу о незначимости всех объясняющих факторов одновременно при уровне значимости 0,1.
В случае, если нулевая гипотеза отвергается; если
, нет оснований отвергать нулевую гипотезу (и она принимается).
В условиях нашего примера при :
;
- модель значима.
4)
Построим Матрицу коэффициентов парной корреляции, используя надстройку MS Excel Пакет анализа (команда Сервис\ Анализ данных\ Корреляция)
Матрица коэффициентов парной корреляции
Анализируя матрицу парных коэффициентов корреляции, можно отметить тесную корреляционную связь между переменными Х2 и Х3 ( = 0,918452), что, очевидно, свидетельствует о мультиколлинеарности объясняющих переменных.
Для устранения мультиколлинеарности применим процедуру пошагового отбора наиболее информативных переменных.
Из объясняющих переменных Х1—Х3 выделяется переменная Х3, имеющая с зависимой переменной Y наибольший коэффициент детерминации (равный для парной модели квадрату коэффициента корреляции
). Очевидно, это переменная Х3, так как коэффициент детерминации
— максимальный.
С учетом поправки на несмещенность по формуле –
скорректированный коэффициент детерминации
Среди всевозможных пар объясняющих переменных Х3, выбирается пара (Х3, Х2), имеющая с зависимой переменной Y наиболее высокий коэффициент детерминации
и с учетом поправки
Так как скорректированный коэффициент детерминации на 2-м шаге не увеличился, то в регрессионной модели достаточно ограничиться лишь одной отобранной ранее объясняющей переменной Х3.
ден. ед.