Оцінка точності моделі
Визначаємо стандартні похибки оцінок параметрів моделі з урахуванням дисперсії залишків:
(2.5)
де – дисперсія залишків:
(2.6)
– елемент матриці похибок С (матриця, обернена до матриці коефіцієнтів системи нормальних рівнянь);
т1 – кількість параметрів моделі.
| < | 319,44 |
|
| |
| < | 20,45 |
Остаточні висновки стосовно стійкості оцінок параметрів можна зробити лише тоді, коли порівняти її з абсолютними значеннями оцінок параметрів моделі.
(2.7)
|
|
Визначається середньоквадратичне відхилення:
(2.8)
Відносна похибка:
(2.9)
Перевірка значущості та довірчі інтервали
Перевірка значущості коефіцієнта детермінації
Для перевірки статистичної значущості коефіцієнта детермінації R2 висувається нульова гіпотеза:
H0: R2=0.
H0 : a1 = a2 = ... = an = 0.
Альтернативною до неї є:
НА: aj ≠ 0
Для перевірки цих обчислюють експериментальне значення F-статистики:
(2.10)
F0.05табл = 3,87
Fексп > F0,05табл
Нульова гіпотеза відхиляється, тобто існує такий коефіцієнт у регресійному рівнянні, який суттєво відрізняється від нуля, а відповідний фактор впливає на досліджувану змінну. Відхилення нуль-гіпотези свідчить про адекватність побудованої моделі.
Перевірка значущості коефіцієнта кореляції
Коефіцієнт кореляції перевіряється на значущість за допомогою t-критерію Ст’юдента. Фактичне значення t-статистики обчислюється за формулою
(2.11)
tтабл визначаємо за допомогою статистичної функції Microsoft Excel СТЬЮДРАСПОБР(0,05;6) для рівня значимості a=0,05 та числу ступенів вільності (n–m1) = 8–2 = 6.
tтабл. = 2,45
|tексп|>tтабл,
Можна зробити висновок, що коефіцієнт кореляції достовірний (значущий), а зв'язок між залежною змінною та незалежним фактором суттєвий.
Оцінка статистичної значущості параметрів моделі
Статистичну значущість кожного параметра моделі можна перевірити за допомогою t-критерію. При цьому нульова гіпотеза має вигляд
Н0 : aj = 0,
альтернативна
НА : aj ≠ 0.
Експериментальне значення t-статистики для кожного параметра моделі обчислюється за формулою
(2.12)
де сjj – діагональний елемент матриці (Х′Х)–1 ;
– стандартна похибка оцінки параметра моделі:
(2.13)
t1 = 6,74; | t0 = 4,98 |
tтабл = | 2,45 |
|tексп|>tтабл,
Значення t-статистики потрапляє до критичної області (за абсолютним значенням перевищує tтабл), приймається альтернативна гіпотеза про значущість параметрів.
Знайдемо інтервали надійності для кожного окремого параметра за формулою:
де t – табличне значення критерію Ст’юдента при k=n–m1 ступенях вільності та рівні значимості a=0,05.
= 319,44 – 2,45 * 64,2 < a0 < 319,44 + 2,45 * 64,2 |
= 20,45 – 2,45 * 3,03 < a1 < 20,45 + 2,45 * 3,03 |
P (0162,34 < a0 < 476,54)
P (13,03< a1 < 27,87)
Розрахуємо коефіцієнт еластичності за формулою:
Зобразимо побудовану кореляційно-регресійну модель на графіку (рис. 2.1).
Рис. 2.1. Кореляційно-регресійна модель
Прогнозування за лінійною моделлю
Побудована модель адекватна за F-критерієм і її можна застосувати для прогнозування залежної змінної. На підставі побудованої моделі можна знайти прогнозне значення залежної змінної Yпр, яке відповідає очікуваному значенню незалежної змінної Xпр.
Прогноз на перспективу буває двох видів: точковий та інтервальний.
Незміщена оцінка точкового прогнозу розглядається як точкова оцінка математичного сподівання прогнозного значення Yпр
(2.14)
а також як індивідуальне значення Yпр для матриці незалежних змінних Хпр, що лежать за межами базового періоду .
У рівняння Yрозр = 319,44 + 20,45×Х підставимо прогнозні значення фактору Хпр = 27,1, що лежить за межами базового періоду (точковий прогноз):
Yпр = 319,44 – 20,45 · 27,1 = 873,616
Дисперсія похибки прогнозу дорівнює
(2.15)
де – дисперсия залишків u, яка розраховується за формулою (2.6);
var(А) – дисперсійно-коваріаційна матриця, яка записується у вигляді:
(2.16)
Матриця похибок:
(Х' * Х)-1 = | 1,72139 | -0,0783024 |
-0,07830 | 0,0038407 |
Елементи на головній діагоналі матриці та за її межами
розраховуються за формулами:
(2.17)
(2.18)
де сjj, cjk – елементи матриці похибок (Х¢Х)–1.
var (А) = | 4122,016 | -187,5018 |
-187,5018 | 9,19690 |
Тоді дисперсія прогнозу буде:
(2.19)
Хпр= | 1 |
27,1 |
Х'пр= | 1 | 27,1 |
Х'пр * var (А) = | –959,2827488 | 61,73419732 |
![]() |
Середньоквадратична (стандартна) похибка прогнозу:
(2.20)
Довірчий інтервал для прогнозних значень:
(2.21)
Інтервальний прогноз математичного сподівання М(Yпр) буде в межах:
(2.22)
873,616 – 2,45 · 26,71543 £ M(Yпр) £ 873,616 + 2,45 · 26,71543 |
808,2458 | £ M(Yпр) £ | 938,9864 |
Визначення інтервального прогнозу індивідуального значення Yпр базується на знаходженні середньоквадратичної помилки прогнозу:
(2.23)
Обчислимо дисперсію та стандартну помилку прогнозу індивідуального значення Yпр:
Тоді інтервальний прогноз індивідуального значення буде відповідати такому довірчому інтервалу:
(2.24)
де t – табличне значення критерію Ст’юдента при k=n–m1 ступенях вільності та рівні значимості a=0,05.
873,616 – 2,45 · 55,7521 £ Yпр £ 873,616 + 2,45 · 55,7521 |
737,1956 | £ Yпр £ | 1010,0366 |
Висновки.
Згідно з обчисленими характеристиками можна сказати, що об’єм реалізації продукції підприємства на 88,3% залежить від витрат на впровадження інновацій в попередньому періоді, а на 11,7% від неврахованих в задачі чинників. Зв’язок між залежною змінною Y та незалежною Х (об’ємом реалізації продукції та витратами на впровадження інновацій в попередньому періоді) досить високий (коефіцієнт кореляції дорівнює 0,94).
Перевірено значимість зв'язку між змінними моделі Fрозр > F0,05табл (8,58>3,87) для рівня надійності a=0,05. З 5%-ним ризиком помилитися припускаємо присутність лінійного зв'язку.
Стандартні помилки параметрів не перевищують абсолютні значення цих параметрів:
Це означає, що оцінки параметрів є незміщеними відносно їх істотних значень.
Середньоквадратичне відхилення
свідчить про те, що фактичні значення Y відхиляються від розрахункових його значень на ±45,3 тис. грн.
Відносна похибка – це характеризує модель з хорошої сторони.
Проведена перевірка значущості коефіцієнта детермінації за F-критерієм Фішера. F0.05табл < Fексп (3,87 < 15,45). Коефіцієнт детермінації значущій.
Перевірена значимість коефіцієнта кореляції за t-критерієм Ст’юдента. tтабл < |tексп| (2,45 < 6,74). Коефіцієнт кореляції достовірний (значущий) і зв'язок між залежною змінною та незалежним фактором суттєвий.
Дана оцінка значимості кожного параметра моделі за допомогою
t-критерію Ст’юдента: |tексп|>tтабл – параметри моделі є значущими.
Отже, модель є достовірною та відображає тісний кількісний взаємозв’язок між залежним та незалежним показниками і може бути використана для практичного економічного висновку.
Були обчислені прогнозні значення Yпр для Хпр = |1; 27,1|:
Yпр = 319,44 + 20,45 · 27,1 = 873,616 тис. грн.
Так, при ймовірності р=0,95 (a=0,05), прогноз математичного сподівання M(Yпр) потрапляє в інтервал [808,2458; 938,9864], а прогноз індивідуального значення Yпр – в інтервал [737,1956; 1010,03].
В економічній інтерпретації це означає, що при прогнозних значеннях збільшення витрат на впровадження інновацій 27,1 тис. грн. об’єм реалізації продукції підприємства потрапляє в інтервал:
808,2458 | ≤ M(Yпр) ≤ | 938,9864 |
Водночас окремі (інтервальні) значення об’єму реалізації продукції підприємства містяться в інтервалі:
737,1956 | ≤ Yпр ≤ | 1010,0366 |
На даному підприємстві збільшення об’єму реалізації продукції обумовлюється збільшенням витрат на впровадження інновацій у попередньому періоді. Так, на кожні 10 тис. грн. збільшення витрат на впровадження інновацій, можливе підвищення об’єму реалізації продукції підприємства на 204,57 тис. грн. за умови незмінної дії інших чинників.
Коефіцієнт еластичності показує, що при збільшенні витрат на впровадження інновацій на 1%, можливе підвищення об’єму реалізації на 0,566%.
Додаток