При проверке статистических гипотез в задачах уровень значимости a принять равным 0,05, а интервал прогноза по уравнению регрессии строить с доверительной вероятностью, например, 0,8.

Задача 1.

Анализ деятельности ряда нефтяных компаний позволил выявить ряд факторов, оказывающих влияние на объем добычи нефти:

- объем капиталовложений,

- уровень механизации,

- производительность труда.

Требуется:

  1. Построить матрицу парных корреляций и обосновать выбор факторных признаков.
  2. Построить модель регрессии со статистически значимыми факторами.
  3. Оценить качество построенной модели.
  4. Построить прогноз объема добычи нефти, если предположить, что значения факторных признаков увеличатся относительно средних значений на 10 %.
  5. Внести рекомендации по увеличению объема добычи нефти.

№ п.п.

Y

объем добычи нефти (млн.тонн)

X1

объем капиталовложений (млн.руб.)

X2

уровень механизации

X3

производительность труда

1

108.81

216.89

177.15

79.5

2

81.18

176.6

152.13

74.57

3

80.75

136.51

95.21

80.57

4

98.41

118.78

102.04

86.16

5

88.45

117.21

91.02

63.55

6

109.19

159.73

129.13

68.85

7

131.86

202.82

193.13

80.58

8

141.36

208.54

193.56

83.77

9

126.46

350.73

177.94

84.44

10

57.89

336.05

162.2

74.13

11

55.22

337.03

151.03

65.25

12

47.76

354.46

147.85

58.59

13

49.82

355.86

164.2

52.49

14

112.61

356.73

162.52

53.2

15

105.69

345.86

147.39

54.63

16

106.01

353.57

139.14

50.85

17

147.61

385.29

229.38

49.68

18

195.09

429.21

363.69

35.96

19

281.22

450.7

520.39

41.37

20

244.94

396.72

417.59

43.79

21

303.92

425.28

502.18

54.74

22

284.73

400.39

441.04

72.21

23

326.81

391.82

480.95

96.71

24

333.29

377.54

504.81

115.4

25

327.47

367.66

520.14

154.26

26

442.14

389.48

868.59

234.06

27

552.59

394.48

1062.66

487.61

28

542.88

371.88

938.69

464.85

29

533.93

371.12

1140.91

386.83

30

550.38

401.33

1312.4

453.46

31

613.27

465.31

1497.94

897.17

32

773.88

587.97

1728.97

991.43

33

731.07

503.7

1571.79

1014.18

34

716.78

534.16

1684.07

986.54

35

598.12

431.35

1471.15

910.15

36

396.22

337.74

958.26

520.08

37

492.54

334.55

1239.89

871.13

38

366.46

304.27

968.96

611.08

39

438.12

309.64

1207.45

593.2

40

425.43

272.73

1243.55

658.2

41

434.75

249.42

1294.02

652.34

42

258.53

176.35

598.85

373.79

43

237.16

143.71

503.76

315.28

44

233.08

123.08

501.89

313.65

45

102.73

75.93

142.3

100.76

46

64.93

68.4

77.69

52

47

77.98

59.04

163.82

29.25

48

102.57

67.43

179.86

51.03

49

88.65

54.92

143.86

41.44

50

77.3

45.59

129.32

24.38

51

78.53

53.95

197.75

46.48

52

74.85

72.16

192.5

58.5

53

66.51

90.35

209.06

56.22

54

102.98

91.05

239.86

67.27

55

162.37

108.45

393.83

143

56

137.39

106.43

334.33

99.12

57

113.77

101.8

286.44

93.43

58

79.56

85.35

233.2

71.43

59

89.48

94.67

246.16

71.99

60

122.62

123.47

296.1

93.92

61

183.44

187.33

459.54

129.99

62

238.02

242.37

507.68

133.24

63

289.63

265.27

554.74

153.72

64

377

309.55

697.95

153.71

65

317

314.9

699.97

153.71

66

258.04

266.77

535.49

133.24

67

219.33

224.06

452

124.62

68

231.58

268.52

549.34

154.36

69

268.49

306.8

629.66

154.35

70

203.41

263.35

521.35

135.51

71

197.03

264.81

494.24

133.23

72

150.35

224.12

322.19

86.92

73

145.25

241.54

321.44

82.05

74

150.73

277.25

396.1

85.79

75

144.48

307.8

366.24

77.99

76

141.06

405.96

382.02

105.61

77

139.06

408.23

424.85

118.6

78

138.18

457.67

432.31

120.72

79

144.12

535.9

459.61

120.16

80

130.34

474.61

428.16

113.98

81

126.83

474.3

441.04

118.9

82

108.61

393.93

371.08

100.08

83

116.01

403.87

412.53

110.46

84

135.44

428.61

534.51

154.16

85

142.88

475.37

583.03

243.8

86

158.69

476.57

600.25

275.58

87

168.49

549.98

612.33

309.31

88

174.8

578.39

618.54

454.09

89

187.15

581.06

579.44

564.31

90

168.71

587.67

527.44

567.59

91

145.7

572.58

411.14

562.65

 

Задача 2.

По ряду филиалов трастовой фирмы получены данные, характеризующие зависимость годовых объемов чистой прибыли инвестиционных проектов от следующих факторов:

- объема инвестиций,

- годового оборота проекта,

- срока окупаемости,

- риска потери инвестиций.

Требуется:

  1. Построить матрицу парных корреляций и оценить тесноту связи между показателями. Проверить значимость коэффициентов корреляции.
  2. Построить модель множественной линейной регрессии со статистически значимыми факторами и дать содержательную характеристику коэффициентов регрессии.
  3. Оценить статистическую значимость уравнения регрессии.
  4. Построить прогноз годового объема чистой прибыли проектов, если предположить, что значения независимых переменных увеличатся относительно последних значений на 2 %.
  5. Внести предложения по увеличению годового объема чистой прибыли инвестиционных проектов.

 

№ проекта

У

объем чистой прибыли инвестиционного проекта

(млн.руб.)

Х1

объем инвестиций, (млн.руб.)

Х2

годовой оборот проекта

Х3

срок окупаемости

(лет)

Х4

риск потери инвестиций

1

7.80

33.00

26.00

5.50

Н

2

1.30

1.14

18.00

1.69

В

3

0.59

1.08

1.65

2.75

Н

4

0.83

3.00

3.90

3.85

Н

5

0.39

0.66

3.00

2.20

Н

6

0.13

0.11

0.75

2.20

Н

7

2.60

9.10

20.40

6.50

Н

8

0.20

0.47

0.31

4.40

Н

9

2.53

6.60

14.95

3.30

В

10

0.65

1.54

1.80

6.60

В

11

4.88

33.00

26.00

8.80

Н

12

0.26

1.30

1.20

6.50

Н

13

4.60

2.40

27.50

0.66

Н

14

0.11

0.54

1.73

5.50

Н

15

0.77

0.77

2.52

5.50

Н

16

0.14

0.50

1.82

5.50

Н

17

0.26

0.46

1.15

2.60

Н

18

0.33

1.20

3.30

4.40

В

19

0.66

1.80

4.55

2.75

Н

20

0.98

1.32

4.50

2.20

Н

21

0.59

1.10

5.20

2.75

В

22

0.07

0.16

0.30

3.25

В

 

Х4 - риск потери инвестиций ( В(высокий)-1, Н (низкий) -0).

 

Задача 3.

В результате анализа уровня потребления продукции по различным регионам страны выявлен ряд факторов, оказывающих на него существенное влияние:

- уровень урбанизации,

- относительный образовательный уровень населения,

- относительный возрастной показатель,

- относительная заработная плата,

- географическое положение региона.

 

 

В данной задаче Y (уровень потребления продукции) – показатель, рассчитанный, исходя из минимального набора продуктов потребительской корзины. Кроме того, в этот показатель включается среднестатистическое потребление лекарственных препаратов и медикаментов. Поэтому единицы измерения этого показателя – условные.

Х1 (уровень урбанизации) – показывает количество городов региона на 100 единиц населенных пунктов всех видов.

Х2, Х3, Х4 – относительные показатели, рассчитанные по определенным методикам, а не полученные прямыми измерениями, поэтому единицы измерения – условные.

Х5 (географическое положение района) – характеризует близость региона к Центральному району ( 1 или 0).

 

 

Требуется:

  1. Построить матрицу парных корреляций и обосновать выбор факторных признаков.
  2. Построить модель множественной линейной регрессии со статистически значимыми факторами.
  3. Построить прогноз уровня потребления продукции, если предположить, что значения факторных признаков уменьшатся относительно средних значений на 2 %.
  4. Внести рекомендации по осуществлению ряда мер, за счет которых может быть увеличен уровень потребления продукции.

 

№ п.п.

Y

уровень потребления продукции(усл.ед.)

X1

уровень урбанизации

X2

относительный образовательный уровень населения,

X3

относительный возрастной показатель

X4

относительная заработная плата

X5

географическое положение региона

1

27.1

42.2

11.2

31.9

35.2

1

2

24.4

48.6

12.6

23.2

37.8

1

3

20.8

42.6

10.6

28.7

32.1

0

4

32.1

49.1

11.4

26.1

42.3

1

5

28.8

34.7

9.3

30.1

32.9

1

6

34.6

44.5

10.8

28.5

49.6

0

7

33.7

39.1

9.7

24.3

35.3

0

8

34.5

40.1

10.1

28.6

45.3

1

9

35.7

45.9

12.2

20.4

47.1

1

10

28.7

38.4

11.3

25.3

35.6

0

11

36.5

46.2

12.8

37.2

43.2

1

12

34.3

50.1

12.9

38.4

48.4

1

13

33.6

39.4

10.5

27.2

39.1

1

14

28.2

31.3

9.2

20.6

30.1

1

15

24.9

25.8

9.1

29.8

27.8

1

16

26.2

37.4

9.6

30.1

34.6

1

17

26.9

46.1

10.5

25.4

36.2

1

18

23.8

27.2

8.7

27.2

24.7

1

19

32.4

34.9

11.2

21.5

40.6

0

20

43.4

48.2

12.8

26.7

44.6

1

21

38.2

40.2

11.7

31.2

42.1

1

22

34.7

41.9

12.3

27.2

43.2

1

23

28.3

35.5

10.6

34.8

38.4

1

24

34.2

44.7

12.4

32.9

39.1

1

25

36.1

48.3

12.8

28.6

40.1

1

26

28.2

39.6

9.6

35.6

37.8

0

27

38.3

47.2

10.2

42.7

42.6

0

28

42.1

51.8

10.7

46.4

46.2

1

29

42.9

52.3

11.1

39.6

48.8

0

30

45.2

54.5

12.9

42.4

54.3

1

 

Задача 4.

В таблице представлены данные о цене техническогло средства (ТС), доходе, возрасте, стаже работы и т.д. 24 сотрудников некоторого предприятия.

 

№ п.п.

Y Цена ТС

X1

Доход

X2

Возраст

X3

Уровень образ.

X4

Стаж

X5

Пол

1 36.20 72.00 55.00 0.00 23.00 0.00
2 76.90 153.00 56.00 0.00 35.00 1.00
3 13.70 28.00 28.00 1.00 4.00 0.00
4 12.50 26.00 24.00 1.00 0.00 1.00
5 11.30 23.00 25.00 0.00 5.00 1.00
6 37.20 76.00 45.00 0.00 13.00 1.00
7 19.80 40.00 42.00 1.00 10.00 1.00
8 28.20 57.00 35.00 0.00 1.00 0.00
9 12.20 24.00 46.00 0.00 11.00 0.00
10 46.10 89.00 34.00 1.00 12.00 1.00
11 35.50 72.00 55.00 1.00 2.00 0.00
12 11.80 24.00 28.00 1.00 4.00 1.00
13 21.30 40.00 31.00 1.00 0.00 0.00
14 68.90 137.00 42.00 1.00 3.00 0.00
15 34.10 70.00 35.00 1.00 9.00 1.00
16 78.90 159.00 52.00 1.00 16.00 1.00
17 18.60 37.00 21.00 1.00 0.00 1.00
18 13.70 28.00 32.00 0.00 2.00 0.00
19 54.70 109.00 42.00 1.00 20.00 0.00
20 58.30 117.00 40.00 0.00 19.00 0.00
21 11.80 23.00 30.00 0.00 3.00 1.00
22 9.50 21.00 48.00 1.00 2.00 1.00
23 8.50 17.00 39.00 1.00 2.00 1.00
24 16.60 34.00 42.00 0.00 13.00 0.00

Обозначения:

в графе Уровень образования: 1 – высшее и неоконченное высшее, 0 – среднее, среднее специальное,

ТС – транспортное средство,

в графе Пол: 1 – мужской, 0 – женский.

Требуется:

 

  1. Проанализировать тесноту и направление связи между переменными, отобрать факторы для регрессионного анализа.
  2. Построить модель множественной регрессии с выбранными факторами. Проверить значимость параметров уравнения.
  3. Построить уравнение только со статистически значимыми факторами. Оценить его качество.
  4. Оценить стпепень влияния, включенных в модель факторов на зависимую переменную при помощи коэффициентов эластичности, бета- и дельта-коэффициентов.
  5. Определить точность модели.

Задача 5.

Исследуется взаимосвязь курса доллара США с курсами евро, японской иены и английского фунта стерлингов. Имеются данные об официальных курсах валют, установленных Центральным Банком России, за двенадцать дней:

День

Доллар США (руб./долл.)

Евро (руб./евро)

Японская иена (руб./100 иен)

Английский фунт (руб./фунт)

1

28,12

36,13

26,97

52,63

2

28,18

35,97

26,80

52,32

3

28,13

35,97

26,77

52,26

4

28,08

36,00

26,63

52,28

5

28,06

36,13

26,53

52,43

6

28,03

36,28

26,70

52,58

7

28,02

36,34

26,67

52,90

8

28,00

36,47

26,63

52,99

9

27,99

36,54

26,60

52,81

10

27,93

36,50

26,50

52,89

11

27,95

36,52

26,55

52,62

12

27,97

36,54

26,52

52,67

Требуется:

  1. Построить линейную регрессионную модель курса доллара США, не содержащую коллинеарных факторов. Оценить параметры модели.
  2. Значимо ли статистически уравнение регрессии?
  3. Изменение курсов каких валют существенно влияет на изменение курса доллара США?
  4. Спрогнозировать курс доллара, если предполагается, что курсы евро, иены и фунта составят соответственно: 36,38 руб./евро; 26,65 руб./100 иен и 52,73 руб./фунт.

 

 

Задача 6.

По заводу безалкогольных напитков изучается зависимость месячного объема реализованной продукции от затрат в предыдущем месяце на теле-, радио-, газетную и наружную рекламу. Имеются данные за двенадцать месяцев:

Месяц

Объем реализации (тыс. руб.)

Затраты на рекламу ( тыс. руб.)

телерекламу

радиорекламу

газетную рекламу наружную рекламу

1

15304

133

35

38 27

2

17554

152

40

32 29

3

16876

130

48

35 28

4

16435

165

40

44 25

5

15229

125

42

48 18

6

16986

158

37

37 32

7

17914

165

50

43 38

8

16817

149

37

38 29

9

16579

169

33

28 27

10

15330

137

31

39 22

11

16781

178

42

42 18

12

17008

147

49

37 19

Требуется:

  1. Построить линейную регрессионную модель объема реализованной продукции, не содержащую коллинеарных факторов. Оценить параметры модели.
  2. Присутствует ли в остатках регрессии автокорреляция первого порядка?
  3. Как влияет на изменение объема реализованной продукции изменение затрат на каждый вид рекламы?
  4. Изменение затрат на какой вид рекламы сильнее всего влияет на изменение объема реализованной продукции?
  5. Спрогнозировать значение объема реализованной продукции, если прогнозные значения факторов на 35 % превышают свои средние значения.

 

 

Задача 7.

По хлебобулочному предприятию исследуется зависимость месячного объема реализованной продукции от затрат в предыдущем месяце на теле-, радио-, газетную и наружную рекламу. Имеются данные за двенадцать месяцев:

Месяц

Объем реализованной продукции (тыс. руб.)

Затраты на рекламу ( тыс. руб.)

телерекламу

радиорекламу

газетную рекламу наружную рекламу

1

14050

240

42

42 34

2

16310

263

47

44 36

3

15632

241

55

45 35

4

15126

276

47

42 32

5

13972

236

49

47 25

6

15753

272

44

45 39

7

16661

276

57

55 45

8

15584

260

46

47 36

9

15326

280

40

35 34

10

14077

248

38

38 29

11

15528

289

49

45 25

12

15755

258

56

52 26

Требуется:

  1. Построить линейную регрессионную модель объема реализованной продукции, не содержащую коллинеарных факторов. Оценить параметры модели.
  2. Какая доля вариации объема реализованной продукции объясняется вариацией факторов, включенных в модель регрессии?
  3. Присутствует ли в остатках регрессии автокорреляция первого порядка?
  4. Приемлема ли точность регрессионной модели?
  5. Спрогнозировать значение объема реализованной продукции, если прогнозные значения факторов на 25 % превышают свои средние значения.

 

 

Задача 8.

По четырнадцати страховым компаниям исследуется зависимость месячной прибыли от численности страховых агентов, затрат на рекламу и расположения офиса компании (центральный или периферийный районы города):

№ компании

Прибыль (тыс. руб.)

Численность страховых агентов (чел.)

Затраты на рекламу (тыс. руб.)

Район расположения

1

726

14

75

периферийный

2

550

8

36

центральный

3

429

4

55

периферийный

4

439

4

45

периферийный

5

646

10

79

периферийный

6

507

10

53

периферийный

7

834

13

69

центральный

8

579

9

47

периферийный

9

701

16

45

центральный

10

532

14

49

периферийный

11

281

7

53

периферийный

12

349

5

45

периферийный

13

625

10

68

периферийный

14

533

11

38

центральный

Требуется:

  1. Построить линейную регрессионную модель прибыли страховой компании, не содержащую коллинеарных факторов. Оценить параметры модели.
  2. Значимо ли статистически уравнение регрессии?
  3. Существенна ли разница в прибыли компаний, офисы которых расположены в центральном и периферийных районах города?
  4. Спрогнозировать месячную прибыль страховой компании, если прогнозные значения факторов равны своим средним значениям, а офис расположен: а) в центре города; б) на окраине.

 

 

Задача 9.

Строится модель цены автомобиля на вторичном рынке в зависимости от пробега, срока эксплуатации и объема двигателя. Имеются данные по пятнадцати автомобилям одной и той же модели:

№ автомобиля

Цена автомобиля ( долл. США)

Пробег ( тыс. км)

Срок эксплуатации (лет)

Объем двигателя (л)

1

12500

130

12

2,3

2

13700

120

10

1,9

3

9200

300

15

1,8

4

11400

180

13

2,1

5

15800

150

14

2,6

6

12300

80

8

1,7

7

16300

170

10

2,4

8

10200

210

11

1,9

9

11000

250

7

1,9

10

12700

150

9

1,7

11

15000

90

4

2,2

12

10500

230

13

2,4

13

17200

120

8

2,3

14

16000

110

9

2,5

15

17100

120

6

2,6

Требуется:

1. Построить линейную регрессионную модель цены автомобиля, не содержащую коллинеарных факторов. Оценить параметры модели.