ПОСТРОЕНИЕ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ ВВП РОССИИ - Студенческий научный форум

VII Международная студенческая научная конференция Студенческий научный форум - 2015

ПОСТРОЕНИЕ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ ВВП РОССИИ

IШамин В.А., Катаева О.С., Порфирьева Л.Г.
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Исходные данные.

Рассматриваются следующие показатели:

Y - ВВП, млрд. руб.;

Х1 - уровень занятости, %;

Х2 - количество средних предприятий;

Х3 - цена на нефть, USD;

Х4 - прямые инвестиции, млн. USD;

Х5 - сальдо торгового баланса, млн. USD.

Макроэкономические показатели функционирования экономики РФ.

Год

Квартал

Y

Х1

Х2

X3

Х4

Х5

1

1995

I

234,9775

52,4

8903

16,9033

70

5515

2

II

324,252184

52,1

8459

18,1367

114

5997

3

III

421,0596754

52,0

9015

16,1967

457

4651

4

IV

448,2327072

52,1

9306

16,9867

820

3653

5

1996

I

425,2889

51,1

13147

18,6333

290

4065

6

II

468,4185

51,4

13400

19,4767

-93

4673

7

III

548,8781

51,6

13459

20,5433

579

4757

8

IV

565,2396

51,6

13562

23,1600

881

8097

9

1997

I

512,3688

53,0

12520

21,1700

-350

5051

10

II

555,0768

53,1

12369

18,0533

552

3105

11

III

634,1592

52,8

11904

18,5233

860

3119

12

IV

640,9092

52,9

12405

18,7167

619

3638

13

1998

I

550,8655

53,4

11100

14,0767

294

101

14

II

602,453

53,2

10869

13,2800

40

1256

15

III

675,4571

53,0

10900

12,4267

255

5736

16

IV

800,8474

53,1

11396

11,0933

903

9335

17

1999

I

901,3468

56,1

13596

11,0900

222

6162

18

II

1101,5012

56,2

13200

15,3267

124

6978

19

III

1373,0663

56,0

13654

20,3300

183

9396

20

IV

1447,3192

56,3

13254

24,0500

573

13478

21

2000

I

1527,4227

58,4

15864

26,7733

-156

13911

22

II

1696,6486

58,6

14965

26,5400

3

15078

23

III

2037,845

58,0

15300

30,3400

-288

15508

24

IV

2043,73

58,7

15057

29,5767

-22

15675

25

2001

I

1900,8728

59,0

14236

25,8167

-226

14269

26

II

2105,0057

58,9

13952

27,2400

17

12537

27

III

2487,8722

59,0

13999

25,5833

16

12356

28

IV

2449,8317

59,1

13643

19,3400

409

8959

29

2002

I

2262,186608

59,1

13200

21,1533

179

9538

30

II

2528,670978

58,9

13542

25,0700

-111

11524

31

III

3012,806067

59,0

13473

26,9133

488

13204

32

IV

3026,871261

59,2

13400

26,8567

-628

12069

33

2003

I

2851,105491

59,9

14325

31,4267

848

15098

34

II

3101,693599

59,4

14468

26,1267

778

13548

35

III

3600,220824

59,6

14586

28,4433

-717

15372

36

IV

3655,213865

60,0

14673

29,4133

-2 678

15842

37

2004

I

3515,656534

60,3

15269

31,9500

595

17370

38

II

3971,607965

60,6

15423

35,4900

487

20213

39

III

4594,022304

60,1

15269

41,5933

-2 117

23507

40

IV

4945,904056

60,2

15400

44,1567

2 698

24735

41

2005

I

4458,608974

61,2

18294

47,6400

776

23791

42

II

5077,868507

60,9

18456

51,6133

2 571

29813

43

III

5845,237909

61,3

18369

61,5500

3 387

31886

44

IV

6228,050099

61,4

18142

56,9333

-9 105

30695

45

2006

I

5792,948505

61,5

17000

61,9133

2 915

35669

46

II

6368,070329

61,4

17121

69,8300

5 958

36801

47

III

7275,847142

61,9

17032

70,0933

1 873

36666

48

IV

7480,335399

61,7

17089

59,7233

-3 145

25159

49

2007

I

6780,222849

63,1

16059

58,0667

12 020

27564

50

II

7767,517127

63,0

16198

68,7333

-8 421

29181

51

III

8902,73365

62,9

16196

75,0433

-19

29062

52

IV

9797,039603

63,1

16200

89,0067

7 493

37640

53

2008

I

8877,653354

62,9

16225

96,6733

4 915

48598

54

II

10238,28001

62,7

16612

122,4767

5 858

51219

55

III

11542,04755

63,0

17084

115,6033

5 596

51426

56

IV

10618,86827

63,1

17387

55,5533

2 750

26383

57

2009

I

8334,632782

62,8

17195

44,9800

-4 169

20034

58

II

9244,828821

60,1

17476

59,1267

-1 076

21638

59

III

10411,33396

61,7

17723

68,3700

2 824

34742

60

IV

10816,42302

62,0

18012

74,9667

-4 277

36817

61

2010

I

9995,758259

61,1

17583

76,6500

-1 652

45245

62

II

10977,03526

62,9

18260

78,6733

-1 816

38069

63

III

12086,46396

63,8

18550

76,4067

-3 055

28032

64

IV

13249,28371

63,0

18882

86,7967

-2 925

35649

65

2011

I

11954,23042

62,7

16520

104,8967

-193

46982

66

II

13376,37814

63,9

17090

117,1233

-5 271

51171

67

III

14732,93116

64,9

17462

112,4733

685

45190

68

IV

15903,68704

64,1

17703

109,3133

-6 988

53511

69

2012

I

13681,70808

63,6

14587

118,5400

1 528

58791

70

II

14911,9385

65,3

15139

108,9000

-7 600

49280

71

III

16295,7276

65,8

15508

109,9533

2 217

38181

72

IV

17329,00366

65,0

15826

110,4400

5 620

45411

73

2013

I

14641,78978

64,3

14026

112,8767

-25 099

48012

74

II

15982,74942

64,8

14659

103,0067

9 697

42275

75

III

17538,41888

65,3

15038

110,1000

3 827

42814

76

IV

18592,34385

64,7

15372

109,3967

-4 069

47214

Основные итоги части 1 – корреляционный анализ.

Выводы по корреляционному анализу.

Парные и частные коэффициенты корреляции:

При проверке значимости полученных коэффициентов корреляции, т.е. гипотезу H0: ρ=0, получили следующие результаты:

  1. Парные: по результатам, наблюдаемое значение t-статистики больше критического tкр=1,992543 по модулю для парных коэффициентов корреляции Pyx1, Pyx2, Pyx3, Pyx5, Px1x2, Px1x3, Px1x5, Px2x3, Px2x5, Px3x5. Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Для всех значимых парных генеральных коэффициентов корреляции были получены доверительные интервалы с надежностью γ=0,95, которые показывают нам, что исследуемый парный коэффициент корреляции попадает в полученный доверительный интервал с вероятностью 95%; доверительные интервал представлены ниже:

  • P(0,788886≤ ρYX1 ≤ 0,909956)=0,95;

  • P(0,459539≤ ρYX2 ≤ 0,742272)=0,95;

  • P(0,923778≤ ρYX3 ≤ 0,968837)=0,95;

  • P(0,860724≤ ρYX5 ≤ 0,941933)=0,95;

  • P(0,677098≤ ρX1x2 ≤ 0,857157)=0,95;

  • P(0,748587≤ ρX1X3 ≤ 0,891364)=0,95;

  • P(0,792549≤ ρX1X5 ≤ 0,911622)=0,95;

  • P(0,465064≤ ρX2X3 ≤ 0,745411)=0,95;

  • P(0,557583≤ ρX2X5 ≤ 0,796188)=0,95;

  • P(0,951727≤ ρX3X5 ≤ 0,980432)=0,95.

  1. Частные: по результатам, наблюдаемое значение t-статистики больше критического tкр=1,992543 по модулю для частных коэффициентов Pyx1/x2x3x4x5, Pyx3/x1x2x4x5, Pyx5/x1x2x3x4, Px1x2/yx3x4x5, Px1x3/yx2x4x5, Px1x5/yx2x3x4, Px2x5/yx1x3x4, Px3x5/yx1x2x4x5. Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Как в случае с парными коэффициентами корреляции для всех значимых частных генеральных коэффициентов корреляции были получены доверительные интервалы с надежностью γ=0,95, которые представлены ниже:

  • P(0,295063≤ ρYX1 ≤ 0,648453)=0,95; ;

  • P(0,590348≤ ρYX3 ≤ 0,816665)=0,95;

  • P(-0,54621≤ ρYX5 ≤ -0,14344)=0,95;

  • P(0,285549≤ ρX1x2 ≤ 0,642391)=0,95;

  • P(-0,47551≤ ρX1X3 ≤ -0,04861)=0,95;

  • P(0,102268≤ ρX1X5 ≤ 0,516201)=0,95; ;

  • P(0,024562≤ ρX2X5 ≤ 0,456664)=0,95;

  • P(0,762823≤ ρX3X5 ≤ 0,899854)=0,95.

По полученным данным можно сделать следующие выводы:

Парные: между исследуемыми показателями выявлены значимые прямые корреляционные зависимости.

Между ВВП(У) и количеством средних предприятий(Х2), количеством средних предприятий(Х2) и ценой на нефть(Х3) обнаружена умеренная прямая зависимость;

  1. Более сильная связь, по сравнению с предыдущим, наблюдается между количеством средних предприятий(Х2) и сальдо торгового баланса(Х5) и между уровнем занятости(Х1) и количеством средних предприятий (Х2) (0,695595 и 0,783021 соответственно);

  2. Еще сильнее связь наблюдается между уровнем занятости(Х1) и ценой на нефть(Х3), ВВП(У) и уровнем занятости (Х1), уровнем занятости и сальдо торгового баланса(Х5) (0,83389, 0,861174, 0,8636678 соответственно);

  3. Наиболее сильная прямая связь замечена межу ВВП(У) и сальдо торгового баланса(Х5), ВВП(У) и ценой на нефть(Х3), и самая сильная связь между ценой на нефть(Х3) и сальдо торгового баланса (Х5) - 0,969216.

Частные: между ВВП и сальдо торгового баланса и между уровнем безработицы ценой на нефть наблюдаются обратные слабые связи; между ВВП и уровнем безработицы и между уровнем безработицы и количеством средних предприятий- умеренная прямая связь(0,4917 и 0,48383 соответственно); между уровнем безработицы и сальдо торгового баланса, между количеством средних предприятий и сальдо торгового баланса - слабая прямая связь(0,325 и 0,253); наиболее сильные связи наблюдаются среди ВВП и ценой на нефть, между ценой на нефть и сальдо торгового баланса (0,722 и 0,845).

Если сравнивать коэффициенты корреляции, то можно заметить: значимые корреляционные зависимости, полученные на этапе расчёта парных коэффициентов корреляции, не подтвердились при вычислении частных коэффициентов корреляции. Связи между частными коэффициента корреляции ВВП(У) и количеством средних предприятий(Х2), количеством средних предприятий(Х2) и ценой на нефть(Х3) оказались незначимы. При этом выявлены следующие механизмы воздействия переменных друг на друга:

1) Значимая корреляционная связь наблюдается между ВВП и уровнем занятости, ценой на нефть, сальдо торгового баланса; уровнем занятости и количеством средних предприятий, ценой на нефть, сальдо торгового баланса; сальдо торгового баланса и количеством средних предприятий, ценой на нефть. Кроме того, так как у всех этих связей абсолютная величина частного коэффициент корреляции превышает абсолютное значение парного коэффициента корреляции, следовательно, связи усиливаются под воздействием других факторов, причем наибольшее изменение наблюдается между переменными У и Х5, Х1 и Х3; а наименьшее изменение между Х3 и Х5;

2) Если говорить о коэффициентах, которые были значимы при парных, а стали незначимы при частных, то под воздействием других факторов связь между ВВП и количеством средних предприятий усиливается, так же и между количеством средних предприятий и ценой на нефть-усиливается, причем изменение по абсолютным величинам достаточно велико;

3) Если же говорить о незначимых коэффициентах, то под воздействием других факторов связь между ВВП и прямыми инвестициями и между ценой на нефть и прямыми инвестициями ослабевает, связь между уровнем занятости и прямыми инвестициями усиливается, а между прямыми инвестициями и сальдо торгового баланса остается неизменным.

Множественные коэффициенты:

На следующем этапе корреляционного анализа были изучены и проверены на значимость множественные коэффициенты корреляции. F-набл. всех коэффициентов, кроме Х4, превосходят F-кр.=2,345586, значит, гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается с вероятностью ошибки, равной 0,05. Следовательно, все коэффициенты значимы, кроме Х4.

Множественный коэффициент корреляции ry/x1x2x3x4x5=0,966894 - значим и имеет высокое значение, следовательно, ВВП имеет тесную связь с факторными признаками (Х1-уровнем занятости, Х2-количетсво средних предприятий, Х3 - ценой на нефть, Х4 - прямыми инвестициями, Х5- сальдо торгового баланса). Это даёт основание для проведения дальнейшего регрессионного анализа. Коэффициент детерминации (0,934884) показывает, что 93,49% доли дисперсии ВВП (У), обусловлены изменениями факторных признаков. Факторные признаки тоже имеют высокие значения множественных коэффициентов корреляции и детерминации, что говорит об их сильной взаимосвязанности, за исключением переменной X4 – её множественный коэффициент не значим, и это подтверждается тем фактом, что только 4,03% доли её дисперсии обусловлены изменениями переменных, включённых в рассматриваемую модель.

Итак, полученные результаты корреляционного анализа, показавшие, что показатель Y имеет тесную связь с многомерным массивом факторных признаков, позволяют перейти ко второму этапу статистического исследования – построению регрессионной модели.

Основные итоги части 2 – регрессионный анализ на уменьшение переменных.

Проверка исходных данных на мультиколлинеарность.

Матрица парных коэффициентов корреляции факторных признаков.

 

Y

X1

X2

X3

X4

X5

Y

1

0,8612

0,6207

0,9511

-0,1167

0,9097

X1

0,8612

1

0,7830

0,8334

-0,0669

0,8637

X2

0,6207

0,7830

1

0,6250

-0,0258

0,6956

X3

0,9511

0,8334

0,6250

1

-0,0677

0,9692

X4

-0,1167

-0,0669

-0,0258

-0,0677

1

-0,0643

X5

0,9097

0,8637

0,6956

0,9692

-0,0643

1

Анализ на матрицы парных коэффициентов корреляции факторных признаков показал, что результативный показатель Y (ВВП) очень тесно связан с показателями X1 - уровнем занятости, X3 - ценой на нефть и X4 - прямыми инвестициями, так как ryx1 = 0,8612; ryx3 = 0,9511; ryx5 = 0,9097.

О наличии мультиколлинеарности свидетельствует (значения коэффициентов корреляции превышают по модулю 0,8): rx1x3 = 0,8334; rx1x5 = 0,8637; rx3x5 = 0,9692 (почти функциональная зависимость). Далее необходимо исключить факторы, чтобы избавиться от мультиколлинеарности.

Между собой коррелируют факторы X1 и Х3 (rx1x3 = 0,8334), чтобы исключить один из факторов необходимо выяснить какой из них коррелирует с Y больше: ryx1 = 0,8612 и ryx3 = 0,9511, следовательно, X3 связан с Y больше, поэтому исключаем X1.

Также между собой коррелируют факторы X1 и Х5 (rx1x5 = 0,8637), чтобы исключить один из факторов необходимо выяснить какой из них коррелирует с Y больше: ryx1 = 0,8612 и ryx5 = 0,9097, следовательно, X5 связан с Y больше, поэтому нужно исключить Х1, но на предыдущем этапе мы уже его исключили.

В свою очередь, между собой коррелируют факторы X3 и Х5 (rx3x5 = 0,9692), чтобы исключить один из факторов необходимо выяснить какой из них коррелирует с Y больше: ryx3 = 0,9511 и ryx5 = 0,9097, следовательно, X3 связан с Y больше, поэтому нужно исключить Х5.

По итогам анализа на мультиколлинеарность мы исключаем регрессоры X1 и X5. Далее для проведения регрессионного анализа будем использовать лишь регрессоры X2, X3, X4.

I этап регрессионного анализа.

Регрессионная статистика. Дисперсионный анализ.

Множественный R

0,953217333

R-квадрат

0,908623284

Нормированный R-квадрат

0,904815921

Стандартная ошибка

1666,706685

Наблюдения

76

 

df

 

MS

F набл.

Значимость F

Регрессия

3

1988836896

662945631,9

238,6489671

2,54068E-37

Остаток

72

200009604,4

2777911,172

   

Итого

75

2188846500

     

Исследование коэффициентов уравнения регрессии.

 

Коэффициенты (bi)

Стандартная ошибка

t-статистика (t набл.)

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-2670,4217

1315,067219

-2,030635116

0,045986024

-5291,960266

-48,88308652

Х2

0,0979

0,100455735

0,974919627

0,33286432

-0,10231858

0,298191116

X3

139,5804

6,941064818

20,10936855

2,90892E-31

125,7436707

153,4171904

Х4

-0,0633

0,042401392

-1,492911021

0,139829742

-0,147827137

0,021224125

Уравнение регрессии: ŷ = -2670,4217 + 0,0979*X2 + 139,5804*X3 - 0,0633*X4

Проверка значимости уравнения регрессии:

Выдвигаем гипотезу H0: β234=0

α=

0,05

F набл.

238,6489671

F кр.

2,73180701

238,6489671 > 2,73180701, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β2,β3,β4)Т значимо отличается от нуля, т.е. уравнение значимо.

Проверка значимости регрессионных элементов:

α=

0,05

   

t кр.

1,993463567

   

t набл.

Y-пересечение

-2,030635116

> 1,9935 - гипотеза H0 отвергается, с вероятностью ошибки 0,05, т.е. B0 - значим.

X2

0,974919627

< 1,9935 - гипотеза H0 не отвергается, с вероятностью ошибки 0,05, т.е. B2 - незначим.

X3

20,10936855

> 1,9935 - гипотеза H0 отвергается, с вероятностью ошибки 0,05, т.е. B3 - значим.

X4

-1,492911021

< 1,9935 - гипотеза H0 не отвергается, с вероятностью ошибки 0,05, т.е. B4 - незначим.

Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X2 (количество средних предприятий), имеющую незначимый коэффициент регрессии b2, так как t набл. Х2 является наименьшей по модулю t-статистикой из всех незначимых коэффициентов регрессии.

II этап регрессионного анализа.

Регрессионная статистика. Дисперсионный анализ.

Множественный R

0,952584393

R-квадрат

0,907417025

Нормированный R-квадрат

0,904880505

Стандартная ошибка

1666,141144

Наблюдения

76

 

df

 

MS

F

Значимость F

Регрессия

2

1986196579

993098289,7

357,7409497

1,89839E-38

Остаток

73

202649920,8

2776026,313

   

Итого

75

2188846500

     

Исследование коэффициентов уравнения регрессии.

 

Коэффициенты (bi)

Стандартная ошибка

t-статистика (t набл.)

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-1432,524779

342,1640661

-4,186660496

7,80734E-05

-2114,456779

-750,5927784

X3

143,8090119

5,417169767

26,54689037

3,05828E-39

133,0126082

154,6054157

Х4

-0,062423962

0,042377453

-1,473046578

0,14503737

-0,146882104

0,02203418

Уравнение регрессии: ŷ = -1432,5248 + 143,8090*X3 - 0,0624*X4

Проверка значимости уравнения регрессии:

Выдвигаем гипотезу H0: β34=0

α=

0,05

F набл.

357,7409497

F кр.

3,122102932

357,7409497> 3,122102932, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β3,β4)т значимо отличается от нуля, т.е. уравнение значимо.

Проверка значимости регрессионных элементов:

α=

0,05

   

t кр.

1,9930

   

t набл.

Y-пересечение

-4,186660496

> 1,9930 - гипотеза H0 отвергается, с вероятностью ошибки 0,05, т.е. B0 - значим.

X3

26,54689037

> 1,9930 - гипотеза H0 отвергается, с вероятностью ошибки 0,05, т.е. B3 - значим.

X4

-1,473046578

< 1,9930 - гипотеза H0 не отвергается, с вероятностью ошибки 0,05, т.е. B4 - незначим.

Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X4 (прямые инвестиции), имеющую незначимый коэффициент регрессии b4, так как t-статистика Х4 является наименьшей по модулю и единственной незначимой; также это и подтверждает p-значение Х4 превышает 0,05 (равно 0,14503737), а доверительный интервал Х4 включает ноль.

III этап регрессионного анализа.

Регрессионная статистика. Дисперсионный анализ.

Множественный R

0,951138828

R-квадрат

0,904665071

Нормированный R-квадрат

0,903376761

Стандартная ошибка

1679,259516

Наблюдения

76

 

df

 

MS

F

Значимость F

Регрессия

1

1980172974

1980172974

702,2107809

1,65706E-39

Остаток

74

208673526,6

2819912,521

   

Итого

75

2188846500

     

Исследование коэффициентов уравнения регрессии.

 

Коэффициенты (bi)

Стандартная ошибка

t-статистика (t набл.)

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-1461,317888

344,2949254

-4,244378236

6,27828E-05

-2147,340502

-775,2952742

X3 (Цена на нефть, USD)

144,3492676

5,447294285

26,49926001

1,65706E-39

133,4952968

155,2032384

Уравнение регрессии: ŷ = -1461,3179 + 144,3493*X3

Проверка значимости уравнения регрессии:

Выдвигаем гипотезу H0: β3=0

α=

0,05

F набл.

702,2107809

F кр.

3,968470992

702,2107809 > 3,968470992, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β3)т значимо отличается от нуля, т.е. уравнение значимо.

Проверка значимости регрессионных элементов:

α=

0,05

   

t кр.

1,9921

   

t набл.

Y-пересечение

-4,244378236

> 1,9921 - гипотеза H0 отвергается, с вероятностью ошибки 0,05, т.е. B0 - значим.

X3

26,49926001

> 1,9921 - гипотеза H0 отвергается, с вероятностью ошибки 0,05, т.е. B2 - значим.

Все коэффициенты значимы. Для всех этих коэффициентов p-значения не превышают 0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям эти коэффициенты являются значимыми. Следовательно, процесс исключения переменных завершается. Оценка регрессии со значимыми коэффициентами имеет вид: ŷ = -1461,3179 + 144,3493*X3.

Сравнение исходных данных с данными, полученными по уравнению регрессии.

Сравнительная таблица исходных данных показателя ВВП (Y) с рассчитанными по построенной линейной регрессионной модели с помощью процесса исключения переменных.

п/п

Наблюдаемое Y1

Предсказанное ŷ

Остатки

Стандартные остатки

п/п

Наблюдаемое Y1

Предсказанное ŷ

Остатки

Стандартные остатки

1

234,978

978,666

-743,688

-0,446

39

4594,022

4542,649

51,373

0,031

2

324,252

1156,697

-832,444

-0,499

40

4945,904

4912,665

33,239

0,020

3

421,060

876,659

-455,599

-0,273

41

4458,609

5415,481

-956,872

-0,574

4

448,233

990,695

-542,462

-0,325

42

5077,869

5989,029

-911,160

-0,546

5

425,289

1228,390

-803,101

-0,481

43

5845,238

7423,380

-1578,142

-0,946

6

468,419

1350,125

-881,706

-0,529

44

6228,050

6756,967

-528,917

-0,317

7

548,878

1504,097

-955,219

-0,573

45

5792,949

7475,826

-1682,878

-1,009

8

565,240

1881,811

-1316,572

-0,789

46

6368,070

8618,591

-2250,521

-1,349

9

512,369

1594,556

-1082,187

-0,649

47

7275,847

8656,603

-1380,756

-0,828

10

555,077

1144,668

-589,591

-0,353

48

7480,335

7159,702

320,634

0,192

11

634,159

1212,512

-578,353

-0,347

49

6780,223

6920,563

-140,340

-0,084

12

640,909

1240,419

-599,510

-0,359

50

7767,517

8460,288

-692,771

-0,415

13

550,866

570,639

-19,773

-0,012

51

8902,734

9371,132

-468,399

-0,281

14

602,453

455,640

146,813

0,088

52

9797,040

11386,729

-1589,690

-0,953

15

675,457

332,462

342,995

0,206

53

8877,653

12493,407

-3615,754

-2,168

16

800,847

139,997

660,851

0,396

54

10238,280

16218,099

-5979,819

-3,585

17

901,347

139,515

761,831

0,457

55

11542,048

15225,939

-3683,891

-2,209

18

1101,501

751,075

350,426

0,210

56

10618,868

6557,765

4061,103

2,435

19

1373,066

1473,303

-100,236

-0,060

57

8334,633

5031,512

3303,121

1,980

20

1447,319

2010,282

-562,963

-0,338

58

9244,829

7073,573

2171,256

1,302

21

1527,423

2403,393

-875,970

-0,525

59

10411,334

8407,842

2003,492

1,201

22

1696,649

2369,712

-673,063

-0,404

60

10816,423

9360,066

1456,357

0,873

23

2037,845

2918,239

-880,394

-0,528

61

9995,758

9603,053

392,705

0,235

24

2043,730

2808,052

-764,322

-0,458

62

10977,035

9895,120

1081,915

0,649

25

1900,873

2265,299

-364,426

-0,218

63

12086,464

9567,928

2518,535

1,510

26

2105,006

2470,756

-365,750

-0,219

64

13249,284

11067,717

2181,566

1,308

27

2487,872

2231,618

256,255

0,154

65

11954,230

13680,439

-1726,209

-1,035

28

2449,832

1330,397

1119,435

0,671

66

13376,378

15445,349

-2068,971

-1,240

29

2262,187

1592,150

670,036

0,402

67

14732,931

14774,125

-41,194

-0,025

30

2528,671

2157,518

371,153

0,223

68

15903,687

14317,982

1585,705

0,951

31

3012,806

2423,602

589,204

0,353

69

13681,708

15649,844

-1968,136

-1,180

32

3026,871

2415,422

611,449

0,367

70

14911,939

14258,317

653,621

0,392

33

2851,105

3075,098

-223,993

-0,134

71

16295,728

14410,365

1885,362

1,130

34

3101,694

2310,047

791,646

0,475

72

17329,004

14480,615

2848,388

1,708

35

3600,221

2644,456

955,764

0,573

73

14641,790

14832,346

-190,556

-0,114

36

3655,214

2784,475

870,739

0,522

74

15982,749

13407,619

2575,130

1,544

37

3515,657

3150,641

365,015

0,219

75

17538,419

14431,536

3106,882

1,863

38

3971,608

3661,638

309,970

0,186

76

18592,344

14330,011

4262,333

2,555

Выводы по регрессионному анализу на уменьшение переменных.

Регрессионный анализ был начат с осуществления проверки объясняющих переменных на наличие мультиколлинеарности. На основании таблицы 10: матрицы парных коэффициентов корреляции между факторными признаками Xi можно сделать вывод о том, что результативный показатель Y (ВВП) очень тесно связан с показателями X1 - уровнем занятости, X3 - ценой на нефть и X4 - прямыми инвестициями, так как ryx1 = 0,8612; ryx3 = 0,9511; ryx5 = 0,9097.

О наличии мультиколлинеарности свидетельствует (значения коэффициентов корреляции превышают по модулю 0,8): rx1x3 = 0,8334; rx1x5 = 0,8637; rx3x5 = 0,9692 (почти функциональная зависимость). Далее необходимо исключить факторы, чтобы избавиться от мультиколлинеарности.

Между собой коррелируют факторы X1 и Х3 (rx1x3 = 0,8334), чтобы исключить один из факторов необходимо выяснить какой из них коррелирует с Y больше: ryx1 = 0,8612 и ryx3 = 0,9511, следовательно, X3 связан с Y больше, поэтому исключаем X1.

Также между собой коррелируют факторы X1 и Х5 (rx1x5 = 0,8637), чтобы исключить один из факторов необходимо выяснить какой из них коррелирует с Y больше: ryx1 = 0,8612 и ryx5 = 0,9097, следовательно, X5 связан с Y больше, поэтому нужно исключить Х1, но на предыдущем этапе мы уже его исключили.

В свою очередь, между собой коррелируют факторы X3 и Х5 (rx3x5 = 0,9692), чтобы исключить один из факторов необходимо выяснить какой из них коррелирует с Y больше: ryx3 = 0,9511 и ryx5 = 0,9097, следовательно, X3 связан с Y больше, поэтому нужно исключить Х5.

По итогам анализа на мультиколлинеарность мы исключаем регрессоры X1 и X5. Далее для проведения регрессионного анализа будем использовать лишь регрессоры X2, X3, X4.

На I этапе регрессионного анализа были получены коэффициенты регрессии bi и составлено уравнение регрессии: ŷ = -2670,4217 + 0,0979*X2 + 139,5804*X3 - 0,0633*X4. Далее полученное уравнение регрессии и коэффициенты регрессии были проверены на значимость:

А. С помощью F-распределения проверена значимость уравнения регрессии. Так как наблюдаемое значение F-статистики превосходит ее критическое значение 238,6489671 > 2,73180701, то гипотеза о равенстве вектора коэффициентов 0 отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β2,β3,β4)Т значимо отличается от нуля, т.е. уравнение значимо.

Б. С помощью t распределения Стьюдента проверена значимость каждого коэффициента регрессии bi. Гипотеза о равенстве нулю коэффициента β0, β3 отвергается с вероятностью ошибки, равной 0,05, так как наблюдаемое значение t-статистики больше критического по модулю для β0 | -2,030635116| > 1,993463567, для β3 |20,10936855| > 1,993463567, то есть коэффициенты b0 и b3 значимы. В свою очередь, для β2, β4 наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, то есть коэффициенты регрессии β2, β4 - незначимы. С другой стороны, незначимость регрессионных коэффициентов подтверждает:

- столбец p-значений таблицы 13: для β2, β4 наблюдаемое значение p>0,05;

- столбцы интервальных оценок регрессионных коэффициентов с заданным уровнем надёжности γ=0,95: верхние и нижние границы коэффициентов имеют β2, β4 различные знаки (ноль входит в доверительный интервал), а это подтверждает, что они незначимы:

P(-0,10231858 ≤ β2 ≤ 0,298191116) = 0,95

P(-0,147827137 ≤ β4 ≤ 0,021224125) = 0,95.

Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X2 (количество средних предприятий), имеющую незначимый коэффициент регрессии b2, так как t набл. Х2 является наименьшей по модулю t-статистикой из всех незначимых коэффициентов регрессии.

На II этапе регрессионного анализа были получены коэффициенты регрессии biи составлено уравнение регрессии: ŷ = -1432,5248 + 143,8090*X3 - 0,0624*X4. Далее полученное уравнение регрессии и коэффициенты регрессии были проверены на значимость:

А. С помощью F-распределения проверена значимость уравнения регрессии. Так как наблюдаемое значение F-статистики превосходит ее критическое значение 357,7409497> 3,122102932, то гипотеза о равенстве вектора коэффициентов 0 отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β3,β4)т значимо отличается от нуля, т.е. уравнение значимо.

Б. С помощью t распределения Стьюдента проверена значимость каждого коэффициента регрессии bi. Гипотеза о равенстве нулю коэффициентов β0, β3 отвергается с вероятностью ошибки, равной 0,05, так как наблюдаемое значение t-статистики больше критического по модулю |-4,186660496| > 1,9930; |26,54689037| > 1,9930, то есть коэффициенты b0, b3 значимы. С другой стороны, значимость регрессионных коэффициентов подтверждает:

- столбец p-значений таблицы 16: для β0, β3 наблюдаемое значение p≤0,05;

- столбцы интервальных оценок регрессионных коэффициентов с заданным уровнем надёжности γ=0,95: верхние и нижние границы коэффициентов имеют β0, β3 одинаковые знаки (ноль не входит в доверительный интервал), а это подтверждает, что они значимы:

P(-2114,456779 ≤ β0 ≤ -750,5927784) = 0,95

P(133,0126082 ≤ β3 ≤ 154,6054157) = 0,95

В свою очередь, для β4 наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, то есть коэффициент регрессии β4 - незначим.

Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X4 (прямые инвестиции), имеющую незначимый коэффициент регрессии b4, так как t-статистика Х4 является наименьшей по модулю и единственной незначимой; также это и подтверждает p-значение Х4 превышает 0,05 (равно 0,14503737), а доверительный интервал Х4 включает ноль.

На III этапе регрессионного анализа были получены коэффициенты регрессии bi и составлено уравнение регрессии: ŷ = -1461,3179 + 144,3493*X3. Далее полученное уравнение регрессии и коэффициенты регрессии были проверены на значимость:

А. С помощью F-распределения проверена значимость уравнения регрессии. Так как наблюдаемое значение F-статистики превосходит ее критическое значение 702,2107809 > 3,968470992, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β3)т значимо отличается от нуля, т.е. уравнение значимо.

Б. Регрессионные коэффициенты β0, β3 значимы, так как:

- столбец p-значений таблицы 19 для коэффициентов регрессии β0 ≤ 6,27828E-05, β3 ≤ 1,65706E-39, то есть все p≤0,05, а это подтверждает, что они значимы;

- столбцы интервальных оценок регрессионных коэффициентов с заданным уровнем надёжности γ=0,95: верхние и нижние границы коэффициентов имеют β0, β3 одинаковые знаки (ноль не входит в доверительный интервал), а это означает, что они значимы.

Все коэффициенты значимы. Для всех этих коэффициентов p-значения не превышают 0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям эти коэффициенты являются значимыми. Следовательно, процесс исключения переменных завершается. Оценка регрессии со значимыми коэффициентами имеет вид:

ŷ = 3,9680 + 5,7038*X6+ 0,3334*X14

Основные итоги части 3 – регрессионный анализ на включение переменных.

Так как анализ матрицы коэффициентов корреляции выявил наличие мультиколлинеарности, то для получения оптимального уравнения регрессии есть смысл использовать алгоритм пошагового включения переменных.

Шаг 1.

В модель включим объясняющую переменную х3, имеющую самый высокий коэффициент корреляции с зависимой переменной (0,95).

Регрессионная статистика

Множественный R

0.951138828

R-квадрат

0.904665071

Нормированный R-квадрат

0.903376761

Стандартная ошибка

1679.259516

Наблюдения

76

   

Дисперсионный анализ

             
 

df

 

MS

F набл

Значимость F

F кр

Регрессия

1

1980172974

1980172974

702.2107809

1.65706E-39

3.97022958

Остаток

74

208673526.6

2819912.521

     

Итого

75

2188846500

       
 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-1461.317888

344.2949254

-4.244378236

6.27828E-05

-2147.340492

-775.2952843

X3

144.3492676

5.447294285

26.49926001

1.65706E-39

133.495297

155.2032382

В результате получаем оценку уравнения регрессии:

Y = - 1461.32 + 144.35 X3

F набл (702,02) > F кр (3,97) => уравнение регрессии значимо.

t кр (1,99) < |t набл| для коэффициентов 0 и 3 => коэффициенты b0 и b3 не равны нулю. Границы доверительных интервалов имеют один знак. Р-значение не превышает 0.05.

2 шаг.

Включаем поочередно остальные переменные х1, х2, х4 и х5, получаем уравнения:

Y = -16824.87 +283.54 X1 + 115.98 X3 F набл (305.95) > F кр (3.12) = > уравнение регрессии значимо

Y = -2659.37 + 0.095 X2 + 140.265 X3 F набл (357.74) > F кр (3.12) = > уравнение регрессии значимо

Y = -1432.52 + 143.81 X3 - 0.06 X4 F набл( 357.74) > F кр (3.12) = > уравнение регрессии значимо

Y = -1441.53 + 173.96 X3 - 0.07 X5 F набл(356.49) > F кр (3.12) = > уравнение регрессии значимо

Проверка значимости коэффициентов регрессии в каждом уравнении показывает значимость b0, b1 и b3. Коэффициенты b2, b4 и b5 незначимы.

Следовательно, исключаем уравнения регрессии, содержащие переменные х2, х4 и х5 .

Уравнение Y = -16824.87 +283.54 X1 + 115.98 X3 - значимое уравнение со значимыми коэффициентами.

Шаг 3.

Включаем в отобранное уравнение Y = -16824.87 +283.54 X1 + 115.98 X3 по очереди каждую из оставшихся переменных.

Получаем уравнения регрессии:

Y = -19447.85 + 375.45 X1 - 0.19 X2 + 114.82 X3 F набл (286,83) > F кр (2,73) = > уравнение регрессии значимо

Y = -16679.84 + 281.37 X1 + 115.68 X3 - 0.06 X4 F набл (285,84) > F кр (2,73) = > уравнение регрессии значимо

Y = -22940.72 + 397.31 X1 + 176.87 X3 - 0.16 X5 F набл (329,92) > F кр (2,73) = > уравнение регрессии значимо

Уравнения регрессии в целом значимы, но появляются не значимые коэффициенты (Х2 и Х4).

Итак, получаем одно уравнение со значимыми коэффициентами

Y = -22940.72 + 397.31 X1 + 176.87 X3 - 0.16 X5

Процесс включения переменных завершен.

Сравнение исходных данных с данными, полученными по итоговому уравнению регрессии.

Сравнительная таблица исходных данных показателя ВВП (Y) с рассчитанными по построенной линейной регрессионной модели с помощью процесса включения переменных.

п/п

Наблюдаемое Y1

Предсказанное ŷ

Остатки

Стандартные остатки

п/п

Наблюдаемое Y1

Предсказанное ŷ

Остатки

Стандартные остатки

1

234,978

-30,182

265,159

0,188

39

4594,022

4466,569

127,453

0,091

2

324,252

-9,712

333,964

0,237

40

4945,904

4759,736

186,168

0,132

3

421,060

-173,417

594,477

0,423

41

4458,609

5926,838

-1468,229

-1,044

4

448,233

168,533

279,700

0,199

42

5077,869

5529,921

-452,052

-0,321

5

425,289

-4,608

429,896

0,306

43

5845,238

7108,819

-1263,581

-0,898

6

468,419

164,751

303,667

0,216

44

6228,050

6525,916

-297,866

-0,212

7

548,878

419,197

129,681

0,092

45

5792,949

6636,603

-843,655

-0,600

8

565,240

338,195

227,045

0,161

46

6368,070

7812,784

-1444,713

-1,027

9

512,369

1038,394

-526,025

-0,374

47

7275,847

8079,992

-804,145

-0,572

10

555,077

843,723

-288,646

-0,205

48

7480,335

8039,934

-559,598

-0,398

11

634,159

805,381

-171,222

-0,122

49

6780,223

7911,569

-1131,347

-0,804

12

640,909

794,804

-153,895

-0,109

50

7767,517

9495,175

-1727,658

-1,228

13

550,866

748,666

-197,801

-0,141

51

8902,734

10590,869

-1688,135

-1,200

14

602,453

340,244

262,209

0,186

52

9797,040

11743,373

-1946,334

-1,384

15

675,457

-619,569

1295,026

0,921

53

8877,653

11235,759

-2358,105

-1,676

16

800,847

-1401,646

2202,493

1,566

54

10238,280

15293,386

-5055,106

-3,593

17

901,347

306,300

595,047

0,423

55

11542,048

14163,188

-2621,141

-1,863

18

1101,501

962,510

138,991

0,099

56

10618,868

7659,324

2959,544

2,104

19

1373,066

1374,295

-1,229

-0,001

57

8334,633

6703,758

1630,875

1,159

20

1447,319

1486,821

-39,502

-0,028

58

9244,829

7871,994

1372,835

0,976

21

1527,423

2732,337

-1204,914

-0,856

59

10411,334

8008,987

2402,347

1,708

22

1696,649

2580,520

-883,871

-0,628

60

10816,423

8957,083

1859,340

1,322

23

2037,845

2944,231

-906,386

-0,644

61

9995,758

7525,012

2470,746

1,756

24

2043,730

3060,143

-1016,413

-0,723

62

10977,035

9766,408

1210,627

0,861

25

1900,873

2743,226

-842,353

-0,599

63

12086,464

11357,279

729,185

0,518

26

2105,006

3237,240

-1132,235

-0,805

64

13249,284

11636,930

1612,353

1,146

27

2487,872

3013,426

-525,554

-0,374

65

11954,230

12873,871

-919,641

-0,654

28

2449,832

2501,991

-52,159

-0,037

66

13376,378

14831,123

-1454,745

-1,034

29

2262,187

2728,443

-466,257

-0,331

67

14732,931

15379,796

-646,865

-0,460

30

2528,671

3018,367

-489,696

-0,348

68

15903,687

13148,237

2755,450

1,959

31

3012,806

3110,594

-97,788

-0,070

69

13681,708

13721,827

-40,119

-0,029

32

3026,871

3364,830

-337,959

-0,240

70

14911,939

14240,778

671,160

0,477

33

2851,105

3958,064

-1106,959

-0,787

71

16295,728

16432,848

-137,120

-0,097

34

3101,694

3074,369

27,325

0,019

72

17329,004

15023,908

2305,095

1,639

35

3600,221

3266,599

333,622

0,237

73

14641,790

14753,279

-111,489

-0,079

36

3655,214

3520,561

134,653

0,096

74

15982,749

14140,311

1842,439

1,310

37

3515,657

3839,627

-323,970

-0,230

75

17538,419

15505,802

2032,617

1,445

38

3971,608

4122,047

-150,439

-0,107

76

18592,344

14426,622

4165,722

2,961

Вывод.

Отобранное уравнение адекватно отражает реальную ситуацию. Согласно этому уравнению объясняемая переменная Y (ВВП) зависит от Х1 (уровня занятости), Х3 (цен на нефть) и Х5 (сальдо торгового баланса)

Построенные графики сравнения исходных данных и прогнозируемых значений согласно уравнению регрессии показывают, что уравнение адекватно отражает ситуацию. Отклонения кривой прогнозируемых значений незначительны.

Коэффициент детерминации показывает, что 93% вариации признака (ВВП) зависит от вариации данных переменных. Следовательно, модель адекватна.

Коэффициент регрессии при X1 показывает, что при росте уровня занятости на 1%, ВВП Y в среднем увеличивается на 397,31 млрд. рублей при неизменности остальных факторов. Построенная выше интервальная оценка показывает, что с вероятностью 0,95 при росте уровня занятости на 1%, увеличение ВВП будет в пределах от 243,7821971 до 550,8278222 млрд. рублей.

Аналогично, коэффициент регрессии при X3 свидетельствует о том, что при росте цены на нефть на 1 доллар, ВВП Y в среднем увеличивается на 176,8699165 млрд. рублей при неизменности остальных факторов, а с вероятностью 0,95 при росте ены на нефть на 1 доллар, увеличение ВВП Y будет в пределах от 139,1433135 до 214,5965195 млрд. рублей.

Выводы по работе.

В итоге, мы произвели корреляционный анализ, а именно, нашли и проверили значимость парных, частных и множественных коэффициенты корреляции, построили интервальную оценку для значимых показателей, и, как результат, произвели их сравнительный анализ, а после изучения коэффициентов детерминации перешли к построению регрессионной модели, как результат корреляционного анализа.

Используя метод пошагового исключения переменных, а также включения переменных, мы получили окончательную оценку регрессии со значимыми коэффициентами, регрессионная модель имеет вид: ŷ = -22940.72 + 397.31 X1 + 176.87 X3 - 0.16 X5

После интерпретации результатов, получен вывод, что произведенный корреляционный анализ, и полученная регрессионная модель адекватно отражает исследуемый процесс: ВВП Y.

Далее возможно практическое использование модели ВВП в проведении макроэкономических исследований.

Список литературы:

  1. Лондонская фондовая биржа [электронный ресурс].URL: http://www.londonstockexchange.com (дата обращения: 15.09.2014)

  2. Математико-статистический анализ социально-экономических процессов. Межвузовский сборник научных трудов / Отв. ред.: В. С. Мхитарян, В. П. Сиротин, М. Ю. Архипова, Т. А. Дуброва. Вып. 11. М. : МЭСИ, 2014.

  3. Организация экономического сотрудничества и развития [электронный ресурс]. URL: http://www.oecd.org (дата обращения: 15.09.2014)

  4. Орлова И.В. Половников В.А. Экономико-математические методы и модели: компьютерное моделирование: Учебное пособие – 2-е изд. М.: Вузовский учебник, 2007

  5. Сиротин В.П., Архипова М.Ю., Дуброва Т.А. и др. Эконометрика / учебник под ред. проф. Мхитаряна В. С. -М.: Проспект, 2010.

  6. Федеральная служба государственной статистики [электронный ресурс] – URL: http://www.gks.ru (дата обращения: 15.09.2014)

Просмотров работы: 1146