Исходные данные.
Рассматриваются следующие показатели:
Y - ВВП, млрд. руб.;
Х1 - уровень занятости, %;
Х2 - количество средних предприятий;
Х3 - цена на нефть, USD;
Х4 - прямые инвестиции, млн. USD;
Х5 - сальдо торгового баланса, млн. USD.
Макроэкономические показатели функционирования экономики РФ.
№ |
Год |
Квартал |
Y |
Х1 |
Х2 |
X3 |
Х4 |
Х5 |
1 |
1995 |
I |
234,9775 |
52,4 |
8903 |
16,9033 |
70 |
5515 |
2 |
II |
324,252184 |
52,1 |
8459 |
18,1367 |
114 |
5997 |
|
3 |
III |
421,0596754 |
52,0 |
9015 |
16,1967 |
457 |
4651 |
|
4 |
IV |
448,2327072 |
52,1 |
9306 |
16,9867 |
820 |
3653 |
|
5 |
1996 |
I |
425,2889 |
51,1 |
13147 |
18,6333 |
290 |
4065 |
6 |
II |
468,4185 |
51,4 |
13400 |
19,4767 |
-93 |
4673 |
|
7 |
III |
548,8781 |
51,6 |
13459 |
20,5433 |
579 |
4757 |
|
8 |
IV |
565,2396 |
51,6 |
13562 |
23,1600 |
881 |
8097 |
|
9 |
1997 |
I |
512,3688 |
53,0 |
12520 |
21,1700 |
-350 |
5051 |
10 |
II |
555,0768 |
53,1 |
12369 |
18,0533 |
552 |
3105 |
|
11 |
III |
634,1592 |
52,8 |
11904 |
18,5233 |
860 |
3119 |
|
12 |
IV |
640,9092 |
52,9 |
12405 |
18,7167 |
619 |
3638 |
|
13 |
1998 |
I |
550,8655 |
53,4 |
11100 |
14,0767 |
294 |
101 |
14 |
II |
602,453 |
53,2 |
10869 |
13,2800 |
40 |
1256 |
|
15 |
III |
675,4571 |
53,0 |
10900 |
12,4267 |
255 |
5736 |
|
16 |
IV |
800,8474 |
53,1 |
11396 |
11,0933 |
903 |
9335 |
|
17 |
1999 |
I |
901,3468 |
56,1 |
13596 |
11,0900 |
222 |
6162 |
18 |
II |
1101,5012 |
56,2 |
13200 |
15,3267 |
124 |
6978 |
|
19 |
III |
1373,0663 |
56,0 |
13654 |
20,3300 |
183 |
9396 |
|
20 |
IV |
1447,3192 |
56,3 |
13254 |
24,0500 |
573 |
13478 |
|
21 |
2000 |
I |
1527,4227 |
58,4 |
15864 |
26,7733 |
-156 |
13911 |
22 |
II |
1696,6486 |
58,6 |
14965 |
26,5400 |
3 |
15078 |
|
23 |
III |
2037,845 |
58,0 |
15300 |
30,3400 |
-288 |
15508 |
|
24 |
IV |
2043,73 |
58,7 |
15057 |
29,5767 |
-22 |
15675 |
|
25 |
2001 |
I |
1900,8728 |
59,0 |
14236 |
25,8167 |
-226 |
14269 |
26 |
II |
2105,0057 |
58,9 |
13952 |
27,2400 |
17 |
12537 |
|
27 |
III |
2487,8722 |
59,0 |
13999 |
25,5833 |
16 |
12356 |
|
28 |
IV |
2449,8317 |
59,1 |
13643 |
19,3400 |
409 |
8959 |
|
29 |
2002 |
I |
2262,186608 |
59,1 |
13200 |
21,1533 |
179 |
9538 |
30 |
II |
2528,670978 |
58,9 |
13542 |
25,0700 |
-111 |
11524 |
|
31 |
III |
3012,806067 |
59,0 |
13473 |
26,9133 |
488 |
13204 |
|
32 |
IV |
3026,871261 |
59,2 |
13400 |
26,8567 |
-628 |
12069 |
|
33 |
2003 |
I |
2851,105491 |
59,9 |
14325 |
31,4267 |
848 |
15098 |
34 |
II |
3101,693599 |
59,4 |
14468 |
26,1267 |
778 |
13548 |
|
35 |
III |
3600,220824 |
59,6 |
14586 |
28,4433 |
-717 |
15372 |
|
36 |
IV |
3655,213865 |
60,0 |
14673 |
29,4133 |
-2 678 |
15842 |
|
37 |
2004 |
I |
3515,656534 |
60,3 |
15269 |
31,9500 |
595 |
17370 |
38 |
II |
3971,607965 |
60,6 |
15423 |
35,4900 |
487 |
20213 |
|
39 |
III |
4594,022304 |
60,1 |
15269 |
41,5933 |
-2 117 |
23507 |
|
40 |
IV |
4945,904056 |
60,2 |
15400 |
44,1567 |
2 698 |
24735 |
|
41 |
2005 |
I |
4458,608974 |
61,2 |
18294 |
47,6400 |
776 |
23791 |
42 |
II |
5077,868507 |
60,9 |
18456 |
51,6133 |
2 571 |
29813 |
|
43 |
III |
5845,237909 |
61,3 |
18369 |
61,5500 |
3 387 |
31886 |
|
44 |
IV |
6228,050099 |
61,4 |
18142 |
56,9333 |
-9 105 |
30695 |
|
45 |
2006 |
I |
5792,948505 |
61,5 |
17000 |
61,9133 |
2 915 |
35669 |
46 |
II |
6368,070329 |
61,4 |
17121 |
69,8300 |
5 958 |
36801 |
|
47 |
III |
7275,847142 |
61,9 |
17032 |
70,0933 |
1 873 |
36666 |
|
48 |
IV |
7480,335399 |
61,7 |
17089 |
59,7233 |
-3 145 |
25159 |
|
49 |
2007 |
I |
6780,222849 |
63,1 |
16059 |
58,0667 |
12 020 |
27564 |
50 |
II |
7767,517127 |
63,0 |
16198 |
68,7333 |
-8 421 |
29181 |
|
51 |
III |
8902,73365 |
62,9 |
16196 |
75,0433 |
-19 |
29062 |
|
52 |
IV |
9797,039603 |
63,1 |
16200 |
89,0067 |
7 493 |
37640 |
|
53 |
2008 |
I |
8877,653354 |
62,9 |
16225 |
96,6733 |
4 915 |
48598 |
54 |
II |
10238,28001 |
62,7 |
16612 |
122,4767 |
5 858 |
51219 |
|
55 |
III |
11542,04755 |
63,0 |
17084 |
115,6033 |
5 596 |
51426 |
|
56 |
IV |
10618,86827 |
63,1 |
17387 |
55,5533 |
2 750 |
26383 |
|
57 |
2009 |
I |
8334,632782 |
62,8 |
17195 |
44,9800 |
-4 169 |
20034 |
58 |
II |
9244,828821 |
60,1 |
17476 |
59,1267 |
-1 076 |
21638 |
|
59 |
III |
10411,33396 |
61,7 |
17723 |
68,3700 |
2 824 |
34742 |
|
60 |
IV |
10816,42302 |
62,0 |
18012 |
74,9667 |
-4 277 |
36817 |
|
61 |
2010 |
I |
9995,758259 |
61,1 |
17583 |
76,6500 |
-1 652 |
45245 |
62 |
II |
10977,03526 |
62,9 |
18260 |
78,6733 |
-1 816 |
38069 |
|
63 |
III |
12086,46396 |
63,8 |
18550 |
76,4067 |
-3 055 |
28032 |
|
64 |
IV |
13249,28371 |
63,0 |
18882 |
86,7967 |
-2 925 |
35649 |
|
65 |
2011 |
I |
11954,23042 |
62,7 |
16520 |
104,8967 |
-193 |
46982 |
66 |
II |
13376,37814 |
63,9 |
17090 |
117,1233 |
-5 271 |
51171 |
|
67 |
III |
14732,93116 |
64,9 |
17462 |
112,4733 |
685 |
45190 |
|
68 |
IV |
15903,68704 |
64,1 |
17703 |
109,3133 |
-6 988 |
53511 |
|
69 |
2012 |
I |
13681,70808 |
63,6 |
14587 |
118,5400 |
1 528 |
58791 |
70 |
II |
14911,9385 |
65,3 |
15139 |
108,9000 |
-7 600 |
49280 |
|
71 |
III |
16295,7276 |
65,8 |
15508 |
109,9533 |
2 217 |
38181 |
|
72 |
IV |
17329,00366 |
65,0 |
15826 |
110,4400 |
5 620 |
45411 |
|
73 |
2013 |
I |
14641,78978 |
64,3 |
14026 |
112,8767 |
-25 099 |
48012 |
74 |
II |
15982,74942 |
64,8 |
14659 |
103,0067 |
9 697 |
42275 |
|
75 |
III |
17538,41888 |
65,3 |
15038 |
110,1000 |
3 827 |
42814 |
|
76 |
IV |
18592,34385 |
64,7 |
15372 |
109,3967 |
-4 069 |
47214 |
Основные итоги части 1 – корреляционный анализ.
Выводы по корреляционному анализу.
Парные и частные коэффициенты корреляции:
При проверке значимости полученных коэффициентов корреляции, т.е. гипотезу H0: ρ=0, получили следующие результаты:
Парные: по результатам, наблюдаемое значение t-статистики больше критического tкр=1,992543 по модулю для парных коэффициентов корреляции Pyx1, Pyx2, Pyx3, Pyx5, Px1x2, Px1x3, Px1x5, Px2x3, Px2x5, Px3x5. Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.
Для всех значимых парных генеральных коэффициентов корреляции были получены доверительные интервалы с надежностью γ=0,95, которые показывают нам, что исследуемый парный коэффициент корреляции попадает в полученный доверительный интервал с вероятностью 95%; доверительные интервал представлены ниже:
P(0,788886≤ ρYX1 ≤ 0,909956)=0,95;
P(0,459539≤ ρYX2 ≤ 0,742272)=0,95;
P(0,923778≤ ρYX3 ≤ 0,968837)=0,95;
P(0,860724≤ ρYX5 ≤ 0,941933)=0,95;
P(0,677098≤ ρX1x2 ≤ 0,857157)=0,95;
P(0,748587≤ ρX1X3 ≤ 0,891364)=0,95;
P(0,792549≤ ρX1X5 ≤ 0,911622)=0,95;
P(0,465064≤ ρX2X3 ≤ 0,745411)=0,95;
P(0,557583≤ ρX2X5 ≤ 0,796188)=0,95;
P(0,951727≤ ρX3X5 ≤ 0,980432)=0,95.
Частные: по результатам, наблюдаемое значение t-статистики больше критического tкр=1,992543 по модулю для частных коэффициентов Pyx1/x2x3x4x5, Pyx3/x1x2x4x5, Pyx5/x1x2x3x4, Px1x2/yx3x4x5, Px1x3/yx2x4x5, Px1x5/yx2x3x4, Px2x5/yx1x3x4, Px3x5/yx1x2x4x5. Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.
Как в случае с парными коэффициентами корреляции для всех значимых частных генеральных коэффициентов корреляции были получены доверительные интервалы с надежностью γ=0,95, которые представлены ниже:
P(0,295063≤ ρYX1 ≤ 0,648453)=0,95; ;
P(0,590348≤ ρYX3 ≤ 0,816665)=0,95;
P(-0,54621≤ ρYX5 ≤ -0,14344)=0,95;
P(0,285549≤ ρX1x2 ≤ 0,642391)=0,95;
P(-0,47551≤ ρX1X3 ≤ -0,04861)=0,95;
P(0,102268≤ ρX1X5 ≤ 0,516201)=0,95; ;
P(0,024562≤ ρX2X5 ≤ 0,456664)=0,95;
P(0,762823≤ ρX3X5 ≤ 0,899854)=0,95.
По полученным данным можно сделать следующие выводы:
Парные: между исследуемыми показателями выявлены значимые прямые корреляционные зависимости.
Между ВВП(У) и количеством средних предприятий(Х2), количеством средних предприятий(Х2) и ценой на нефть(Х3) обнаружена умеренная прямая зависимость;
Более сильная связь, по сравнению с предыдущим, наблюдается между количеством средних предприятий(Х2) и сальдо торгового баланса(Х5) и между уровнем занятости(Х1) и количеством средних предприятий (Х2) (0,695595 и 0,783021 соответственно);
Еще сильнее связь наблюдается между уровнем занятости(Х1) и ценой на нефть(Х3), ВВП(У) и уровнем занятости (Х1), уровнем занятости и сальдо торгового баланса(Х5) (0,83389, 0,861174, 0,8636678 соответственно);
Наиболее сильная прямая связь замечена межу ВВП(У) и сальдо торгового баланса(Х5), ВВП(У) и ценой на нефть(Х3), и самая сильная связь между ценой на нефть(Х3) и сальдо торгового баланса (Х5) - 0,969216.
Частные: между ВВП и сальдо торгового баланса и между уровнем безработицы ценой на нефть наблюдаются обратные слабые связи; между ВВП и уровнем безработицы и между уровнем безработицы и количеством средних предприятий- умеренная прямая связь(0,4917 и 0,48383 соответственно); между уровнем безработицы и сальдо торгового баланса, между количеством средних предприятий и сальдо торгового баланса - слабая прямая связь(0,325 и 0,253); наиболее сильные связи наблюдаются среди ВВП и ценой на нефть, между ценой на нефть и сальдо торгового баланса (0,722 и 0,845).
Если сравнивать коэффициенты корреляции, то можно заметить: значимые корреляционные зависимости, полученные на этапе расчёта парных коэффициентов корреляции, не подтвердились при вычислении частных коэффициентов корреляции. Связи между частными коэффициента корреляции ВВП(У) и количеством средних предприятий(Х2), количеством средних предприятий(Х2) и ценой на нефть(Х3) оказались незначимы. При этом выявлены следующие механизмы воздействия переменных друг на друга:
1) Значимая корреляционная связь наблюдается между ВВП и уровнем занятости, ценой на нефть, сальдо торгового баланса; уровнем занятости и количеством средних предприятий, ценой на нефть, сальдо торгового баланса; сальдо торгового баланса и количеством средних предприятий, ценой на нефть. Кроме того, так как у всех этих связей абсолютная величина частного коэффициент корреляции превышает абсолютное значение парного коэффициента корреляции, следовательно, связи усиливаются под воздействием других факторов, причем наибольшее изменение наблюдается между переменными У и Х5, Х1 и Х3; а наименьшее изменение между Х3 и Х5;
2) Если говорить о коэффициентах, которые были значимы при парных, а стали незначимы при частных, то под воздействием других факторов связь между ВВП и количеством средних предприятий усиливается, так же и между количеством средних предприятий и ценой на нефть-усиливается, причем изменение по абсолютным величинам достаточно велико;
3) Если же говорить о незначимых коэффициентах, то под воздействием других факторов связь между ВВП и прямыми инвестициями и между ценой на нефть и прямыми инвестициями ослабевает, связь между уровнем занятости и прямыми инвестициями усиливается, а между прямыми инвестициями и сальдо торгового баланса остается неизменным.
Множественные коэффициенты:
На следующем этапе корреляционного анализа были изучены и проверены на значимость множественные коэффициенты корреляции. F-набл. всех коэффициентов, кроме Х4, превосходят F-кр.=2,345586, значит, гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается с вероятностью ошибки, равной 0,05. Следовательно, все коэффициенты значимы, кроме Х4.
Множественный коэффициент корреляции ry/x1x2x3x4x5=0,966894 - значим и имеет высокое значение, следовательно, ВВП имеет тесную связь с факторными признаками (Х1-уровнем занятости, Х2-количетсво средних предприятий, Х3 - ценой на нефть, Х4 - прямыми инвестициями, Х5- сальдо торгового баланса). Это даёт основание для проведения дальнейшего регрессионного анализа. Коэффициент детерминации (0,934884) показывает, что 93,49% доли дисперсии ВВП (У), обусловлены изменениями факторных признаков. Факторные признаки тоже имеют высокие значения множественных коэффициентов корреляции и детерминации, что говорит об их сильной взаимосвязанности, за исключением переменной X4 – её множественный коэффициент не значим, и это подтверждается тем фактом, что только 4,03% доли её дисперсии обусловлены изменениями переменных, включённых в рассматриваемую модель.
Итак, полученные результаты корреляционного анализа, показавшие, что показатель Y имеет тесную связь с многомерным массивом факторных признаков, позволяют перейти ко второму этапу статистического исследования – построению регрессионной модели.
Основные итоги части 2 – регрессионный анализ на уменьшение переменных.
Проверка исходных данных на мультиколлинеарность.
Матрица парных коэффициентов корреляции факторных признаков.
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
|
Y |
1 |
0,8612 |
0,6207 |
0,9511 |
-0,1167 |
0,9097 |
X1 |
0,8612 |
1 |
0,7830 |
0,8334 |
-0,0669 |
0,8637 |
X2 |
0,6207 |
0,7830 |
1 |
0,6250 |
-0,0258 |
0,6956 |
X3 |
0,9511 |
0,8334 |
0,6250 |
1 |
-0,0677 |
0,9692 |
X4 |
-0,1167 |
-0,0669 |
-0,0258 |
-0,0677 |
1 |
-0,0643 |
X5 |
0,9097 |
0,8637 |
0,6956 |
0,9692 |
-0,0643 |
1 |
Анализ на матрицы парных коэффициентов корреляции факторных признаков показал, что результативный показатель Y (ВВП) очень тесно связан с показателями X1 - уровнем занятости, X3 - ценой на нефть и X4 - прямыми инвестициями, так как ryx1 = 0,8612; ryx3 = 0,9511; ryx5 = 0,9097.
О наличии мультиколлинеарности свидетельствует (значения коэффициентов корреляции превышают по модулю 0,8): rx1x3 = 0,8334; rx1x5 = 0,8637; rx3x5 = 0,9692 (почти функциональная зависимость). Далее необходимо исключить факторы, чтобы избавиться от мультиколлинеарности.
Между собой коррелируют факторы X1 и Х3 (rx1x3 = 0,8334), чтобы исключить один из факторов необходимо выяснить какой из них коррелирует с Y больше: ryx1 = 0,8612 и ryx3 = 0,9511, следовательно, X3 связан с Y больше, поэтому исключаем X1.
Также между собой коррелируют факторы X1 и Х5 (rx1x5 = 0,8637), чтобы исключить один из факторов необходимо выяснить какой из них коррелирует с Y больше: ryx1 = 0,8612 и ryx5 = 0,9097, следовательно, X5 связан с Y больше, поэтому нужно исключить Х1, но на предыдущем этапе мы уже его исключили.
В свою очередь, между собой коррелируют факторы X3 и Х5 (rx3x5 = 0,9692), чтобы исключить один из факторов необходимо выяснить какой из них коррелирует с Y больше: ryx3 = 0,9511 и ryx5 = 0,9097, следовательно, X3 связан с Y больше, поэтому нужно исключить Х5.
По итогам анализа на мультиколлинеарность мы исключаем регрессоры X1 и X5. Далее для проведения регрессионного анализа будем использовать лишь регрессоры X2, X3, X4.
I этап регрессионного анализа.
Регрессионная статистика. Дисперсионный анализ.
Множественный R |
0,953217333 |
|||||
R-квадрат |
0,908623284 |
|||||
Нормированный R-квадрат |
0,904815921 |
|||||
Стандартная ошибка |
1666,706685 |
|||||
Наблюдения |
76 |
|||||
df |
MS |
F набл. |
Значимость F |
|||
Регрессия |
3 |
1988836896 |
662945631,9 |
238,6489671 |
2,54068E-37 |
|
Остаток |
72 |
200009604,4 |
2777911,172 |
|||
Итого |
75 |
2188846500 |
Исследование коэффициентов уравнения регрессии.
Коэффициенты (bi) |
Стандартная ошибка |
t-статистика (t набл.) |
P-Значение |
Нижние 95% |
Верхние 95% |
|
Y-пересечение |
-2670,4217 |
1315,067219 |
-2,030635116 |
0,045986024 |
-5291,960266 |
-48,88308652 |
Х2 |
0,0979 |
0,100455735 |
0,974919627 |
0,33286432 |
-0,10231858 |
0,298191116 |
X3 |
139,5804 |
6,941064818 |
20,10936855 |
2,90892E-31 |
125,7436707 |
153,4171904 |
Х4 |
-0,0633 |
0,042401392 |
-1,492911021 |
0,139829742 |
-0,147827137 |
0,021224125 |
Уравнение регрессии: ŷ = -2670,4217 + 0,0979*X2 + 139,5804*X3 - 0,0633*X4
Проверка значимости уравнения регрессии:
Выдвигаем гипотезу H0: β2=β3=β4=0
α= |
0,05 |
F набл. |
238,6489671 |
F кр. |
2,73180701 |
238,6489671 > 2,73180701, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β2,β3,β4)Т значимо отличается от нуля, т.е. уравнение значимо.
Проверка значимости регрессионных элементов:
α= |
0,05 |
||
t кр. |
1,993463567 |
||
t набл. |
Y-пересечение |
-2,030635116 |
> 1,9935 - гипотеза H0 отвергается, с вероятностью ошибки 0,05, т.е. B0 - значим. |
X2 |
0,974919627 |
< 1,9935 - гипотеза H0 не отвергается, с вероятностью ошибки 0,05, т.е. B2 - незначим. |
|
X3 |
20,10936855 |
> 1,9935 - гипотеза H0 отвергается, с вероятностью ошибки 0,05, т.е. B3 - значим. |
|
X4 |
-1,492911021 |
< 1,9935 - гипотеза H0 не отвергается, с вероятностью ошибки 0,05, т.е. B4 - незначим. |
Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X2 (количество средних предприятий), имеющую незначимый коэффициент регрессии b2, так как t набл. Х2 является наименьшей по модулю t-статистикой из всех незначимых коэффициентов регрессии.
II этап регрессионного анализа.
Регрессионная статистика. Дисперсионный анализ.
Множественный R |
0,952584393 |
|||||
R-квадрат |
0,907417025 |
|||||
Нормированный R-квадрат |
0,904880505 |
|||||
Стандартная ошибка |
1666,141144 |
|||||
Наблюдения |
76 |
|||||
df |
MS |
F |
Значимость F |
|||
Регрессия |
2 |
1986196579 |
993098289,7 |
357,7409497 |
1,89839E-38 |
|
Остаток |
73 |
202649920,8 |
2776026,313 |
|||
Итого |
75 |
2188846500 |
Исследование коэффициентов уравнения регрессии.
Коэффициенты (bi) |
Стандартная ошибка |
t-статистика (t набл.) |
P-Значение |
Нижние 95% |
Верхние 95% |
|
Y-пересечение |
-1432,524779 |
342,1640661 |
-4,186660496 |
7,80734E-05 |
-2114,456779 |
-750,5927784 |
X3 |
143,8090119 |
5,417169767 |
26,54689037 |
3,05828E-39 |
133,0126082 |
154,6054157 |
Х4 |
-0,062423962 |
0,042377453 |
-1,473046578 |
0,14503737 |
-0,146882104 |
0,02203418 |
Уравнение регрессии: ŷ = -1432,5248 + 143,8090*X3 - 0,0624*X4
Проверка значимости уравнения регрессии:
Выдвигаем гипотезу H0: β3=β4=0
α= |
0,05 |
F набл. |
357,7409497 |
F кр. |
3,122102932 |
357,7409497> 3,122102932, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β3,β4)т значимо отличается от нуля, т.е. уравнение значимо.
Проверка значимости регрессионных элементов:
α= |
0,05 |
||
t кр. |
1,9930 |
||
t набл. |
Y-пересечение |
-4,186660496 |
> 1,9930 - гипотеза H0 отвергается, с вероятностью ошибки 0,05, т.е. B0 - значим. |
X3 |
26,54689037 |
> 1,9930 - гипотеза H0 отвергается, с вероятностью ошибки 0,05, т.е. B3 - значим. |
|
X4 |
-1,473046578 |
< 1,9930 - гипотеза H0 не отвергается, с вероятностью ошибки 0,05, т.е. B4 - незначим. |
Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X4 (прямые инвестиции), имеющую незначимый коэффициент регрессии b4, так как t-статистика Х4 является наименьшей по модулю и единственной незначимой; также это и подтверждает p-значение Х4 превышает 0,05 (равно 0,14503737), а доверительный интервал Х4 включает ноль.
III этап регрессионного анализа.
Регрессионная статистика. Дисперсионный анализ.
Множественный R |
0,951138828 |
|||||
R-квадрат |
0,904665071 |
|||||
Нормированный R-квадрат |
0,903376761 |
|||||
Стандартная ошибка |
1679,259516 |
|||||
Наблюдения |
76 |
|||||
df |
MS |
F |
Значимость F |
|||
Регрессия |
1 |
1980172974 |
1980172974 |
702,2107809 |
1,65706E-39 |
|
Остаток |
74 |
208673526,6 |
2819912,521 |
|||
Итого |
75 |
2188846500 |
Исследование коэффициентов уравнения регрессии.
Коэффициенты (bi) |
Стандартная ошибка |
t-статистика (t набл.) |
P-Значение |
Нижние 95% |
Верхние 95% |
|
Y-пересечение |
-1461,317888 |
344,2949254 |
-4,244378236 |
6,27828E-05 |
-2147,340502 |
-775,2952742 |
X3 (Цена на нефть, USD) |
144,3492676 |
5,447294285 |
26,49926001 |
1,65706E-39 |
133,4952968 |
155,2032384 |
Уравнение регрессии: ŷ = -1461,3179 + 144,3493*X3
Проверка значимости уравнения регрессии:
Выдвигаем гипотезу H0: β3=0
α= |
0,05 |
F набл. |
702,2107809 |
F кр. |
3,968470992 |
702,2107809 > 3,968470992, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β3)т значимо отличается от нуля, т.е. уравнение значимо.
Проверка значимости регрессионных элементов:
α= |
0,05 |
||
t кр. |
1,9921 |
||
t набл. |
Y-пересечение |
-4,244378236 |
> 1,9921 - гипотеза H0 отвергается, с вероятностью ошибки 0,05, т.е. B0 - значим. |
X3 |
26,49926001 |
> 1,9921 - гипотеза H0 отвергается, с вероятностью ошибки 0,05, т.е. B2 - значим. |
Все коэффициенты значимы. Для всех этих коэффициентов p-значения не превышают 0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям эти коэффициенты являются значимыми. Следовательно, процесс исключения переменных завершается. Оценка регрессии со значимыми коэффициентами имеет вид: ŷ = -1461,3179 + 144,3493*X3.
Сравнение исходных данных с данными, полученными по уравнению регрессии.
Сравнительная таблица исходных данных показателя ВВП (Y) с рассчитанными по построенной линейной регрессионной модели с помощью процесса исключения переменных.
№п/п |
Наблюдаемое Y1 |
Предсказанное ŷ |
Остатки |
Стандартные остатки |
№п/п |
Наблюдаемое Y1 |
Предсказанное ŷ |
Остатки |
Стандартные остатки |
1 |
234,978 |
978,666 |
-743,688 |
-0,446 |
39 |
4594,022 |
4542,649 |
51,373 |
0,031 |
2 |
324,252 |
1156,697 |
-832,444 |
-0,499 |
40 |
4945,904 |
4912,665 |
33,239 |
0,020 |
3 |
421,060 |
876,659 |
-455,599 |
-0,273 |
41 |
4458,609 |
5415,481 |
-956,872 |
-0,574 |
4 |
448,233 |
990,695 |
-542,462 |
-0,325 |
42 |
5077,869 |
5989,029 |
-911,160 |
-0,546 |
5 |
425,289 |
1228,390 |
-803,101 |
-0,481 |
43 |
5845,238 |
7423,380 |
-1578,142 |
-0,946 |
6 |
468,419 |
1350,125 |
-881,706 |
-0,529 |
44 |
6228,050 |
6756,967 |
-528,917 |
-0,317 |
7 |
548,878 |
1504,097 |
-955,219 |
-0,573 |
45 |
5792,949 |
7475,826 |
-1682,878 |
-1,009 |
8 |
565,240 |
1881,811 |
-1316,572 |
-0,789 |
46 |
6368,070 |
8618,591 |
-2250,521 |
-1,349 |
9 |
512,369 |
1594,556 |
-1082,187 |
-0,649 |
47 |
7275,847 |
8656,603 |
-1380,756 |
-0,828 |
10 |
555,077 |
1144,668 |
-589,591 |
-0,353 |
48 |
7480,335 |
7159,702 |
320,634 |
0,192 |
11 |
634,159 |
1212,512 |
-578,353 |
-0,347 |
49 |
6780,223 |
6920,563 |
-140,340 |
-0,084 |
12 |
640,909 |
1240,419 |
-599,510 |
-0,359 |
50 |
7767,517 |
8460,288 |
-692,771 |
-0,415 |
13 |
550,866 |
570,639 |
-19,773 |
-0,012 |
51 |
8902,734 |
9371,132 |
-468,399 |
-0,281 |
14 |
602,453 |
455,640 |
146,813 |
0,088 |
52 |
9797,040 |
11386,729 |
-1589,690 |
-0,953 |
15 |
675,457 |
332,462 |
342,995 |
0,206 |
53 |
8877,653 |
12493,407 |
-3615,754 |
-2,168 |
16 |
800,847 |
139,997 |
660,851 |
0,396 |
54 |
10238,280 |
16218,099 |
-5979,819 |
-3,585 |
17 |
901,347 |
139,515 |
761,831 |
0,457 |
55 |
11542,048 |
15225,939 |
-3683,891 |
-2,209 |
18 |
1101,501 |
751,075 |
350,426 |
0,210 |
56 |
10618,868 |
6557,765 |
4061,103 |
2,435 |
19 |
1373,066 |
1473,303 |
-100,236 |
-0,060 |
57 |
8334,633 |
5031,512 |
3303,121 |
1,980 |
20 |
1447,319 |
2010,282 |
-562,963 |
-0,338 |
58 |
9244,829 |
7073,573 |
2171,256 |
1,302 |
21 |
1527,423 |
2403,393 |
-875,970 |
-0,525 |
59 |
10411,334 |
8407,842 |
2003,492 |
1,201 |
22 |
1696,649 |
2369,712 |
-673,063 |
-0,404 |
60 |
10816,423 |
9360,066 |
1456,357 |
0,873 |
23 |
2037,845 |
2918,239 |
-880,394 |
-0,528 |
61 |
9995,758 |
9603,053 |
392,705 |
0,235 |
24 |
2043,730 |
2808,052 |
-764,322 |
-0,458 |
62 |
10977,035 |
9895,120 |
1081,915 |
0,649 |
25 |
1900,873 |
2265,299 |
-364,426 |
-0,218 |
63 |
12086,464 |
9567,928 |
2518,535 |
1,510 |
26 |
2105,006 |
2470,756 |
-365,750 |
-0,219 |
64 |
13249,284 |
11067,717 |
2181,566 |
1,308 |
27 |
2487,872 |
2231,618 |
256,255 |
0,154 |
65 |
11954,230 |
13680,439 |
-1726,209 |
-1,035 |
28 |
2449,832 |
1330,397 |
1119,435 |
0,671 |
66 |
13376,378 |
15445,349 |
-2068,971 |
-1,240 |
29 |
2262,187 |
1592,150 |
670,036 |
0,402 |
67 |
14732,931 |
14774,125 |
-41,194 |
-0,025 |
30 |
2528,671 |
2157,518 |
371,153 |
0,223 |
68 |
15903,687 |
14317,982 |
1585,705 |
0,951 |
31 |
3012,806 |
2423,602 |
589,204 |
0,353 |
69 |
13681,708 |
15649,844 |
-1968,136 |
-1,180 |
32 |
3026,871 |
2415,422 |
611,449 |
0,367 |
70 |
14911,939 |
14258,317 |
653,621 |
0,392 |
33 |
2851,105 |
3075,098 |
-223,993 |
-0,134 |
71 |
16295,728 |
14410,365 |
1885,362 |
1,130 |
34 |
3101,694 |
2310,047 |
791,646 |
0,475 |
72 |
17329,004 |
14480,615 |
2848,388 |
1,708 |
35 |
3600,221 |
2644,456 |
955,764 |
0,573 |
73 |
14641,790 |
14832,346 |
-190,556 |
-0,114 |
36 |
3655,214 |
2784,475 |
870,739 |
0,522 |
74 |
15982,749 |
13407,619 |
2575,130 |
1,544 |
37 |
3515,657 |
3150,641 |
365,015 |
0,219 |
75 |
17538,419 |
14431,536 |
3106,882 |
1,863 |
38 |
3971,608 |
3661,638 |
309,970 |
0,186 |
76 |
18592,344 |
14330,011 |
4262,333 |
2,555 |
Выводы по регрессионному анализу на уменьшение переменных.
Регрессионный анализ был начат с осуществления проверки объясняющих переменных на наличие мультиколлинеарности. На основании таблицы 10: матрицы парных коэффициентов корреляции между факторными признаками Xi можно сделать вывод о том, что результативный показатель Y (ВВП) очень тесно связан с показателями X1 - уровнем занятости, X3 - ценой на нефть и X4 - прямыми инвестициями, так как ryx1 = 0,8612; ryx3 = 0,9511; ryx5 = 0,9097.
О наличии мультиколлинеарности свидетельствует (значения коэффициентов корреляции превышают по модулю 0,8): rx1x3 = 0,8334; rx1x5 = 0,8637; rx3x5 = 0,9692 (почти функциональная зависимость). Далее необходимо исключить факторы, чтобы избавиться от мультиколлинеарности.
Между собой коррелируют факторы X1 и Х3 (rx1x3 = 0,8334), чтобы исключить один из факторов необходимо выяснить какой из них коррелирует с Y больше: ryx1 = 0,8612 и ryx3 = 0,9511, следовательно, X3 связан с Y больше, поэтому исключаем X1.
Также между собой коррелируют факторы X1 и Х5 (rx1x5 = 0,8637), чтобы исключить один из факторов необходимо выяснить какой из них коррелирует с Y больше: ryx1 = 0,8612 и ryx5 = 0,9097, следовательно, X5 связан с Y больше, поэтому нужно исключить Х1, но на предыдущем этапе мы уже его исключили.
В свою очередь, между собой коррелируют факторы X3 и Х5 (rx3x5 = 0,9692), чтобы исключить один из факторов необходимо выяснить какой из них коррелирует с Y больше: ryx3 = 0,9511 и ryx5 = 0,9097, следовательно, X3 связан с Y больше, поэтому нужно исключить Х5.
По итогам анализа на мультиколлинеарность мы исключаем регрессоры X1 и X5. Далее для проведения регрессионного анализа будем использовать лишь регрессоры X2, X3, X4.
На I этапе регрессионного анализа были получены коэффициенты регрессии bi и составлено уравнение регрессии: ŷ = -2670,4217 + 0,0979*X2 + 139,5804*X3 - 0,0633*X4. Далее полученное уравнение регрессии и коэффициенты регрессии были проверены на значимость:
А. С помощью F-распределения проверена значимость уравнения регрессии. Так как наблюдаемое значение F-статистики превосходит ее критическое значение 238,6489671 > 2,73180701, то гипотеза о равенстве вектора коэффициентов 0 отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β2,β3,β4)Т значимо отличается от нуля, т.е. уравнение значимо.
Б. С помощью t распределения Стьюдента проверена значимость каждого коэффициента регрессии bi. Гипотеза о равенстве нулю коэффициента β0, β3 отвергается с вероятностью ошибки, равной 0,05, так как наблюдаемое значение t-статистики больше критического по модулю для β0 | -2,030635116| > 1,993463567, для β3 |20,10936855| > 1,993463567, то есть коэффициенты b0 и b3 значимы. В свою очередь, для β2, β4 наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, то есть коэффициенты регрессии β2, β4 - незначимы. С другой стороны, незначимость регрессионных коэффициентов подтверждает:
- столбец p-значений таблицы 13: для β2, β4 наблюдаемое значение p>0,05;
- столбцы интервальных оценок регрессионных коэффициентов с заданным уровнем надёжности γ=0,95: верхние и нижние границы коэффициентов имеют β2, β4 различные знаки (ноль входит в доверительный интервал), а это подтверждает, что они незначимы:
P(-0,10231858 ≤ β2 ≤ 0,298191116) = 0,95
P(-0,147827137 ≤ β4 ≤ 0,021224125) = 0,95.
Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X2 (количество средних предприятий), имеющую незначимый коэффициент регрессии b2, так как t набл. Х2 является наименьшей по модулю t-статистикой из всех незначимых коэффициентов регрессии.
На II этапе регрессионного анализа были получены коэффициенты регрессии biи составлено уравнение регрессии: ŷ = -1432,5248 + 143,8090*X3 - 0,0624*X4. Далее полученное уравнение регрессии и коэффициенты регрессии были проверены на значимость:
А. С помощью F-распределения проверена значимость уравнения регрессии. Так как наблюдаемое значение F-статистики превосходит ее критическое значение 357,7409497> 3,122102932, то гипотеза о равенстве вектора коэффициентов 0 отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β3,β4)т значимо отличается от нуля, т.е. уравнение значимо.
Б. С помощью t распределения Стьюдента проверена значимость каждого коэффициента регрессии bi. Гипотеза о равенстве нулю коэффициентов β0, β3 отвергается с вероятностью ошибки, равной 0,05, так как наблюдаемое значение t-статистики больше критического по модулю |-4,186660496| > 1,9930; |26,54689037| > 1,9930, то есть коэффициенты b0, b3 значимы. С другой стороны, значимость регрессионных коэффициентов подтверждает:
- столбец p-значений таблицы 16: для β0, β3 наблюдаемое значение p≤0,05;
- столбцы интервальных оценок регрессионных коэффициентов с заданным уровнем надёжности γ=0,95: верхние и нижние границы коэффициентов имеют β0, β3 одинаковые знаки (ноль не входит в доверительный интервал), а это подтверждает, что они значимы:
P(-2114,456779 ≤ β0 ≤ -750,5927784) = 0,95
P(133,0126082 ≤ β3 ≤ 154,6054157) = 0,95
В свою очередь, для β4 наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, то есть коэффициент регрессии β4 - незначим.
Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X4 (прямые инвестиции), имеющую незначимый коэффициент регрессии b4, так как t-статистика Х4 является наименьшей по модулю и единственной незначимой; также это и подтверждает p-значение Х4 превышает 0,05 (равно 0,14503737), а доверительный интервал Х4 включает ноль.
На III этапе регрессионного анализа были получены коэффициенты регрессии bi и составлено уравнение регрессии: ŷ = -1461,3179 + 144,3493*X3. Далее полученное уравнение регрессии и коэффициенты регрессии были проверены на значимость:
А. С помощью F-распределения проверена значимость уравнения регрессии. Так как наблюдаемое значение F-статистики превосходит ее критическое значение 702,2107809 > 3,968470992, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β3)т значимо отличается от нуля, т.е. уравнение значимо.
Б. Регрессионные коэффициенты β0, β3 значимы, так как:
- столбец p-значений таблицы 19 для коэффициентов регрессии β0 ≤ 6,27828E-05, β3 ≤ 1,65706E-39, то есть все p≤0,05, а это подтверждает, что они значимы;
- столбцы интервальных оценок регрессионных коэффициентов с заданным уровнем надёжности γ=0,95: верхние и нижние границы коэффициентов имеют β0, β3 одинаковые знаки (ноль не входит в доверительный интервал), а это означает, что они значимы.
Все коэффициенты значимы. Для всех этих коэффициентов p-значения не превышают 0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям эти коэффициенты являются значимыми. Следовательно, процесс исключения переменных завершается. Оценка регрессии со значимыми коэффициентами имеет вид:
ŷ = 3,9680 + 5,7038*X6+ 0,3334*X14
Основные итоги части 3 – регрессионный анализ на включение переменных.
Так как анализ матрицы коэффициентов корреляции выявил наличие мультиколлинеарности, то для получения оптимального уравнения регрессии есть смысл использовать алгоритм пошагового включения переменных.
Шаг 1.
В модель включим объясняющую переменную х3, имеющую самый высокий коэффициент корреляции с зависимой переменной (0,95).
Регрессионная статистика |
|
Множественный R |
0.951138828 |
R-квадрат |
0.904665071 |
Нормированный R-квадрат |
0.903376761 |
Стандартная ошибка |
1679.259516 |
Наблюдения |
76 |
Дисперсионный анализ
df |
MS |
F набл |
Значимость F |
F кр |
||
Регрессия |
1 |
1980172974 |
1980172974 |
702.2107809 |
1.65706E-39 |
3.97022958 |
Остаток |
74 |
208673526.6 |
2819912.521 |
|||
Итого |
75 |
2188846500 |
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
|
Y-пересечение |
-1461.317888 |
344.2949254 |
-4.244378236 |
6.27828E-05 |
-2147.340492 |
-775.2952843 |
X3 |
144.3492676 |
5.447294285 |
26.49926001 |
1.65706E-39 |
133.495297 |
155.2032382 |
В результате получаем оценку уравнения регрессии:
Y = - 1461.32 + 144.35 X3
F набл (702,02) > F кр (3,97) => уравнение регрессии значимо.
t кр (1,99) < |t набл| для коэффициентов 0 и 3 => коэффициенты b0 и b3 не равны нулю. Границы доверительных интервалов имеют один знак. Р-значение не превышает 0.05.
2 шаг.
Включаем поочередно остальные переменные х1, х2, х4 и х5, получаем уравнения:
Y = -16824.87 +283.54 X1 + 115.98 X3 F набл (305.95) > F кр (3.12) = > уравнение регрессии значимо
Y = -2659.37 + 0.095 X2 + 140.265 X3 F набл (357.74) > F кр (3.12) = > уравнение регрессии значимо
Y = -1432.52 + 143.81 X3 - 0.06 X4 F набл( 357.74) > F кр (3.12) = > уравнение регрессии значимо
Y = -1441.53 + 173.96 X3 - 0.07 X5 F набл(356.49) > F кр (3.12) = > уравнение регрессии значимо
Проверка значимости коэффициентов регрессии в каждом уравнении показывает значимость b0, b1 и b3. Коэффициенты b2, b4 и b5 незначимы.
Следовательно, исключаем уравнения регрессии, содержащие переменные х2, х4 и х5 .
Уравнение Y = -16824.87 +283.54 X1 + 115.98 X3 - значимое уравнение со значимыми коэффициентами.
Шаг 3.
Включаем в отобранное уравнение Y = -16824.87 +283.54 X1 + 115.98 X3 по очереди каждую из оставшихся переменных.
Получаем уравнения регрессии:
Y = -19447.85 + 375.45 X1 - 0.19 X2 + 114.82 X3 F набл (286,83) > F кр (2,73) = > уравнение регрессии значимо
Y = -16679.84 + 281.37 X1 + 115.68 X3 - 0.06 X4 F набл (285,84) > F кр (2,73) = > уравнение регрессии значимо
Y = -22940.72 + 397.31 X1 + 176.87 X3 - 0.16 X5 F набл (329,92) > F кр (2,73) = > уравнение регрессии значимо
Уравнения регрессии в целом значимы, но появляются не значимые коэффициенты (Х2 и Х4).
Итак, получаем одно уравнение со значимыми коэффициентами
Y = -22940.72 + 397.31 X1 + 176.87 X3 - 0.16 X5
Процесс включения переменных завершен.
Сравнение исходных данных с данными, полученными по итоговому уравнению регрессии.
Сравнительная таблица исходных данных показателя ВВП (Y) с рассчитанными по построенной линейной регрессионной модели с помощью процесса включения переменных.
№п/п |
Наблюдаемое Y1 |
Предсказанное ŷ |
Остатки |
Стандартные остатки |
№п/п |
Наблюдаемое Y1 |
Предсказанное ŷ |
Остатки |
Стандартные остатки |
1 |
234,978 |
-30,182 |
265,159 |
0,188 |
39 |
4594,022 |
4466,569 |
127,453 |
0,091 |
2 |
324,252 |
-9,712 |
333,964 |
0,237 |
40 |
4945,904 |
4759,736 |
186,168 |
0,132 |
3 |
421,060 |
-173,417 |
594,477 |
0,423 |
41 |
4458,609 |
5926,838 |
-1468,229 |
-1,044 |
4 |
448,233 |
168,533 |
279,700 |
0,199 |
42 |
5077,869 |
5529,921 |
-452,052 |
-0,321 |
5 |
425,289 |
-4,608 |
429,896 |
0,306 |
43 |
5845,238 |
7108,819 |
-1263,581 |
-0,898 |
6 |
468,419 |
164,751 |
303,667 |
0,216 |
44 |
6228,050 |
6525,916 |
-297,866 |
-0,212 |
7 |
548,878 |
419,197 |
129,681 |
0,092 |
45 |
5792,949 |
6636,603 |
-843,655 |
-0,600 |
8 |
565,240 |
338,195 |
227,045 |
0,161 |
46 |
6368,070 |
7812,784 |
-1444,713 |
-1,027 |
9 |
512,369 |
1038,394 |
-526,025 |
-0,374 |
47 |
7275,847 |
8079,992 |
-804,145 |
-0,572 |
10 |
555,077 |
843,723 |
-288,646 |
-0,205 |
48 |
7480,335 |
8039,934 |
-559,598 |
-0,398 |
11 |
634,159 |
805,381 |
-171,222 |
-0,122 |
49 |
6780,223 |
7911,569 |
-1131,347 |
-0,804 |
12 |
640,909 |
794,804 |
-153,895 |
-0,109 |
50 |
7767,517 |
9495,175 |
-1727,658 |
-1,228 |
13 |
550,866 |
748,666 |
-197,801 |
-0,141 |
51 |
8902,734 |
10590,869 |
-1688,135 |
-1,200 |
14 |
602,453 |
340,244 |
262,209 |
0,186 |
52 |
9797,040 |
11743,373 |
-1946,334 |
-1,384 |
15 |
675,457 |
-619,569 |
1295,026 |
0,921 |
53 |
8877,653 |
11235,759 |
-2358,105 |
-1,676 |
16 |
800,847 |
-1401,646 |
2202,493 |
1,566 |
54 |
10238,280 |
15293,386 |
-5055,106 |
-3,593 |
17 |
901,347 |
306,300 |
595,047 |
0,423 |
55 |
11542,048 |
14163,188 |
-2621,141 |
-1,863 |
18 |
1101,501 |
962,510 |
138,991 |
0,099 |
56 |
10618,868 |
7659,324 |
2959,544 |
2,104 |
19 |
1373,066 |
1374,295 |
-1,229 |
-0,001 |
57 |
8334,633 |
6703,758 |
1630,875 |
1,159 |
20 |
1447,319 |
1486,821 |
-39,502 |
-0,028 |
58 |
9244,829 |
7871,994 |
1372,835 |
0,976 |
21 |
1527,423 |
2732,337 |
-1204,914 |
-0,856 |
59 |
10411,334 |
8008,987 |
2402,347 |
1,708 |
22 |
1696,649 |
2580,520 |
-883,871 |
-0,628 |
60 |
10816,423 |
8957,083 |
1859,340 |
1,322 |
23 |
2037,845 |
2944,231 |
-906,386 |
-0,644 |
61 |
9995,758 |
7525,012 |
2470,746 |
1,756 |
24 |
2043,730 |
3060,143 |
-1016,413 |
-0,723 |
62 |
10977,035 |
9766,408 |
1210,627 |
0,861 |
25 |
1900,873 |
2743,226 |
-842,353 |
-0,599 |
63 |
12086,464 |
11357,279 |
729,185 |
0,518 |
26 |
2105,006 |
3237,240 |
-1132,235 |
-0,805 |
64 |
13249,284 |
11636,930 |
1612,353 |
1,146 |
27 |
2487,872 |
3013,426 |
-525,554 |
-0,374 |
65 |
11954,230 |
12873,871 |
-919,641 |
-0,654 |
28 |
2449,832 |
2501,991 |
-52,159 |
-0,037 |
66 |
13376,378 |
14831,123 |
-1454,745 |
-1,034 |
29 |
2262,187 |
2728,443 |
-466,257 |
-0,331 |
67 |
14732,931 |
15379,796 |
-646,865 |
-0,460 |
30 |
2528,671 |
3018,367 |
-489,696 |
-0,348 |
68 |
15903,687 |
13148,237 |
2755,450 |
1,959 |
31 |
3012,806 |
3110,594 |
-97,788 |
-0,070 |
69 |
13681,708 |
13721,827 |
-40,119 |
-0,029 |
32 |
3026,871 |
3364,830 |
-337,959 |
-0,240 |
70 |
14911,939 |
14240,778 |
671,160 |
0,477 |
33 |
2851,105 |
3958,064 |
-1106,959 |
-0,787 |
71 |
16295,728 |
16432,848 |
-137,120 |
-0,097 |
34 |
3101,694 |
3074,369 |
27,325 |
0,019 |
72 |
17329,004 |
15023,908 |
2305,095 |
1,639 |
35 |
3600,221 |
3266,599 |
333,622 |
0,237 |
73 |
14641,790 |
14753,279 |
-111,489 |
-0,079 |
36 |
3655,214 |
3520,561 |
134,653 |
0,096 |
74 |
15982,749 |
14140,311 |
1842,439 |
1,310 |
37 |
3515,657 |
3839,627 |
-323,970 |
-0,230 |
75 |
17538,419 |
15505,802 |
2032,617 |
1,445 |
38 |
3971,608 |
4122,047 |
-150,439 |
-0,107 |
76 |
18592,344 |
14426,622 |
4165,722 |
2,961 |
Вывод.
Отобранное уравнение адекватно отражает реальную ситуацию. Согласно этому уравнению объясняемая переменная Y (ВВП) зависит от Х1 (уровня занятости), Х3 (цен на нефть) и Х5 (сальдо торгового баланса)
Построенные графики сравнения исходных данных и прогнозируемых значений согласно уравнению регрессии показывают, что уравнение адекватно отражает ситуацию. Отклонения кривой прогнозируемых значений незначительны.
Коэффициент детерминации показывает, что 93% вариации признака (ВВП) зависит от вариации данных переменных. Следовательно, модель адекватна.
Коэффициент регрессии при X1 показывает, что при росте уровня занятости на 1%, ВВП Y в среднем увеличивается на 397,31 млрд. рублей при неизменности остальных факторов. Построенная выше интервальная оценка показывает, что с вероятностью 0,95 при росте уровня занятости на 1%, увеличение ВВП будет в пределах от 243,7821971 до 550,8278222 млрд. рублей.
Аналогично, коэффициент регрессии при X3 свидетельствует о том, что при росте цены на нефть на 1 доллар, ВВП Y в среднем увеличивается на 176,8699165 млрд. рублей при неизменности остальных факторов, а с вероятностью 0,95 при росте ены на нефть на 1 доллар, увеличение ВВП Y будет в пределах от 139,1433135 до 214,5965195 млрд. рублей.
Выводы по работе.
В итоге, мы произвели корреляционный анализ, а именно, нашли и проверили значимость парных, частных и множественных коэффициенты корреляции, построили интервальную оценку для значимых показателей, и, как результат, произвели их сравнительный анализ, а после изучения коэффициентов детерминации перешли к построению регрессионной модели, как результат корреляционного анализа.
Используя метод пошагового исключения переменных, а также включения переменных, мы получили окончательную оценку регрессии со значимыми коэффициентами, регрессионная модель имеет вид: ŷ = -22940.72 + 397.31 X1 + 176.87 X3 - 0.16 X5
После интерпретации результатов, получен вывод, что произведенный корреляционный анализ, и полученная регрессионная модель адекватно отражает исследуемый процесс: ВВП Y.
Далее возможно практическое использование модели ВВП в проведении макроэкономических исследований.
Список литературы:
Лондонская фондовая биржа [электронный ресурс].URL: http://www.londonstockexchange.com (дата обращения: 15.09.2014)
Математико-статистический анализ социально-экономических процессов. Межвузовский сборник научных трудов / Отв. ред.: В. С. Мхитарян, В. П. Сиротин, М. Ю. Архипова, Т. А. Дуброва. Вып. 11. М. : МЭСИ, 2014.
Организация экономического сотрудничества и развития [электронный ресурс]. URL: http://www.oecd.org (дата обращения: 15.09.2014)
Орлова И.В. Половников В.А. Экономико-математические методы и модели: компьютерное моделирование: Учебное пособие – 2-е изд. М.: Вузовский учебник, 2007
Сиротин В.П., Архипова М.Ю., Дуброва Т.А. и др. Эконометрика / учебник под ред. проф. Мхитаряна В. С. -М.: Проспект, 2010.
Федеральная служба государственной статистики [электронный ресурс] – URL: http://www.gks.ru (дата обращения: 15.09.2014)