В работе проводится экономико-математический анализ показателей, влияющих на численность безработных. Проворится обоснование выбранных факторов. Актуальность работы определяется как применением эконометрического анализа в социально- экономической сфере.
В качестве исходных данных взята статистическая информация по 30 регионам России за 2013 год.
В качестве объясняемого показателя выбрана «Численность безработных» (Y), а в качестве объясняющих:
- Численность иностранных граждан (x1);
- Пособия и социальная помощь (x2);
- Уровень образования (x3);
- Возрастной состав населения (x4).
Исходные данные для проведения расчетов выбраны из Российского статистического ежегодника за 2013 год, см. таблицу 1.
Таблица 1
Области РФ |
численность безработных, y |
численность иностранных граждан, x1 |
пособия и социальная помощь, x2 |
уровень образования, x3 |
возрастной состав населения, x4 |
Псковская область |
33 |
1976 |
65,6 |
323 |
6,6 |
Тамбовская область |
36 |
2897 |
70,6 |
281 |
9,3 |
Пензенская область |
37 |
4454 |
71,3 |
316 |
6,1 |
Ивановская область |
37 |
1485 |
66,3 |
351 |
3,6 |
Ярославская область |
37 |
1206 |
73,1 |
367 |
7,6 |
Республика Марий Эл |
37 |
234 |
67,8 |
303 |
8 |
Курская область |
38 |
1730 |
70,9 |
319 |
6,5 |
Рязанская область |
41 |
7842 |
68,4 |
316 |
6,1 |
Смоленская область |
41 |
4580 |
61,6 |
303 |
5,4 |
Республика Саха (Якутия) |
43 |
9668 |
56,5 |
338 |
5,5 |
Архангельская область |
41 |
2413 |
47,6 |
347 |
7 |
Тверская область |
44 |
9007 |
63,3 |
321 |
6 |
Республика Бурятия |
42 |
2269 |
65,9 |
347 |
8,2 |
Владимирская область |
44 |
7795 |
72 |
334 |
5,7 |
Тульская область |
43 |
3508 |
56 |
336 |
8,5 |
Мурманская область |
44 |
1427 |
66,5 |
342 |
5,2 |
Республика Коми |
45 |
3407 |
68,7 |
366 |
6,7 |
Астраханская область |
47 |
6775 |
69,2 |
350 |
4,9 |
Брянская область |
46 |
1710 |
67,1 |
346 |
6,2 |
Калининградская область |
49 |
6267 |
69,8 |
357 |
5 |
Томская область |
48 |
2709 |
66,5 |
350 |
6,1 |
Ульяновская область |
48 |
2008 |
66,7 |
338 |
5,6 |
Вологодская область |
49 |
4109 |
67,3 |
324 |
7,4 |
Курганская область |
48 |
649 |
68,8 |
333 |
8,3 |
Хабаровский край |
53 |
12073 |
70,5 |
300 |
4,7 |
Чувашская Республика |
53 |
791 |
70,6 |
337 |
4,9 |
Забайкальский край |
59 |
8647 |
67,5 |
317 |
10,9 |
Удмуртская Республика |
59 |
1708 |
70 |
336 |
5,2 |
Кировская область |
63 |
1314 |
69,1 |
315 |
8,5 |
Оренбургская область |
70 |
5937 |
69,4 |
337 |
6,8 |
Работа выполнена в Пакете анализа электронного процессора Excel.
На первом этапе была определена матрица парных коэффициентов корреляции и проведен тест Фаррара-Глоубера для отбора показателей для последующего моделирования. Самый высокий показатель парной корреляции у показателя «Численность иностранных граждан» (0,206) а самый низкий у показателя «Уровень образования» (0,058). Мы исключаем из последующего рассмотрения показатель «Уровень образования» (х3). Другие показатели (х2, х4) так же, как и х1, имеют средние парные корреляции с Y, что обуславливает необходимость их проверки на наличие между ними мультиколлинеарности. Для этого выполняется тест Фаррара-Глоубера для оставшихся показателей (x2, x4). Наблюдаемое значение статистики Фаррара – Глоубера находится по формуле:
Фактическое значение критерия FG при n (количество наблюдений, то есть штатов) равным 30 и при k (количество показателей) равным 4 составляет 5,75. Оно меньше табличного значения 12,59 (находится через функцию ХИ2ОБР). Таким образом, в массиве переменных отсутствует мультиколлинеарность.
Через обратную матрицу проверяем наличие мультиколлинеарности каждой переменной с другими переменными и вычисляем значения F-критериев:
В результате расчетов были получены следующие значения Fj:
F1=0,1703
F2= 1,2732
F3= 1,0239
Fкрит= 2,1759
Так как все значения Fj меньше табличного Fкрит, то можно сделать вывод: все исследуемые переменные не мультиколлинеарны.
Проведем также проверку на наличие мультиколлинеарности каждой пары переменных через построение матрицы парных корреляций. Сформируем таблицу t-критериев для коэффициентов частной корреляции:
t12 = -0,2675
t13 = -1,0953
t14 = -0,7471
tкрит = 2,059
Из таблицы t-критериев видно, что мультиколинеарность также отсутствует, так как все |tij| < tкрит.
В результате проведения анализа из модели исключен только показатель «Уровень образования» (x3). Таким образом, далее рассматриваем множественную эконометрическую модель вида:
Y = a0 +a1∙x1 + a2∙x2 + a4∙x4 + u (1)
На следующем этапе проводим пошаговый отбор и исключение статистически незначимых параметров модели. Так как ранее был исключен показатель «Уровень образования», то он не будет участвовать в этом пошаговом отборе. На первом этапе отбора все получаемые параметры незначимы (ta1= 1,2517; ta2= 1,0751; ta4= 0,6839), так как их tai Fтабл
Так как , то обнаруживается наличие гетероскедастичности в остатках модели/
Оценим уровень точности множественной линейной модели (1) по стандартной ошибке модели . Для этого необходимо сравнить её со среднеквадратическим отклонением результативного признака Y
.
При стандартной ошибке модели Se= 8,564781 среднеквадратическое отклонение показателя «Численность безработных» Sy= 8,530203; при Sy< Se модель является не точной.
В рамках анализа показателей, определяющих численность безработных в регионах, необходимо провести оценку степени влияния показателей «Численность иностранных граждан», «Пособия и социальная помощь» и «Возрастной состав населения» на результирующую переменную «Численность безработных» с помощью коэффициентов эластичности, и -коэффициентов и выбрать наиболее влиятельный показатель.
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении значения показателя на один процент и находится по формуле, где – коэффициент регрессии, стоящий перед показателем в уравнении регрессии:
Эх1= 0,056, Эх2= 0,468, Эх4= 0,099.
Из результатов анализа видно, что изменение Y по каждому из показателей неэластично, но наибольшим среди них эластичностью обладает показатель Х2 «Численность иностранных граждан».
Бета-коэффициенты показывают, на какую часть величины среднеквадратического отклонения (СКО) меняется среднее значение зависимой переменной с изменением независимой переменной на одно СКО при фиксированном на постоянном уровне значении остальных независимых переменных и находятся по формуле , где где , – среднеквадратические отклонения соответствующих переменных:
βх1=0,2364, βх2=0,2011, βх4=0,12917.
Таким образом, при изменении каждого из показателей на одно СКО показатель «Численность безработных» меняется соответственно на 0,2364; 0,2011; и 0,12917 своего СКО.
Величина дельта-коэффициентов показывает долю влияния конкретного показателя в суммарном влиянии всех показателей,
где – коэффициенты парной корреляции,– коэффициент детерминации: Δх1=0,508, Δх2=0,380, Δх4=0,112.
Как видно из величины дельта-коэффициентов доля влияния показателя «Численность иностранных граждан» в совокупном влиянии трех показателей преобладает.
Из анализа степени влияния показателей на результирующую переменную «Численность безработных» с помощью коэффициентов эластичности, и -коэффициентов можно сделать вывод о преобладающем влиянии показателя «Численность иностранных граждан».
Построим парную регрессию с наиболее влиятельным показателем и сравним качества множественной и парной регрессий. В результате оценки параметров получаем следующую парную регрессию
Y= 43,58+0,0006∙Х1. Согласно этой формуле увеличение значения показателя «Численность иностранных граждан» на 10000 человек ведет к увеличению эндогенного показателя «Численность безработных» на 6 человек.
Модели |
F-критерий |
Стандартная ошибка |
|
парная Y= 43,58+0,0006∙Х1 |
0,0085 |
1,248 |
8,494 |
Множественная линейная Y= 17,2256+0,0006Х1+0,3201Х2+0,6954Х3 |
0,0961 |
0,992 |
8,565 |
Из сводной таблицы сравнения качества парной и множественной линейной модели из трех переменных видно, что модели сравнимы по качественным характеристикам и отдать предпочтения той или другой затруднительно. Парная эконометрическая модель имеет меньшее значения стандартной ошибки и лучшее качество (F) по сравнению с множественной моделью, а множественная - лучшее значение коэффициента детерминации.
Проведем проверку теста на «короткую» и «длинную» регрессии для отбора наиболее существенных объясняющих переменных. Рассмотрим две модели регрессии:
yi= β0 + β1 xi1 +…+ βk xik+ε i (длинную)
yi= β0 + β1 xi1 +…+ βk xik-q+εi (короткую)
Для выполнения теста необходимо построить по МНК длинную регрессию по всем показателям и найти для неё сумму квадратов остатков –. Тоже действие нужно провести для короткой регрессии. Затем следует рассчитать F-статистику:
и сравнить её с табличным значением.
Если Fнабл>Fтабл (α, v1=q, v2=n-k-1), гипотеза отвергается и надо выбрать длинную регрессию, в противном случае – короткую регрессию.
Сумму квадратов остатков равна 1907,242. Сумма квадратов остатков равна 2020,108. Fнабл = 1,453 , а Fтабл = 4,225. Fнабл< Fтабл Таким образом, парная линейная регрессия является статистически более значимой:
Y= 43,58+0,0006∙Х1
На основе полученной парной регрессионной модели рассчитаем модельное значение Yпрог показателя и найдем доверительные интервалы с 95% вероятностью при U= Se* ta.
Y+=Yпрог(n+1) + U
Y- =Yпрог(n+1) - U
В результате проверки значений прогноза попадания в доверительный интервал выявлено, что выбранная парная регрессия не является адекватной, а поэтому не может реально применяться. Это согласуется с проведенным исследованием. Таким образом, взятые в качестве исходных множественная и парная линейные эконометрической модели не могут быть применены для определения численности безработных в регионах. Как было ранее показано, что для этого скорее подойдут нелинейные модели.
Список использованной литературы:
Орлова И.В., Половников В.А. Экономико-математические методы и модели: компьютерное моделирование: учебное пособие, – Вузовский учебник, 2011.
Эконометрика: учебник для магистров / под ред. И.И. Елисеевой. – М.: Изд-во Юрайт, 2012.
Российский статистический ежегодник. 2013. – М.: Росстат, 2013, -717 с.
Орлова И.В., Турундаевский В.Б. Некоторые особенности, возникающие при изучении нелинейной регрессии с использованием Еxcel и других программ. / Экономика, статистика и информатика. Вестник УМО. 2014. № 1. С. 158-161
Орлова И.В. Экономико-математическое моделирование: Практическое пособие по решению задач. - 2-е издание, испр. и доп. – М.: Вузовский учебник: ИНФРА-М, 2012.
9