В домашнем творческом задании проводится эконометрическое моделирование по статистическим данным Индекса Развития Человеческого Потенциала (ИРЧП), а также его факторов по восьмидесяти субъектам Российской Федерации. Основной целью данной работы является определение наиболее и наименее влиятельных факторов, определяющих ИРЧП в РФ.
Для достижения вышеописанной цели были выбраны следующие задачи:
Выбор необходимых для анализа данных
Определение списка влияющих факторов
Исключение из модели незначимых факторов
Проверка адекватности модели
Расчет коэффициентов эластичности, бета и дельта
Актуальность данной работы продиктована сложившейся внешней и внутренней экономической конъюнктурой. В условиях неправомерного ограничения финансовой, импортной и экспортной деятельности экономических агентов Российской Федерации, вопрос развития человеческого потенциала, т.е. условия реализации личности, а также возможности удовлетворения индивидуальных потребностей, вне всяких сомнений является одним из ключевых.
Первоначальные данные были взяты из ежегодного «Доклада о развитии человеческого потенциала по субъектам Российской Федерации за 2009 год», где были представлены данные по восьмидесяти субъектам. Говоря о релевантности данных 2009 года по отношению к ситуации в 2014-2015 годах, необходимо упомянуть о том, что в настоящий момент страна также находится в условиях экономического кризиса, как и в 2009 году. Следовательно, можно утверждать, что это не отразится критически на релевантности результатов.
В работе исследована зависимость показателя ИРЧП от таких факторов как: ВВП в долл. по ППС, индекс дохода, ожидаемая продолжительность жизни, индекс долголетия, грамотность, доля учащихся от 7 до 24 лет и индекс образования.
Для отбора факторов, оказывающих значительное влияние на показатель ИРЧП, были использованы визуальный и пошаговый методы, проделанные с помощью пакета инструментов, функций и анализа данных Microsoft Excel. Первым методом анализа был выбран «визуальный». Вначале, была построена первая матрица парной корреляции:
ИРЧП 2009 |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
|
ИРЧП 2009 |
1 |
|||||||
X1 |
0,7286145 |
1 |
||||||
X2 |
0,7775684 |
0,897969 |
1 |
|||||
X3 |
0,313642 |
-0,13634 |
-0,26953 |
1 |
||||
X4 |
0,3138181 |
-0,13522 |
-0,26882 |
0,999981 |
1 |
|||
X5 |
0,3912065 |
0,427384 |
0,619829 |
-0,47156 |
-0,47221 |
1 |
||
X6 |
0,7060499 |
0,309093 |
0,400619 |
0,093302 |
0,092388 |
0,352982 |
1 |
|
X7 |
0,7181609 |
0,344509 |
0,454727 |
0,032424 |
0,031475 |
0,455751 |
0,993651 |
1 |
Где в свою очередь была выявлена мультиколлинеарность между такими показателями как ВВП в долл. по ППС и индекс дохода (0,897969), Ожидаемая Продолжительность Жизни (ОПЖ) и индексом долголетия (0,999981), а также долей учащихся от 7 до 24 лет и индексом образования (0,993651).
Далее, путем избавления от мультиколлинеарных факторов, имеющих наибольшее влияние на ИРЧП получаем конечную матрицу:
ИРЧП 2009 |
Индекс дохода |
Индекс долголетия |
Грамотность |
Индекс образования |
|
ИРЧП 2009 |
1 |
||||
Индекс дохода |
0,7775684 |
1 |
|||
Индекс долголетия |
0,3138181 |
-0,268817 |
1 |
||
Грамотность |
0,3912065 |
0,619829 |
-0,47221 |
1 |
|
Индекс образования |
0,7181609 |
0,454727 |
0,031475 |
0,455751 |
1 |
Следовательно, в результате исключения незначимых факторов, в конечной модели остались такие факторы как индекс дохода, индекс долголетия, грамотность и индекс образования. Из которых более значимыми являются индекс дохода (0,7775684) и индекс образования (0,7181609). Однако не стоит исключать такие факторы как индекс долголетия (0,3138181) и грамотность (0,3912065), т.к. они немультиколлинеарны и оказывают определенное влияние на ИРЧП.
В результате визуального и регрессионного анализа, получаем следующее уравнение регрессии:
Y = |
0,332(X2) + 0,332(X4) + 2,08(X5) + 0,334(X7) |
Таким образом, при увеличении индекса дохода на (0,1) показателя, фактор ИРЧП увеличится на (0,0332) показателя; при увеличении индекса долголетия на (0,1) показателя, фактор ИРЧП увеличится на (0,0332) показателя; при увеличении фактора грамотности на 1%, фактор ИРЧП увеличится на 2,08%, а при увеличении индекса образования на (0,1) показателя, фактор ИРЧП увеличится на (0,0334) показателя.
Полученные данные необходимо проверить на адекватность при помощи коэффициента детерминации, F-критерия Фишера и средней ошибки аппроксимации.
Коэффициент детерминации |
|||||||||
R^2 = |
0,9999 |
||||||||
Вывод: качество модели высокое, так как коэффициент детерминации близок к единице. |
F-критерий Фишера |
α = |
0,05 |
|||||||||||||||
k = |
7 |
||||||||||||||||
Fрасч = |
180820 |
n = |
80 |
||||||||||||||
Fтабл = |
2,13966 |
||||||||||||||||
Вывод: при данном уровне значимости (α = 0,05) Fрасч > F табл, значит модель является значимой |
Однако, при подсчете средней ошибки аппроксимации Ē, ее значение превысило (7) и составило (25364), что говорит о неадекватности модели.
Следовательно, для дальнейшего моделирования было принято решение об использовании пошагового метода. В связи с чем, был использован инструмент регрессия в анализе данных пакета MS Excel. На основании полученных данных регрессионного анализа, а именно табличной и расчетной t-статистики принимается решение об исключении факторов.
Первоначальная таблица выглядела следующим образом:
Коэффициенты |
Стандартная ошибка |
t-статистика |
|
Y-пересечение |
-0,167547806 |
0,049828761 |
-3,362471843 |
ВВП долл. ППС |
3,82359E-09 |
9,9545E-09 |
0,384106431 |
Индекс дохода |
0,331849452 |
0,001371538 |
241,9542059 |
Ожидаемая Продолжительность Жизни |
0,006706943 |
0,002016276 |
3,326401103 |
Индекс долголетия |
-0,069829272 |
0,120921237 |
-0,577477317 |
Грамотность |
0,002494617 |
0,000851401 |
2,930014197 |
Доля учащихся в возрастах 7-24 |
0,123379144 |
0,041646573 |
2,962528143 |
Индекс образования |
-0,038028775 |
0,125212089 |
-0,303714883 |
t-статистика расчетная |
1,993463567 |
По данным таблицы мы видим, что t-статистика расчетная больше tстатистики табличной по модулю у таких факторов как ВВП долл. ППС, Индекса долголетия и Индекса образования. Т.к. табличное значение Индекса образования наименьшее по модулю (-0,303714883), то первым исключаем его.
Далее, путем избавления от незначимых факторов, имеющих наименьшую по модулю t-статистику, получаем конечную матрицу:
Коэффициенты |
Стандартная ошибка |
t-статистика |
|
Y-пересечение |
-0,13838851 |
0,007874971 |
-17,57320912 |
Индекс дохода |
0,332241571 |
0,000610094 |
544,574436 |
Ожидаемая Продолжитеьность Жизни |
0,005543191 |
1,3742E-05 |
403,3749869 |
Грамотность |
0,002237321 |
7,79018E-05 |
28,71974184 |
Доля учащихся в возрастах 7-24 |
0,11075336 |
0,000391233 |
283,0882244 |
t-статистика расчетная |
1,992102154 |
По данным конечной таблицы составляем уравнение регрессии:
Y = |
0,332(X2) + 0,005(X3) + 0,002(X5) + 0,11(X6) |
Таким образом, при увеличении индекса дохода на (0,1) показателя, фактор ИРЧП увеличится на (0,0332) показателя; при увеличении ОПЖ на (1) показателя, фактор ИРЧП увеличится на (0,0005) показателя; при увеличении фактора грамотности на 1%, фактор ИРЧП увеличится на 0,002%, а при увеличении доли учащихся в возрастах 7-24 на (0,1) показателя, фактор ИРЧП увеличится на (0,011) показателя.
Полученные данные необходимо проверить на адекватность при помощи коэффициента детерминации, F-критерия Фишера и средней ошибки аппроксимации.
Коэффициент детерминации |
||||||||
R^2 = |
0,999918233 |
|||||||
Вывод: качество модели высокое, так как коэффициент детерминации близок к единице. |
F-критерий Фишера |
α = |
0,05 |
||||||||||||
k = |
7 |
|||||||||||||
Fрасч = |
229291,0933 |
n = |
80 |
|||||||||||
Fтабл = |
2,139655512 |
|||||||||||||
Вывод: при данном уровне значимости (α = 0,05) Fрасч > F табл, значит модель является значимой. |
При подсчете средней ошибки аппроксимации Ē, ее значение составило (7,73) что лишь незначительно превышает нормальное значение (7). Следовательно, можем сделать вывод, что данная модель адекватна.
После построения графика остатков, можно сделать вывод о гетероскедастичности даных.
В рамках анализа полученной эконометрической модели необходимо провести оценку степени влияния факторов на результирующую переменную «ИРЧП» с помощью коэффициентов эластичности, и -коэффициентов и выбрать наиболее влиятельный фактор.
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора на один процент и находится по формуле, где – коэффициент регрессии, стоящий перед фактором в уравнении регрессии:
Эх2= 0,334
Эх3= 0,418
Эх5= 0,16
Эх6= 0,06
Из результатов анализа видно, что изменение Y по каждому из факторов неэластично, наибольшей эластичностью обладает Y по фактору Х3 «Ожидаемая продолжительность жизни».
Бета-коэффициенты показывают, на какую часть величины среднеквадратического отклонения (СКО) меняется среднее значение зависимой переменной с изменением независимой переменной на одно СКО при фиксированном на постоянном уровне значении остальных независимых переменных и находятся по формуле , где где , – среднеквадратические отклонения соответствующих переменных:
Βх2=0,748
Βх3=0,454
Βх5=6,43
Βх6=1,03
Таким образом, при изменении каждого из факторов на одно СКО фактор «ИРЧП» меняется соответственно на 0,748; 0,454; 6,43 и 1,03 своего СКО.
Величина дельта-коэффициентов показывает долю влияния конкретного фактора в суммарном влиянии всех факторов,
где – коэффициенты парной корреляции,– коэффициент детерминации:
Δх2=0,581
Δх3=0,143
Δх5=0,015
Δх6=0,24
Как видно из величины дельта-коэффициентов доля влияния фактора «Индекс дохода» в совокупном влиянии четырех факторов преобладает.
Из анализа степени влияния факторов на результирующую переменную «ИРЧП» с помощью коэффициентов эластичности, и -коэффициентов можно сделать вывод о преобладающем влиянии фактора «Индекс дохода».
Индекс развития человеческого потенциала играет всё большую роль для оценки социально-экономического развития общества. Таким образом, условием грамотной оценки социально-экономической политики государства является проведение качественного сбора и анализа статистических данных. Применение эконометрического моделирования, в первую очередь, регрессионного анализа, позволило увидеть скрытые взаимосвязи в большом массиве данных. В результате анализа составлено уравнение для признака «ИРЧП». Выявлен уровень влияния на индекс развития потенциала таких факторов как индекс дохода, ожидаемая продолжительность жизни, грамотность, доля учащихся в возрасте 7-24.
Список литературы:
Доклад о развитии человеческого потенциала по субъектам Российской Федерации за 2009 год
Орлова И.В., Половников В.А. Экономико-математические методы и модели: компьютерное моделирование: учебное пособие, – Вузовский учебник, 2011.