ЭКОНОМЕТРИЧЕСКИЙ АНАЛИЗ КАЧЕСТВА ЖИЗНИ В ПРИВОЛЖСКОМ ФЕДЕРАЛЬНОМ ОКРУГЕ С ИСПОЛЬЗОВАНИЕМ ПАКЕТА ПРИКЛАДНЫХ ПРОГРАММ MICROSOFT EXCEL - Студенческий научный форум

VIII Международная студенческая научная конференция Студенческий научный форум - 2016

ЭКОНОМЕТРИЧЕСКИЙ АНАЛИЗ КАЧЕСТВА ЖИЗНИ В ПРИВОЛЖСКОМ ФЕДЕРАЛЬНОМ ОКРУГЕ С ИСПОЛЬЗОВАНИЕМ ПАКЕТА ПРИКЛАДНЫХ ПРОГРАММ MICROSOFT EXCEL

Никифорова Э.О. 1
1Российский экономический университет имени Г.В. Плеханова, Москва
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

ЭКОНОМЕТРИЧЕСКИЙ АНАЛИЗ КАЧЕСТВА ЖИЗНИ В ПРИВОЛЖСКОМ ФЕДЕРАЛЬНОМ ОКРУГЕ С ИСПОЛЬЗОВАНИЕМ ПАКЕТА ПРИКЛАДНЫХ ПРОГРАММ MICROSOFTEXCEL

Никифорова Эльмира. РЭУ им. Плеханова (ДММ-141)

Научный руководитель доц. Турундаевский В.Б.

ECONOMETRIC ANALYSIS OF LIFE QUALITY IN THE VOLGA FEDERAL DISTRICT WITH THE USE OF THE SOFTWARE PACKAGE MICROSOFT EXCEL

Люди имеют разные потребности, разный уровень доходов, живут на разных территориях. У каждого своё качество жизни. Рейтинговые агентства составляют рейтинго-бальные таблицы по различным аспектам социально-экономической жизни. К сожалению, невозможно, посмотрев на рейтинги, сказать, от чего зависит тот или иной балл. Поэтому для определения связей между признаками используют эконометрический анализ, который помогает правильно построить статистическую модель и таким образом, определить экономические взаимосвязи.

Целью данной работы является исследование качества жизни в Приволжском федеральном округе с помощью корреляционного и регрессионного анализа с применением пакета прикладных программ Microsoft Excel. Для проведения данного исследования мною были использованы рейтинго - бальные таблицы ООО «Рейтинговое агентство «РИА Рейтинг» (рис.1). В вышеупомянутых таблицах представлена информация по таким показателям, как уровень доходов в регионах, жилищные условия, безопасность проживания и информация по регионам о доли населения, проживающего в многоквартирных домах, которые в установленном порядке признаны аварийными. В качестве результативного признака в данном исследовании является Y – рейтинговый балл качества жизни в регионах, а факторными признаками, оказывающими влияние на результативный являются: X1– рейтинговый балл уровня доходов; X2– рейтинговый балл безопасности проживания; X3- рейтинговый балл экологических и климатических условий; X4 – рейтинговый балл удовлетворенности населения; Х5 - рейтинговый балл демографической ситуации; Х6 - рейтинговый балл здоровья и образования; Х7 - рейтинговый балл уровня экономического развития.

Рисунок 1. Исходные данные

Рисунок 2. Рейтинговый балл по качеству жизни в регионах Y

Итак, приступим к исследованию. На первом этапе рассмотрим корреляционный анализ. Произведём необходимые расчёты и интерпретируем полученные результаты. Для начала составим таблицу парных коэффициентов корреляции. Необходимо помнить, что парные коэффициенты корреляции используются для измерения тесноты связи между двумя переменными без учета их взаимодействия с другими переменными. В MS Excel расчёт парных коэффициентов корреляции осуществляется с помощью подключенного пакета анализа.

 

Y

X1

X2

X3

X4

X5

X6

X7

Y

1

             

X1

0,79222

1

           

X2

0,209285

-0,22634

1

         

X3

-0,07137

-0,3552

0,068407

1

       

X4

0,591123

0,069962

0,587183

0,184321

1

     

X5

0,78506

0,632821

0,004236

-0,1529

0,4268648

1

   

X6

0,316148

0,010054

0,533632

0,456552

0,2337122

0,1978797

1

 

X7

0,69325

0,870903

-0,1847

-0,56975

0,102361

0,6216896

0,1849997

1

Рисунок 3. Матрица парных коэффициентов корреляции

Теперь необходимо проверить значимость полученных коэффициентов корреляции, т.е. гипотезу H0: ρ=0. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле: и построим матрицу наблюдаемыx значений t-статистик для всех коэффициентовrij (рис.4).Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости α=0,05 и числа степеней свободы ν=n-2, tкрит.= 2,5706

 

Y

X1

X2

X3

X4

X5

X6

X7

Y

 

4,497167

0,741404

-0,24787

2,5387536

4,3904496

1,1543779

3,33217812

X1

4,497167

 

-0,80497

-1,31628

0,2429514

2,8311507

0,03482898

6,13869431

X2

0,741404

-0,80497

 

0,237526

2,5128772

0,0146726

2,18578651

-0,6510149

X3

-0,24787

-1,31628

0,237526

 

0,6496386

-0,535968

1,77762064

-2,401572

X4

2,538754

0,242951

2,512877

0,649639

 

1,635163

0,8326628

0,35646139

X5

4,39045

2,831151

0,014673

-0,53597

1,635163

 

0,69930336

2,74951545

X6

1,154378

0,034829

2,185787

1,777621

0,8326628

0,6993034

 

-0,6521143

X7

3,332178

6,138694

-0,65101

-2,40157

0,3564614

2,7495154

-0,6521143

 

Рисунок 4. Матрица наблюдаемыx значений t-статистик

По результатам, представленным на рис.4, наблюдаемое значение t-статистики больше критического tкр= 2,5706 по модулю для парных коэффициентов корреляции. Таким образом, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, т.е. коэффициенты - незначимы.

Для проверки значимости парных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса для нахождения критического значения rкр для уровня значимости б=0,05 и числа степеней свободы н=n-2=14-2=12.

Если соответствующий коэффициент | rij | > rкр, то он считается значимым. Отметим в матрице парных коэффициентов корреляции значимые (рис.5)

 

Y

X1

X2

X3

X4

X5

X6

X7

Y

1

0,79222

0,209285

-0,07137

0,5911233

0,7850604

0,31614824

0,31614824

X1

0,79222

1

-0,22634

-0,3552

0,0699622

0,6328207

0,01005375

0,870903

X2

0,209285

-0,22634

1

0,068407

0,5871825

0,0042356

0,53363218

-0,1846985

X3

-0,07137

-0,3552

0,068407

1

0,1843213

-0,152901

0,45655217

-0,5697468

X4

0,591123

0,069962

0,587183

0,184321

1

0,4268648

0,23371222

0,10236103

X5

0,78506

0,632821

0,004236

-0,1529

0,4268648

1

0,19787975

0,62168955

X6

0,316148

0,010054

0,533632

0,456552

0,2337122

0,1978797

1

-0,1849997

X7

0,69325

0,870903

-0,1847

-0,56975

0,102361

0,6216896

-0,1849997

1

Рисунок 5. Матрица парных коэффициентов корреляции

Для расчёта доверительных интервалов с помощью Z-преобразования Фишера для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью найдём значения следующие значения: γ=0,95; F(t)=0,975; tγ =1,95996; ΔZ=0,285884.

Рассчитаем доверительные интервалы (рис.6).

             
             
 

r

Zr

Zmin

Zmax

pmin

pmax

YX1

0,79222

1,077365

0,7914816

1,3632492

0,659248

0,877145

YX5

0,78506

1,058425

0,7725414

1,344309

0,648405

0,872703

YX7

0,69325

0,854187

0,568303

1,1400706

0,514112

0,814438

X1X5

0,632821

0,746107

0,4602232

1,0319909

0,430266

0,774706

X1X7

0,870903

1,336805

1,050921

1,6226886

0,782164

0,925013

X5X7

0,62169

0,727754

0,4418705

1,0136381

0,415194

0,767263

Рисунок 6. Расчёт доверительных интервалов для парных генеральных

коэффициентов корреляции исследуемых экономических показателей

На основании рассчитанных данных построим доверительные интервалы с надёжностью γ=0,95 для всех значимых парных генеральных коэффициентов корреляции (рис.7).

P(0,659248≤pYX1≤0,877145)=0,95

P(0,648405≤pYX5≤0,872703)=0,95

P(0,514112≤pYX7≤0,814438)=0,95

P(0,430266≤pX1X5≤0,774706)=0,95

P(0,782164≤pX1X7≤0,925013)=0,95

P(0,415194≤pX5X7≤0,767263)=0,95

Рисунок 7. Доверительные интервалы для всех значимых парных генеральных коэффициентов корреляции.

По полученным данным можно сделать следующие выводы:

1. Значимые прямые взаимосвязи обнаружены между изучаемым признаком Y- рейтинговым баллом качества жизни в регионах и факторным признаком Х1 - рейтинговым баллом уровня доходов, а также между изучаемым признаком Y- рейтинговым баллом качества жизни в регионах и факторным признаками Х5 - рейтинговым баллом демографической ситуации, аналогично с Х7 - рейтинговым баллом уровня экономического развития; между факторными признаками Х1 и Х5; а также между факторными признаками Х1 и Х7, Х5 и Х7.

2. О тесноте связи можно судить по приближенности коэффициента корреляции по абсолютному значению к единице. Наиболее тесная связь наблюдается между рейтинговым баллов уровня доходов и рейтинговым баллом уровня экономического развития. Об этой связи можно сказать, что она сильная, в то же время, остальные значимые связи менее сильными.

Итак, полученные результаты корреляционного анализа, показавшие, что показатель Y – рейтинговый балл качества жизни в регионах имеет тесную связь с многомерным массивом факторных признаков, позволяют перейти ко второму этапу статистического исследования – построению регрессионной модели.

Будем использовать алгоритм пошагового регрессионного анализа с последовательным исключением незначимых регрессоров, пока все входящие в регрессионную модель факторы не будут иметь значимые коэффициенты.

Построение и оценка регрессионной модели осуществляется в MS Excel с помощью модуля регрессии пакета анализа данных. После заполнения всех предложенных форм, приступаем к анализу.

Результаты регрессионного анализа выдаются в следующем виде (рис.8).

Рисунок 8. Вывод итогов №1 регрессионного анализа в MSExcel

Оценка уравнения регрессии имеет вид:

y=23,89833+0,354336*X1+0,131228*X4+0,112857*X5-0,05724*X7

Проверим на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H0: в123=…=вk=0. Для этого рассчитывается наблюдаемое значение F-статистики. Fкрит=2,513040096. Проверим значимость отдельных коэффициентов уравнения регрессии. Проверку значимости регрессионных коэффициентов проводим на основе t-статистики (t-крит=2,5706).

Проверяем значимость уравнения регрессии и полученных коэффициентов регрессии , следовательно, хотя бы один элемент вектора β=(β1,β4,β5,β7)^T значимо отличается от нуля.

В регрессионной статистике указываются множественный коэффициент корреляции (Множественный R) и детерминации (R-квадрат) между Y и массивом факторных признаков (что совпадает с полученными ранее значениями в корреляционном анализе)

Средняя часть таблицы (Дисперсионный анализ) необходима для проверки значимости уравнения регрессии.

Нижняя часть таблицы - точечные оценки bi генеральных коэффициентов регрессии вi, проверка их значимости и интервальная оценка.

Необходимо проверить значимость уравнения регрессии и полученных коэффициентов регрессии.

Проверим значимость отдельных коэффициентов уравнения регрессии. Проверку значимости регрессионных коэффициентов проводим на основе t-статистики.

Для наблюдаемое значение t-статистики больше критического по модулю ;

Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Для наблюдаемое значение t-статистики меньше критического по модулю

Следовательно, гипотеза о равенстве нулю этого коэффициентов не отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты незначимы.

Р-значение для соответствует , т.е. данные параметры являются незначимыми. Т.к. в столбцах НИЖНЕЕ 95% и ВЕРХНЕЕ 95% и НИЖНЕЕ 98% и ВЕРХНЕЕ 98% нижние и верхние границы имеют различные знаки, то соответствующие коэффициенты регрессии считаются незначимыми.

Как видим, по всем перечисленным проверочным критериям является незначимым. Т.к. выявлено несколько незначимых коэффициентов, первым исключается регрессор, для которого t- статистика минимальна по модулю, в нашем случае исключается переменная (рейтинговый бал по категории «уровень экономического развития»).

Переходим ко второму этапу регрессионного анализа. После заполнения необходимых форм в MS Excel получаем следующие результаты (рис.9).

Fкрит= 2,782600423

t-крит=2,5706

Рисунок 9. Вывод итогов №2 регрессионного анализа в MSExcel

Оценка уравнения регрессии имеет вид:

0,103965

Проверяем значимость уравнения регрессии и полученных коэффициентов регрессии , следовательно, хотя бы один элемент вектора β=(β1,β4,β5)^T значимо отличается от нуля.

Проверим значимость отдельных коэффициентов уравнения регрессии. Проверку значимости регрессионных коэффициентов проводим на основе t-статистики.

Для наблюдаемое значение t-статистики больше критического по модулю 2,5706; 2,5706; 2,5706;

Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Для наблюдаемое значение t-статистики меньше критического по модулю

Следовательно, гипотеза о равенстве нулю этого коэффициента не отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующий коэффициент незначим.

Р-значение для соответствует , т.е. данные параметры являются незначимыми. Т.к. в столбцах НИЖНЕЕ 95% и ВЕРХНЕЕ 95% и НИЖНЕЕ 98% и ВЕРХНЕЕ 98% нижние и верхние границы имеют различные знаки, то соответствующие коэффициенты регрессии считаются незначимыми.

Как видим, по всем перечисленным проверочным критериям является незначимым. Так как был выявлен незначимый коэффициент, необходимо исключить переменную X5 (рейтинговый балл по категории «демографическая ситуация»).

Переходим к третьему этапу регрессионного анализа. Снова после заполнения необходимых форм в MS Excel получаем следующие результаты (рис.10).

F

Fкрит= 3,238096

t-крит=2,5706

Рисунок 10. Вывод итогов №3 регрессионного анализа в MSExcel

Оценка уравнения регрессии имеет вид:

Проверяем значимость уравнения регрессии и полученных коэффициентов регрессии , следовательно, хотя бы один элемент вектора β=(β1,β4)^T значимо отличается от нуля.

Проверим значимость отдельных коэффициентов уравнения регрессии. Проверку значимости регрессионных коэффициентов проводим на основе t-статистики.

Для наблюдаемое значение t-статистики больше критического по модулю 2,5706; 2,5706; 2,5706

Следовательно, гипотеза о равенстве нулю этого коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Р-значение для соответствует , т.е. данные параметры являются значимыми. Т.к. в столбцах НИЖНЕЕ 95% и ВЕРХНЕЕ 95% и НИЖНЕЕ 98% и ВЕРХНЕЕ 98% нижние и верхние границы имеют одинаковые знаки, то есть соответствующие коэффициенты регрессии считаются значимыми.

Мы дошли до этапа, когда все коэффициенты являются значимыми. Можем для значимых коэффициентов регрессии найти с заданной доверительной вероятностью γ интервальные оценки (рис.11).

P(20,31845296≤β0≤27,98532)=0,95

P(19,41784≤β0≤28,88594)=0,98

P(0,266399187≤β1≤0,449276)=0,95

P(0,244917≤β1≤0,470759)=0,98

P(0,096131085≤β4≤0,20342)=0,95

P(0,083528≤β4≤0,216023)=0,98

Рисунок 11. Интервальные оценки с заданной доверительной вероятностью γ.

Итак, после проведённого регрессионного анализа перейдём к интерпретации результатов.

Величина R2 характеризует долю общей дисперсии зависимой переменной, обусловленную воздействием объясняющих переменных. Таким образом, около 91,6% вариации рейтингового бала уровня жизни в регионах (Y) объясняется вариацией рейтинговым балом по категории «уровень доходов»- (X1), рейтинговым баллом по категории «удовлетворенность населения»- (X4), а 8,4% вариации вызвано воздействием неучтенных в модели и случайных факторов. Таким образом, можно сделать вывод, что модель достаточно адекватно отражает исследуемый процесс.

Рисунок 12. Рейтинговый балл по качеству жизни в регионах Y

Отклонения расчетного значения Y от фактического было рассчитано путём вывода остатков в MS Excel.

После проведения корреляционного и регрессионного анализа мы можем сделать определённые выводы:

Таким образом, полученные результаты корреляционного анализа показали, что показатель Y (рейтинговый балл качества жизни в регионах) имеет тесную связь с многомерным массивом факторных признаков, наиболее сильная связь была обнаружена с такими факторными признаками как (рейтинговый балл уровня доходов) и (рейтинговый балл по категории "удовлетворенность населения"). Эта связь присутствует в отдельности, а также усиливается при влиянии остальных переменных. Между остальными факторными переменными тоже существую значимые связи, но не столь сильные, и они становятся значимыми только при влиянии других признаков.

Множественный коэффициент детерминации r2Y/{..}=0,9814, который показал, что 98,14% доли дисперсии Y – рейтинговый балл качества жизни в регионах, обусловлен изменениями факторных признаков. При этом факторные признаки, которые имеют достаточно высокие значения множественных коэффициентов корреляции и детерминации, сильно взаимосвязаны.

Коэффициент регрессии при X1 показал, что при росте рейтингового балла по категории уровень доходов на единицу уровень жизни в регионах в среднем увеличивается на 0,357838 при неизменности остальных факторов.

Аналогично, коэффициент регрессии при X4 показал, что при росте доли населения, проживающего в многоквартирных домах, признанных в установленном порядке аварийными на единицу уровень жизни в регионах в среднем уменьшается на 0,149776 при неизменности остальных факторов.

Таким образом, проанализировав столь огромный массив данных, мы обнаружили взаимосвязи между факторами, найдя самые сильные связи. Качество жизни – очень важный показатель для населения. Поэтому необходимо понимать от каких факторов оно зависит и чем обусловлено.

Список литературы

  1. Орлова И.В. Половников В.А. Экономико-математические методы и модели: компьютерное моделирование: Учебное пособие – 2-е изд. М.: Вузовский учебник, 2007

  2. Сиротин В.П., Архипова М.Ю., Дуброва Т.А. и др. Эконометрика / учебник под ред. проф. Мхитаряна В. С. -М.: Проспект, 2010.

  3. Федеральная служба государственной статистики [электронный ресурс] – URL: http://www.gks.ru

  4. Рейтинговое агентство «РИА рейтинг» [электронный ресурс] – URL: http://www.riarating.ru

Просмотров работы: 663