В своей работе мы решили провести исследование на тему, какие факторы влияют на рождаемость в нашей стране, т.е. чем руководствуется семья, когда решает завести ребенка. Для своей работы мы взяли 4 типа данных для анализа:
Фрагмент преобразованных данных: Y X1 X2 X3 Число родившихся (без мертворожденных) за год, чел Среднедушевые денежные доходы, руб Разница между количеством работающих мужчин и женщин, чел. Обеспеченность детей дошкольного возраста местами в дошкольных образовательных учреждениях -количество мест на 1000 детей, ед. Амурская область 11740 21469,3183 57561,85 625 Брянская область 14391 17421,566 31772,2 691 г.Москва 134881 48621,5501 129965,62 435 г.Санкт-Петербург 62714 27794,6046 88238,16 582 Еврейская автономная область 2449 18151,4048 33349,24 556 Кабардино-Балкарская Республика 13786 13681,0635 33366,65 725 Калининградская область 11819 19371,2683 42809,79 633 Калужская область 11823 20621,1853 49178,03 844 Камчатский край 4182 31481,6364 45861,6 575 Карачаево-Черкесская Республика 6499 13353,8676 20719,77 705 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Корреляционный анализ Затем, мы проводим корреляционный анализ с помощью функции MS Office, по сформированным выше данным. Получаем: Матрица парных коэффициентов корреляции Y X1 X2 X3 Y 1 0,342369168 0,65564694 -0,160172867 X1 0,342369168 1 0,63356445 -0,041067657 X2 0,655646945 0,63356445 1 -0,095981789 X3 -0,160172867 -0,041067657 -0,09598179 1 Затем проведем проверку значимости парных коэффициентов корреляции при α=0,05. Получаем t критическое, равное 2,048407142, затем рассчитаем наблюдаемые показатели t и сравним их с критическим значением, получаем: t наблюдаемое Y X1 X2 X3 Y - 1,928175655 4,59476412 -0,858641079 X1 1,928175655 - 4,33314158 -0,217493097 X2 4,594764121 4,33314158 - -0,510243636 X3 -0,858641079 -0,217493097 -0,51024364 - Для того, чтобы коэффициент корреляции являлся значимым, необходимо, чтобы tнаблюдаемое значение по модулю превосходило t критическое. Выделим красным подходящие результаты и сделаем выводы. |
Выводы по парным коэффициентам корреляции
В нашем случае значимыми признаются следующие пары:
Y и X1 – то есть уровень рождаемости и среднедушевые доходы
Y и X2 – то есть уровень рождаемости и Разница между количеством работающих мужчин и женщин.
Все связи являются положительными и умеренными
Затем, проделаем аналогичные операции для частных и множественных коэффициентов корреляции и сделаем выводы.
Матрица частных коэффициентов корреляции
Y
X1
X2
X3
Y
1
-0,122758172
0,59918653
-0,127218824
X1
-0,122758172
1
0,57656914
0,00961855
X2
0,599186532
0,576569136
1
0,004358379
X3
-0,127218824
0,00961855
0,00435838
1
Проверка значимости частных коэффициентов корреляции
t набл.
Y
X1
X2
X3
Y
-
-0,630716667
3,81617254
-0,654005274
X1
-0,630716667
-
3,59824143
0,049047445
X2
3,816172544
3,598241429
-
0,022223669
X3
-0,654005274
0,049047445
0,022223669
-
Множественные коэффициенты корреляции
R |
R2 |
Fнабл |
Fкр |
|
Ry/{…}= |
0,6692 |
0,4479 |
7,02996984 |
2,975153964 |
Rx1/{…}= |
0,6409 |
0,4108 |
6,04284262 |
|
Rx2/{…}= |
0,7871 |
0,6195 |
14,1078262 |
|
Rx3/{…}= |
0,1609 |
0,0259 |
0,23033135 |
Выводы по частным и множественным коэффициентам корреляции
Прямые и тесные связи соблюдаются так же как и в парных коэффициентах, т.е.:
Уровень рождаемости и среднедушевые доходы (Y X1)
Уровень рождаемости и разницой между количеством работающих мужчин и разницой между количеством работающих мужчин и женщин.
В обоих случаях наблюдается умеренная положительная взаимосвязь, причем влияние других переменных усиливает эту связь.
Множественный коэффициент корреляции ry/(…) = 0,67 значим, имеет высокое значение что позволяет нам говорить о наличии тесной связи уровня рождаемости с нашей выборкой факторных признаков – доходом , разницей между количеством работающих мужчин и женщин, чел., обеспеченностью детей дошкольного возраста местами в дошкольных образовательных учреждениях -количеством мест на 1000 детей, ед. По коэффициенту детерминации можно сказать, что решение о ребенке на 44,7 % зависимо от этих признаков
Другие коэффициенты такие как доход на душу и разница между количеством работающих мужчин и женщин тоже значимы, особенно это сказывается на разнице между количеством работающих мужчин и женщин, где 61,95% зависят других наблюдаемых признаков
После того как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты, обычно переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа.
Исследуем на основе линейной регрессионной модели зависимость числа родившихся за год (Y) от среднедушевых денежных доходов (X1), разницы между количеством работающих мужчин и женщин (X2) и обеспеченности детей дошкольного возраста местами в дошкольных образовательных учреждениях (X3).
Прежде всего необходимо проверить исходные данные на мультиколлинеарность. Для этого обратим внимание на матрицу парных коэффициентов корреляции. Все коэффициенты по модулю меньше 0,8, исходя из этого, можно сделать вывод об отсутствии мультиколлинеарности, следовательно, нет смысла сокращать набор объясняемых элементов.
Затем, мы проводим регрессионный анализ с помощью функции office. Получаем:
Fнабл. = 7,02997, а Fкр. = 2,75871, т.е. Fнабл. >Fкр. Следовательно, уравнение значимое и хотя бы 1 из элементов не равен нулю.
Получаем, что tкр 2,059539, значит, b0 (-0,0626)Fкр. Следовательно, уравнение значимое и хотя бы 1 из элементов не равен нулю.
Получаем, что tкр 2,059539, значит,b2 (7,971936)>tкр, следовательно, b2 является значимым.
Уравнение регрессии имеет вид: Y^=0,644x2
Выводы по регрессионному анализу
Уравнение Y^=0,644x2 описывающее зависимость переменных и отвечает требованиям точности, надежности и адекватности и может быть использовано для прогнозирования результатов.
Величина R2 характеризует долю общей дисперсии зависимой переменной, обусловленную воздействием объясняющих переменных. Таким образом, около 68,67% вариации количества новорожденных(Y) обуславливается разницей между количеством работающих мужчин и женщин (X2), а 31,33% вариации вызвано воздействием неучтенных в модели и случайных факторов. Таким образом, можно сделать вывод, что модель достаточно адекватно отражает исследуемый процесс.
Коэффициент регрессии показывает среднюю величину изменения зависимой переменной Y при изменении объясняющей переменной X на единицу собственного изменения. Знак при коэффициенте указывает направление этого изменения.
Коэффициент при X2 свидетельствует о том, что при росте разницы между количеством работающих мужчин и женщин на единицу количество новорожденных в среднем увеличивается на 0,644026 при неизменности остальных факторов. Из полученной интервальной оценки можно сделать вывод, что с вероятностью 0,95 при росте стоимости кв. метра площади квартиры на единицу увеличение количества новорожденных будет в пределах от 0,478798 до 0,809253 единиц.
Выводы по работе
В процессе работы, мы провели корреляционный и регрессионный анализ четырех факторных и одного результативного признака в тридцати наблюдениях с уровнем значимости α=0,05. Получили ответы на такие вопросы, как:
существование между признаками зависимости
смогли произвести их количественную оценку
выяснили направления из взаимосвязей
произвели оценку силы этих взаимосвязей
установили форму зависимости между результативным и факторными признаками
составили регрессионное уравнение, отражающее математическую зависимость между регрессорами и критериальной переменной.
В ходе работы, мы получили большое количество аналитических данных, а также интерпретировалиэти данные, вследствие чего, сделали выводы по полученным результатам в соответствующих разделах работы.
Список использованной литературы
Орлов А.И. Эконометрика. Учебник. М.: Издательство "Экзамен", 2002. - 576с.
Эконометрика: Учебное пособие - 3-е изд.перераб. и доп. - (Высшее образование: Бакалавриат) (ГРИФ) /Новиков А.И., Новиков А.И.
Мхитарян В.С., Архипова М.Ю. Эконометрика./М.: Московский международный институт эконометрики, информатики, финансов и права,2002. – 69 с.
Федеральная служба государственной статистики: http://www.gks.ru/
Единая межведомственная информационно-статистическая система: http://www.fedstat.ru/