"ПОСТРОЕНИЕ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ ПО ПРОГНОЗИРОВАНИЮ ЦЕН НА ЖИЛЬЕ В РФ"

Чинь К.А. 1

1Финансовый университет при Правительстве РФ

Работа в формате PDF

288.6 KB

Сертификат участника

Комментарии

Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Введение

Цель: исследовать влияние средней номинальной заработной платы населения РФ на цены за 1 кв. м. жилья в РФ.

Используемые показатели:

Ежеквартальные данные с 2000 по 2014 (I квартал) года, и того 57 данных для каждого показателя:

Y – Средняя цена за 1 кв. м. жилья в РФ, руб.

Х₁ – Средняя номинальная заработная плата населения РФ, руб.

Х₂ – Курс рубля по отношению к доллару, руб.

Задачи исследования:

Построить диаграмму рассеивания, используя статистические данные X и Y и сформулировать гипотезу об их функциональной зависимости.
Рассмотреть эконометрические модели парной регрессии на основе следующих функций:

А) линейной Y=a₀+a₁X₁;

Б) степенной Y=a₀X₁;

В) гиперболической Y=a₀+a₁/X_1.

Для каждой модели оценить качество спецификации при помощи F- теста и дать экономическое объяснение значения R².

Исследовать адекватность условий теоремы Гаусса-Маркова для случайных остатков каждой модели из п.2).
Проверить адекватность полученных моделей (с 95-% вероятностью) через интервальное прогнозирование для II, III, IV кварталов 2013 года и I квартала 2014 года.
Провести сравнительный анализ полученных результатов в пп.1-4 и выявить наилучшую модель среди рассмотренных.
Оценить эконометрическую модель множественной регрессии:

Y=a₀+a₁X₁+а₂Х₂+u.

Проверить значимость используемых в модели регрессоров. Исследовать адекватность модели по последнему набору данных.

Диаграмма рассеивания и функциональная зависимость показателей

Построим две диаграммы рассеивания, где в первом мы рассмотрим функциональную зависимость между Y и X₁, а во втором между Y и X₂:

Рисунок 1

В данной диаграмме (рис. 1) мы можем увидеть тренд и величину достоверности аппроксимации (R²). А также проследить за функциональной зависимостью двух показателей, где в первой половине всего периода мы можем наблюдать как данные очень четко строят тренд, но ближе к нашему дню рассеивание все сильней и сильней. Для того, чтобы сделать простейший прогноз цены на жилье в РФ в зависимости от номинальной зарплаты населения РФ, мы можем ориентироваться на указанный тренд, так как функциональная зависимость достаточно высока, на это нам указывает высокий показатель достоверности аппроксимации (R²), который равен 0,8 (0,8 > 0,7 - минимальный показатель, при котором R² считается высоким).

Посмотрим на вторую диаграмму (рис. 2). Отклонение квартальных данных показателей от тренда наблюдается за весь период анализа, да и сам по себе тренд выглядит неэффективным. Здесь показатель R²= 0,0005, практически равен нулю, это говорит о том, что функциональной зависимости между Y и Х₂ (курсом рубля по отношению к доллару) практически нет, делать прогноз по составленному тренду не имеет смысла.

Рисунок 2

Эконометрическая модель парной регрессии на основе линейной функции

Рассматривая эконометрическую модель линейной функции Y=a₀ + a₁*X₁, первым делом следует проверить качество спецификации данной модели, рассмотреть влияние случайных величин. Для этого рассчитываются и рассматриваются несколько показателей (рис. 3):

Величина достоверности аппроксимации (или коэффициент детерминации) R²= 0,801 (входит в промежуток 0,7 – 1, поэтому считается высоким) – указывает на высокую зависимость между ценой на жилье в РФ и номинальной заработной платой населения РФ.
F-критерий Фишера равный 221,6 > F критическое равное 3,17 (F_кр= FРАСПОБР(0,05;2;55)). Это говорит об адекватности модели выборочным данным и о незначительном влиянии случайных факторов.
Сравнение t – показателя = |a_0,1/S_а0,а1| с t – критическим позволяет оценить значимость регрессоров в модели.

Рисунок 3.

Модель прошла проверку спецификации, исследуем ее на адекватность условий теоремы Гаусса-Маркова для случайных остатков:

Тест Голдена – Квандта гомоскедастичности случайного остатка:

Шаг 1: рассчитаем u_t , u_t² и М(u_t). М(u_t) стремится к нулю.

Шаг 2: D(u_t) = σ²= 54.280.192.

Шаг 3: n’ = 57/3 = 19, F_кр = FРАСПОБР(0,05;17;17) = 2,27

Рисунок 3.

Исходя из полученного результата (рис. 3), мы делаем вывод о гетероскедастичности случайного остатка в линейной модели, случайный остаток не имеет однородности при наблюдении, дисперсия случайной ошибки данной модели непостоянна.

Тест Дарбина – Уотсона отсутствия автокорреляции случайного остатка в модели:

Шаг 1: используя данные u_t, u_t-1 и u_t² получаем DW = 0,108.

Шаг 2: по количеству n уравнений и количеству k объясняющих переменных выбираем две переменные d_L= 1,53 и d_U = 1,6.

Шаг 3: Проверяем, в какое из пяти подмножеств M₁, M₂, M₃, M₄, M₅ интервала (0, 4) попала величина DW (рис. 4):

Рисунок 4.

DW ∈ M1, Cov (u_t;u_t-1) > 0

Результат говорит о наличии автокорреляции в рассматриваемой модели, что в свою очередь приводит к ухудшению качества МНК-оценок параметров регрессии и искусственному улучшению ее качества.

Проверка адекватности модели через интегральное прогнозирование:

Определимся с имеющейся статистикой:

t ∈ [2000_I – 2013_II] – обучающая выборка;

t ∈ [2013_III – 2014_I] – контролирующая выборка.

Найдем следующие показатели для 2013_III – 2014_I (рис. 5):

Y_2013(III) = a₀ + a₁*X_2013(III) = 59789,57

q_2013(III) = 1/n +(X_2013(III) – Х̅ )²/∑(Х_t – Х̅ )² = 0,088

S_Y2013(III) = σ_u * √( q_2013(III)+ 1) = 7414,98

t_кр= СТЬЮДРАСПОБР(0,05;52) = 2,006

Y_min = Y_2013(III)– S_{Y2013(III) *}t_кр= 44910,32

Y_max = Y_2013(III)+ S_{Y2013(III) *}t_кр= 74668,81

Y_2013(III) ∈ (Y_min ; Y_max)

Рисунок 5.

Каждая прогнозируемая данная входит в доверительный интервал (рассчитанный с надежностью в 95%), что говорит об адекватности модели.

Эконометрическая модель парной регрессии на основе степенной функции

Проведем линеаризацию степенной функции Y=a₀*X₁^а1 и пойдем по алгоритму, что применяли для линейной функции:

ln(Y) = ln(a₀*X₁^а1) = ln(a₀) + a₁*ln(X₁), пусть ln(a₀) = b₀, a₁= b₁, тогда получится ln(Y) = b₀ + b₁*ln(X).

Качество спецификации регрессионной модели (рис. 6):

Рисунок 6.

R²= 0,938 ∈ (0,7;1) – высокая зависимость показателей.

F = 831, 73 > F_кр = 3,16 – качественная выборка для модели.

По оценке спецификации степенной функции, мы видим, что выводы идентичны оценке линейной функции этих показателей, однако стоит заметить, что коэффициент детерминации тут гораздо выше и близок к единице, а это значит, что использование степенной функции может дать более точные прогнозы в связи с более тесной связью переменных.

Исследование модели на адекватность условий теоремы Гаусса-Маркова для случайных остатков:

Тест Голдена – Квандта гомоскедастичности случайного остатка:

Шаг 1: рассчитаем u_t , u_t² и М(u_t). М(u_t) также стремится к нулю.

Шаг 2: D(u_t) = σ²= 0,027.

Шаг 3: n’ = 57/3 = 19, F_кр = FРАСПОБР(0,05;17;17) = 2,27. Эти показатели не изменяются.

Рисунок 7.

GQ = ESS₁/ESS₂

При данных справедливых неравенствах (рис. 7) мы можем считать случайный остаток в модели гомоскедастичным. Это означает постоянство дисперсии случайной ошибки данной модели и однородность изменения случайного остатка.

Тест Дарбина – Уотсона отсутствия автокорреляции случайного остатка в модели:

Шаг 1: используя данные u_t, u_t-1 и u_t² получаем DW = 0,146.

Шаг 2: по количеству n уравнений и количеству k объясняющих переменных выбираем две переменные d_L= 1,53 и d_U = 1,6.

Шаг 3: Проверяем, в какое из пяти подмножеств M₁, M₂, M₃, M₄, M₅ интервала (0, 4) попала величина DW (рис. 8):

Рисунок 8.

DW ∈ M1, Cov (u_t;u_t-1) > 0

Рост показателя DW оказался незначительным и также остался в промежутке M₁. Искусственное улучшение качества модели при ее оценке и прогнозировании остается неизменным.

Проверка адекватности модели через интегральное прогнозирование:

Определимся с имеющейся статистикой:

t ∈ [2000_I – 2013_II] – обучающая выборка;

t ∈ [2013_III – 2014_I] – контролирующая выборка.

Найдем следующие показатели для 2013_III – 2014_I (рис. 9), используя все те же формулы и данные, что использовались для линейной функции:

Рисунок 9.

Y_2013(III), Y_2013(IV), Y_2014(I) ∈ (Y_min ; Y_max)

Каждая прогнозируемая данная входит в доверительный интервал (рассчитанный с надежностью в 95%), что говорит об адекватности модели прогнозируемых данных.

Эконометрическая модель парной регрессии на основе гиперболической функции

Линеаризируем гиперболическую функцию Y=a₀ + a₁/X₁:

пусть 1/Х₁ = Z, тогда мы получим линейную функцию Y=a₀ + a₁*Z.

Качество спецификации регрессионной модели (рис. 10):

Рисунок 10.

Оценка функциональной зависимости и адекватности модели выборочным данным все также сохраняется как в предыдущих случаях, однако коэффициент детерминации равный 0,74 в этом случае самый низкий из трех рассмотренных функций.

Исследование модели на адекватность условий теоремы Гаусса-Маркова для случайных остатков:

Тест Голдена – Квандта гомоскедастичности случайного остатка:

Шаг 1: рассчитаем u_t , u_t² и М(u_t). М(u_t) стремится к нулю.

Шаг 2: D(u_t) = σ²= 70485091,7.

Шаг 3: n’ = 57/3 = 19, F_кр = FРАСПОБР(0,05;17;17) = 2,27.

Рисунок 11.

Результат (рис. 11) схож с результатом линейной функции, они обе имеют гетероскедстичный случайный остаток, дисперсия которого непостоянна.

Тест Дарбина – Уотсона отсутствия автокорреляции случайного остатка в модели:

Шаг 1: используя данные u_t, u_t-1 и u_t² получаем DW = 0,074.

Шаг 2: по количеству n уравнений и количеству k объясняющих переменных выбираем две переменные d_L= 1,53 и d_U = 1,6.

Шаг 3: Проверяем, в какое из пяти подмножеств M₁, M₂, M₃, M₄, M₅ интервала (0, 4) попала величина DW (рис. 12):

Рисунок 12.

DW ∈ M1, Cov (u_t;u_t-1) > 0

В модели, как и во всех остальных, присутствует положительная автокорреляция.

Проверка адекватности модели через интегральное прогнозирование:

Определимся с имеющейся статистикой:

t ∈ [2000_I – 2013_II] – обучающая выборка;

t ∈ [2013_III – 2014_I] – контролирующая выборка.

Найдем следующие показатели для 2013_III – 2014_I (рис. 13), используя все те же формулы и данные, что использовались для линейной функции:

Рисунок 13.

Y_2013(III), Y_2013(IV), Y_2014(I) ∈ (Y_min ; Y_max)

Все прогнозируемые данные входят в доверительный интервал (с надежностью в 95%).

5. Оценка эконометрической модели множественной регрессии

Добавим к уравнению еще одну объясняющую переменную Х₂ – курс рубля к доллару и получим модель линейной функции множественной регрессии Y=a₀+a₁*X₁+a₂*X₂+u.

Проверим спецификацию модели и значимость ее регрессоров (рис. 14):

Рисунок 14.

Высокое значение R²= 0,885 и F > F_круказывают на то, что спецификация модели качественная. Значения |t_0,1,2| = a_0,1,2/ S_a0,a1,a3> t_кр= СТЬЮДРАСПОБР(0,05;54) указывают на высокую значимость всех регрессоров, используемых в модели.

Проверка адекватности модели через интегральное прогнозирование:

Определимся с имеющейся статистикой:

t ∈ [2000_I – 2013_IV] – обучающая выборка;

t ∈ [2014_I] – контролирующая выборка.

Найдем следующие показатели для 2014_I (рис. 15):

Y_2014(I) = a₀ + a₁*X_{2014(I) (1)} + a₂*X_{2014(I) (2)}= 53435,37

q_2014(I) = x_2014(I)^T * (Х^Т*Х)^-1* x_2014(I) = 1,37 * 10¹⁹

S_Y2013(III) = σ_u * √( q_2014(I)+ 1) = 7414,98

t_кр= СТЬЮДРАСПОБР(0,05;53) = 2,006

Y_min = Y_2014(I)– S_{Y2014(I) *}t_кр= -4,23 * 10¹³

Y_max = Y_2014(I)+ S_{Y2014(I) *}t_кр= 4,23 * 10¹³

Y_2014(I) ∈ (Y_min ; Y_max)

Рисунок 15.

Прогнозируемое значение входит в доверительный интервал, следовательно, оно может быть принято к сведению, а модель можно считать адекватной.

Заключение

В данной работе мы рассмотрели эконометрические модели по прогнозированию цен на жилье в РФ в зависимости от средней номинальной заработной платы населения РФ, основанные на линейной, степенной и гиперболической функциях.

Из рассмотренных моделей, самой точной оказалась модель, основанная на степенной функции, у нее не только самые приближенные к реальному значению прогнозы, но и самый высокий коэффициент детерминации R²=0,938, практически равный единице (хотя равенство единице не дает 100% повода говорить о надежности модели). Также стоит учесть во внимание, что степенная функция, в отличие от всех других рассмотренных, имеет гомоскедастичный случайный остаток, это указывает на отсутствие искусственного завышения качества модели в ходе ее анализа и оценки.

Кроме того, была проведена оценка эконометрической модели множественной регрессии, куда была добавлена дополнительная объясняющая переменная – курс доллара США. Модель оказалась качественной, все ее переменные значимые, прогноз был достаточно точным, однако все равно уступал модели, основанной на степенной функции.

Весь расчет вы можете найти в отдельном Excel файле.

Используемые источники

Средняя цена на 1 кв. м. жилья в Российской Федерации,

Единая Система Государственной Статистики:

http://fedstat.ru/indicator/data.do

Средняя номинальная заработная плата населения РФ, Росстат:

http://www.gks.ru/free_doc/new_site/population/trud/sr-zarplata/t1.doc

Динамика курса валюты Доллар США, Центральный Банк РФ:

http://www.cbr.ru/currency_base/dynamics.aspx?VAL_NM_RQ=R01235&date_req1=01.01.2000&date_req2=26.11.2014&rt=1&mode=1

Просмотров работы: 1278

Код для цитирования:

VII Международная студенческая научная конференция Студенческий научный форум - 2015

"ПОСТРОЕНИЕ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ ПО ПРОГНОЗИРОВАНИЮ ЦЕН НА ЖИЛЬЕ В РФ"

Студенческий научный форум - 2015
VII Международная студенческая научная конференция