ЭКОНОМЕТРИЧЕСКОЕ МОДЕЛИРОВАНИЕ СТОИМОСТИ АВТОМОБИЛЯ FORD FIESTA НА ВТОРИЧНОМ РЫНКЕ, ПРИМЕР, РАСЧЕТЫ - Студенческий научный форум

VII Международная студенческая научная конференция Студенческий научный форум - 2015

ЭКОНОМЕТРИЧЕСКОЕ МОДЕЛИРОВАНИЕ СТОИМОСТИ АВТОМОБИЛЯ FORD FIESTA НА ВТОРИЧНОМ РЫНКЕ, ПРИМЕР, РАСЧЕТЫ

Журкина Е.А. 1
1Финансовый Университет при Правительстве Российской Федерации
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Введение

Настоящая работа представляет собой анализ предложений на вторичном рынке на автомобиль Ford Fiesta. Подобный вопрос может быть актуальным для назначения соответствующих цен на машины данной марки на вторичном рынке, что поспособствует скорейшим и выгодным продажам, а также для автосалонов и дилеров, которые работают непосредственно с данным видом автомобиля.

Цель работы определяется анализом предложений, полученных на сайте auto.ru по состоянию на 04.12.2014, на автомобиль Ford Fiesta. С помощью программы Microsoft Excel, по собранным данным будет построена регрессионная модель, а также будет произведена проверка качества и оценка уровня точности этой модели.

Стоимость автомобиля будем считать результирующей (эндогенной) переменной.

Для проведения анализа выбраны следующие факторы: тип коробки передач – фиктивная переменная (0 – автомат, 1 – механика), количество владельцев автомобиля, год выпуска, пробег (км), мощность двигателя (л.с.), вид топлива – фиктивная переменная (0 – дизель, 1 – бензин), количество дверей в автомобиле – фиктивная переменная (0 – 3 двери, 1 – 5 дверей).

Были выбраны предложения автомобиля Ford Fiesta модификации VI 2008 – 2013 года выпуска. Получена выборка по 100 предложениям.

Реализация

Количественная оценка взаимосвязей финансовых показателей при решении данной задачи будет производиться в несколько этапов:

  1. Выбор факторов для регрессионного анализа

    1. Корреляционный анализ данных, включая проверку теста Фаррара-Глоубера на мультиколлинеарность факторов

С помощью инструмента Корреляция в Microsoft Excel получим матрицу коэффициентов парной корреляции для всех факторов.

Выполним тест Фаррара-Глоубера для выявления мультиколлинеарности всех факторов: тип коробки, количество владельцев, год выпуска, пробег, мощность двигателя, вид топлива, количество дверей.

Проведение теста Фаррара-Глоубера будет совершено пошагово:

  1. Проверка наличия мультиколлинеарности всего массива переменных:

Для начала следует воспроизвести матрицу межфакторных корреляций R и вычислить с помощью функции МОПРЕД её определитель: det[R] = 0,246625453. Общая мультиколлинеарность факторов имеет место быть исходя из того факта, что определитель матрицы det[R] имеет близкое к нулю значение. С помощью оценки статистики Фаррара-Глоубера подтвердим этот вывод.

С помощью формулы FG = -(n-1-1/6*(2k+5)*ln det[R], где n = 100 – количество наблюдений, k = 7 – количество факторов (переменных анализа) вычислим наблюдаемое значение статистики Фаррара-Глоубера.

FG = -(100-1-1/6*(2*7+5)* ln 0,246625453 = 134,155596.

Значение этого критерия следует сравнить с табличным значением критерия χ^2 с 1/2*k*(k-1)=1/2*7*(7-1)=21 степенью свободы и уровне значимости α = 0,05, которое можно найти с помощью функции ХИ2ОБР(0,05;21). Табличное значение χ^2= 32,67057337.

Учитывая то, что FG> χ^2, в массиве экзогенных переменных существует тесная зависимость.

  1. Проверка наличия мультиколлинеарности каждой переменной с другими переменными:

На данном этапе необходимо вычислить обратную матрицу R-1. Осуществить это можно с помощью функции МОБР в Microsoft Excel.

Далее нужно по формуле Fj=(cjj-1)*((n-k-1)/k), где cjj – диагональные элементы матрицы R-1, вычислить F-критерии.

Табличное значение Fтабл.= 2,110768515, при v1=7 и v2= n - k - 1=100-7-1=92 и уровне значимости α=0.05 сравним с полученными фактическими значениями F-критериев.

Так как все значения F-критериев, за исключением последнего, больше табличного, то можно сделать вывод о том, что все исследуемые переменные, кроме X7 – количество дверей, мультиколлинеарны с другими. Фактор вид топлива больше других влияет на общую мультиколлинеарность факторов, а влияние фактора количество владельцев на общую мультиколлинеарность меньше остальных.

  1. Проверка наличия мультиколлинеарности каждой пары переменных:

В качестве следующего шага потребуется вычислить матрицу коэффициентов частной корреляции Rчастные. Для этого воспользуемся формулой rij=-cij/sqrt(cii*cjj), где cij – элементы матрицы R-1.

Далее нужно вычислить t-критерии с помощью формулы tij=rij*sqrt(n-k-1)/sqrt(1-rij2).

Рассчитаные фактические значения t-критериев сравниваются с табличным значением: tтабл.= 1,986086272 при уровне значимости α=0,05 и степенях свободы (n - k - 1) = 100-7-1=92.

Произведенные действия помогли прийти к выводу о том, что несколько пар факторов имеют высокую статистически значимую частную корреляцию. Наиболее мультиколлинеарными являются две пары факторов: X3 – год выпуска и X4 – пробег, а также X5 – мощность двигателя и X6 – вид топлива.

Избавиться от мультиколлинеарности можно, исключив один фактор из каждой мультиколлинеарной пары. Из пары год выпуска и пробег исключаем год выпуска, так как он имеет большую связь с другими факторами, аналогично исключаем из пары мощность двигателя и вид топлива фактор вид топлива.

В итоге, по результатам теста Фаррара-Глоубера, оставляем пять факторов: тип коробки, количество владельцев, пробег, мощность двигателя, количество дверей.

Далее в работе будет уточнен набор факторов, наиболее подходящих для регрессионного анализа.

  1.  
    1. Пошаговый отбор факторов методом исключения из модели статистически незначимых переменных

Пошаговый отбор мы начнем уже с пятифакторного уравнения, таким образом исключив факторы из ранее обнаруженных мультиколлинеарных пар (год выпуска и вид топлива).

На первом шаге строится модель по всем факторам:

Y= 400758,7413 - 48229,98874X1 - 13445,53725X2 - 0,348208063X4 + 304,9166331X5 + 27780,03231X7

Статистически незначимым (t табл. > t) оказался фактор мощность двигателя. После исключения данного фактора получаем новое уравнение регрессии:

Y= 430583,8173 - 49574,93675X1 - 12668,1087X2 - 0,376800636X4 + 27223,74926X7.

И снова проводим оценку значимости всех оставшихся коэффициентов регрессии.

На данном шаге пошагового отбора удаляем статистически незначимый фактор с наименьшим значением t-критерия – им оказался фактор количество владельцев.

Таким образом, мы получили уравнение, в котором все факторы являются статистически значимыми при 5% уровне значимости:

Y= 412523,6391 - 47290,0418X1 - 0,419704781X4 + 28307,26343X7, в котором X1 – тип коробки передач, X4 – пробег (км), X7 – количество дверей.

Экономический смысл коэффициентов уравнения заключается в следующем: наличие механической коробки передач снижает цену автомобиля в среднем на 47290 рублей по сравнению с автоматической коробкой передач; каждый километр пробега в среднем прибавляет к стоимости машины 0,42 рубля, к примеру, автомобиль с пробегом в 30.000 км в среднем будет стоить дороже, нежели автомобиль с пробегом 80.000 км на 20950 рублей; наличие 5-ти дверного кузова по сравнению с 3-ех дверным прибавляет к стоимости автомобиля в среднем 28307 рублей.

2. Оценка качества модели регрессии. Проверка статистической значимости

уравнения с помощью F-критерия Фишера.

Расчетное значение F-критерия Фишера можно найти в регрессионном анализе или найти по формуле F=(R2/k)/((1-R2)/(n-1-k)) = (0,31659/3)/((1-0,31659)/96) = 0,10553/0,007188. Оно составляет 14,82411097.

Далее вычислим табличное значение F-критерия: Fтабл. = (0,05;3;96) = 2,699392604.

Так как Fтабл. < F, то уравнение трехфакторной регрессии статистически значимо на 95% уровне значимости. Таким образом, связь стоимости с включенными в модель факторами существенна.

  1. Оценка уровня точности модели.

С помощью оценки уровня точности модели мы можем определить среднюю степень отклонения фактических значений, полученных в ходе сбора данных, эндогенной переменной – стоимости автомобиля – от ее предсказанных значений. В процессе оценки уровня точности используются разные виды ошибок: средняя относительная, стандартная и другие.

Стандартную ошибку модели Seможно найти в таблице «Регрессионная статистика» в поле «Стандартная ошибка» или вычислить по формуле Se = .

Понятия точность модели и стандартная ошибка имеют обратно пропорциональную зависимость, таким образом, чем меньше значение стандартной ошибки, тем выше уровень точности модели. Но поскольку данные задачи представлены большими числами, уровень точности модели можно оценить другим способом: нужно сравнить стандартную ошибку Se со среднеквадратическим отклонением эндогенного признака Y – Sy. Среднеквадратическое отклонение Sy можно найти с помощью функции СТАНДОТКЛОН, выделив все значения эндогенного признака, а также по формуле .

В данной работе среднеквадратическое отклонение Sy = 54468,46117, а стандартная ошибка модели Se = 45726,43101. Исходя из того, что Sy> Se, трехфакторную модель регрессии можно признать точной.

Заключение

Итак, в данной работе, в процессе анализа предложений автомобиля Ford Fiesta на вторичном рынке, была построена регрессионная модель, а также проведен пошаговый отбор, в результате которого были отсеяны статистически незначимые факторы. В ходе решения мы выяснили, что факторы мощность двигателя и количество владельцев автомобиля не оказывают большого влияния на стоимость машины, а также то, насколько увеличивается стоимость автомобиля с автоматической коробкой передач по сравнению с автомобилем с механической; сколько прибавляет к стоимости наличие двух дополнительных дверей; и то, как меняется автомобиль в цене с каждым километром пробега.

Полученные данные могут помочь владельцам автомобиля данной марки и модификации определиться с наиболее рациональной ценой при продаже машины следующему владельцу, а также всякого рода дилерам и перекупщикам данного вида авто.

Источники информации

  1. Орлова И.В., Половников В.А. Экономико-математические методы и модели: компьютерное моделирование. / учебное пособие для студентов высших учебных заведений, обучающихся по специальности "Статистика" и другим экономическим специальностям / Москва, 2011. Сер. Вузовский учебник (3-е издание, переработанное и дополненное)

  2. Многомерный статистический анализ в экономических задачах: компьютерное моделирование в SPSS: Учебное пособие / Под ред. И. В. Орловой. - М.: Вузовский учебник, 2009. – 320 с.

  3. Орлова И.В. Экономико-математическое моделирование: Практическое пособие по решению задач. - 2-е издание, испр. и доп. – М.: Вузовский учебник: ИНФРА-М, 2012.

  4. Турундаевский В.Б. Компьютерное моделирование экономико-математических методов / Международный журнал прикладных и фундаментальных исследований. 2014. № 1-2. С. 229-230.

  5. http://www.auto.ru

Просмотров работы: 2459