МНОЖЕСТВЕННАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ - Студенческий научный форум

VII Международная студенческая научная конференция Студенческий научный форум - 2015

МНОЖЕСТВЕННАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ

Гомидова В.С. 1
1Филиал Федерального государственного автономного образовательного учреждения высшего образования «Южный федеральный университет» в г. Новошахтинске Ростовской области (филиал ЮФУ в г. Новошахтинске)
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Регрессия – величина, выражающая зависимость среднего значения случайной величины y от значений случайной величины х.

Уравнение регрессии выражает среднюю величину одного признака как функцию другого. Функция регрессии – это модель вида у = f (x), где у – зависимая переменная (результативный признак); х – независимая, или объясняющая, переменная (признак-фактор). Линия регрессии – график функции у = f (x).

Среди регрессий выделяют гиперболическую, линейную, логарифмически линейную, нелинейную, обратную, парную и множественную.

С помощью множественной регрессии можно провести анализ связи между несколькими независимыми переменными (которые называют также регрессорами или предикторами) и зависимой переменной.

Уравнение множественной регрессии выглядит следующим образом:

у = f(х12 ,...,xm) + E,

где у – зависимая переменная (результативный признак),

х1, х2 ,...,xm– независимые, объясняющие переменные (признаки-факторы),

Е – возмущение или стохастическая переменная, включающая влияние неучтенных факторов в модели.

Корреляция – величина, отражающая наличие связи между явлениями, процессами и характеризующими их показателями. Факторы, процессы и явления, изменяются пропорционально друг другу или имеют явную зависимость, называют коррелирующими.

Корреляционная зависимость – определение зависимости средней величины одного признака от изменения значения другого признака.

Коэффициент корреляции величин х и у – rxy свидетельствует о наличии или отсутствии линейной связи между переменными.

Множественная регрессия применяется в тех случаях, когда присутствует наличие нескольких факторов и явлений. Чем менее эти факторы коррелируют, тем точнее будут показатели.

В настоящее время множественная регрессия – один из наиболее распространенных методов в эконометрике. Этот метод широко используется в решении проблем спроса, доходности вкладов, при изучении функции издержек производства, при подсчете рентабельности нового продукта, в макроэкономических расчетах и целом ряде других вопросов эконометрики. Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.

Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата - коэффициента детерминации.

В гуманитарных науках множественная регрессия также находит широкое применение. Специалисты по маркетингу обычно используют процедуры множественной регрессии для выявления совокупности факторов, влияющих на спрос. Исследователь в области образования может высчитать, какие факторы являются лучшими составляющими успешной учебы в университетах. А психолога мог быть заинтересовать вопрос, по каким личностным характеристикам возможно лучше предсказать отклоняющееся поведение индивида. Социологи могут использовать регрессию с целью найти те социальные индикаторы, которые лучше других предсказывают результат адаптации новой иммигрантской группы и степень ее слияния с обществом.

Для построения уравнения множественной регрессии необходимо решить вопрос о специфике модели, для этого следует отобрать факторы влияния и выбрать вид уравнения регрессии.

Включение в уравнение того или иного набора факторов зависит прежде всего от природы взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям.

1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.

2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.

Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми.

Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии.

Исходя из этого, нет практической необходимости в большом количестве факторов, хотя в теории можно учесть любое их число.

Отбор факторов производится на основе качественного теоретико-экономического анализа. Однако теоретический анализ не всегда дает однозначные ответы на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов обычно осуществляется в две стадии: на первой подбираются факторы исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции определяют статистики для параметров регрессии.

Для наглядности, данные удобно представить в виде таблицы.

Пусть, например, при изучении зависимости y=a+b·x+c·z+d·v+матрица парных коэффициентов корреляции оказалась следующей:

 

y

x

z

v

y

1

     

x

0,8

1

   

z

0,7

0,8

1

 

v

0,6

0,5

0,2

1

Таблица 1

Очевидно, что факторы x и z дублируют друг друга. В анализ целесообразно включить фактор z, а не x, хотя корреляция zс результатом y слабее, чем корреляция фактора x с y(ryz< ryx), но зато слабее, чем межфакторная корреляция rzv< rxv . Поэтому в данном случае в уравнении множественной регрессии включаются факторы z, v.

Благодаря подобному анализу можно обнаружить явную коллинеарность факторов. Но существует также понятие мультиколлинеарности, когда несколько факторов связаны между собой линейной зависимостью, совокупно воздействуют друг на друга. При использовании множественной регрессии именно наличие мультиколлинеарности создает наибольшие трудности.

Наличие мультиколлинеарности факторов может означать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой и нельзя оценить воздействие каждого фактора в отдельности.

Включение в модель мультиколлинеарных факторов нежелательно, так как затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированы; параметры линейной регрессии теряют экономический смысл. Кроме того, оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.

Внешние признаки, являющиеся следствиями мультиколлинеарности:

1) некоторые из оценок имеют неправильные с точки зрения экономической теории знаки или неоправданно большие значения;

2) небольшое изменение исходных экономических данных приводит к существенному изменению оценок коэффициентов модели;

3) большинство t-статистик коэффициентов малы, в то же время модель в целом является значимой, о чем говорит высокое значение F – статистики.

Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами.

Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или, иначе, оценивает тесноту совместного влияния факторов на результат.

Множественная корреляция представлена формулой:

, где 0 ≤ R ≤ 1.

Чем ближе R к единице, тем теснее связь рассматриваемых признаков.

Если сравнивать индексы множественной и парной корреляции, то они могут или практически совпадать, или различаться значительно. Это зависит от того, какие именно факторы включены в модель. Если дополнительно включенные в уравнение множественной регрессии факторы третьестепенны, то индекс множественной корреляции может практически совпадать с индексом парной корреляции (различия в третьем, четвертом знаках). Отсюда ясно, что сравнивая индексы множественной и парной корреляции, можно сделать вывод о целесообразности включения в уравнение регрессии того или иного фактора. Так, если для регрессии, включающей пять факторов, коэффициент детерминации составил 0,857. Включение шестого фактора дало коэффициент детерминации 0,858, тогда вряд ли целесообразно дополнительно включать в модель этот фактор.

В роли факторов могут выступать не только экономические переменные, принимающие количественные значения в некотором интервале, но и факторы, имеющие два или более качественных уровней. Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т.е. качественные переменные преобразованы в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными.

Среди моделей с фиктивными переменными наибольшими прогностическими возможностями обладают модели, в которых зависимая переменная рассматривается как функция ряда экономических факторов и фиктивных переменных . Последние обычно отражают различия в формировании результативного признака по отдельным группам единиц совокупности, т.е. в результате неоднородной структуры пространственного или временного характера.

Применения множественной регрессии и корреляции на практике.

Рисунок 1

Рисунок 2

Рисунок 3

Список литературы

1. Айвазян С.А. Прикладная статистика. Основы эконометрики: Учебник для ВУЗов в 2-х т. - Т.2. - М.: ЮНИТИ - ДАНА, 2013. - 432 с.

2. Елисеева И.И. Практикум по эконометрике: Учебное пособие. - М.: Финансы и статистика, 2005 - 192 с.

3. Максимова Т.Г., Верзлин Д.Н. Основы эконометрики: Учебное пособие. - СПб.: ТЭИ, 2009. - 80 с.

4. Эконометрика. Учебник для вузов.; Под ред. чл. - кор. РАН И.И. Елисеевой. - М.: Финансы и статистика, 2008. – 344с.

Просмотров работы: 13088