ПАНЕЛЬНЫЕ ДАННЫЕ. - Студенческий научный форум

VII Международная студенческая научная конференция Студенческий научный форум - 2015

ПАНЕЛЬНЫЕ ДАННЫЕ.

Искандярова Р.Р. 1
1ФГОБУ ВПО Финансовый университет при Правительстве РФ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Согласно проведенным исследованиям, панельные данные представляют собой прослеженные во времени пространственные выборки, которые состоят из наблюдений одних и тех же экономических объектов в последовательные периоды времени. Они ценны для экономистов тем, что при правильном их анализе можно избавиться от влияния индивидуальных особенностей объектов которые, как правило, являются одной из серьезнейших проблем анализа однократных данных. Целью данной работы является углубить знания в области анализа панельных данных. Для этого в работе последовательно рассмотрены основные преимущества и проблемы панельных данных, основные регрессионные модели и практический пример использования панельных данных.

Основные преимущества данных этого типа заключаются в следующем:

1) они предоставляют исследователю большое количество наблюдений, увеличивая число степеней свободы и снижая коллинеарность между объясняющими переменными и, следовательно, улучшая эффективность оценок;

2) они позволяют анализировать множество важных экономических вопросов, которые не могут быть адресованы к временным рядам и пространственным рядам в отдельности;

3) они позволяют предотвратить смещение агрегированности, неизбежно возникающее как при анализе временных рядов (где рассматривается временная эволюция усредненного «репрезентативного» объекта), так и при анализе пространственных рядов (где не учитываются ненаблюдаемые индивидуальные характеристики объектов);

4) они дают возможность проследить индивидуальную эволюцию характеристик объектов во времени.

5) они дают возможность избежать ошибок спецификации, возникающих от невключения в модель существенных переменных.

Существующие проблемы панельных исследований:

  • смещение в данных (отсутствие или искажение ответов на отдельные вопросы)

  • истощение выборки (постепенное убывание числа объектов наблюдения: отказ участвовать в опросах в дальнейшем, распад домохозяйств) и ротационные панели как решение проблемы истощения.

Решить данные проблемы помогают специальные техники between и within, которые будут рассмотрены далее более подробно.

Модели панельных данных широко используются в микро- и макроэкономических исследованиях, например:

1. Объекты – страны; переменные – инфляция, объем инвестиций, объем экспорта, импорта; результирующий показатель - ВВП на душу населения. Задача выяснить, как он зависит от приведенных параметров.

2. Объекты – коммерческие фирмы; переменные – оборот, прибыль, число сотрудников, отрасль; результирующий показатель – рыночная стоимость.

3. Объекты – регионы; параметры – уровень жизни, среда и ресурсы, демография и миграции, политика, экономика и социальная сфера, культура, образование, внешние условия; результирующий показатель – индекс конфликтов.

Регрессионные модели панельных данных:

1. Общая регрессионная модель (pooled least squares)

2. Модель с детерминированными эффектами (fixed effects model)

3. Модель со случайными эффектами (random effects model)

Общая регрессионная модель (pooledleastsquares)

Регрессионная модель панельных данных отличается от регрессии обычных временных рядов или пространственной регрессии тем, что её переменные имеют двойной нижний индекс, т.е.

где i- номер объекта (домашние хозяйства, фирмы, страны и т.д.), t-время, α -свободный член, β - вектор коэффициентов размерности K×1, X’i,t=(X1itX2it… Xkit) - вектор-строка матрицы K объясняющих переменных.

Большинство приложений панельных данных использует однокомпонентную модель случайной ошибки νi,t:

где ui - ненаблюдаемые индивидуальные эффекты, а εit - остаточное возмущение. uiне зависят от времени и отвечают за характеристики объектов, которые не включены в регрессию непосредственно. Остаточное возмущение εit меняется в зависимости от времени и объектов, и может рассматриваться как обыкновенная случайная составляющая в регрессии.

Модель с детерминированными эффектами (fixed effects model)

Модель с детерминированными эффектами характеризуется тем, что ui – фиксированные параметры, остаточные возмущения εit – независимые одинаково распределённые случайные величины - IID(0,σε2Xi,t– предполагаются независимыми от εit для всех i и t. Эта модель является подходящей спецификацией, если, например, сосредоточиться на исследовании уникального набора Nфирм.

При построении моделей анализа панельных данных потребность учитывать индивидуальные особенности объектов приводит к следующей проблеме: наиболее эффективные методы оценивания оказываются несостоятельными, а состоятельные методы дают неэффективные оценки коэффициентов регрессионных соотношений. В частности, переход к центрированным по времени наблюдениям – техника “Within” – позволяет избавиться от индивидуальных эффектов, но в то же время, приводит к существенной потере эффективности. Рассмотрение тех же регрессионных соотношений для средних по времени значений переменных (“Between” ) позволяет оценить величину вклада индивидуальных эффектов в изменчивость зависимых переменных, но эти оценки имеют сильное смещение агрегированности.

Модель со случайными эффектами (random effects model)

В модели с фиксированными эффектами слишком много параметров и потери степеней свободы можно избежать, если предположить индивидуальные эффекты μiслучайными. Тогда можно предполагать, что ui~IID(0, σμ2), εit~IID(0, σε2), и μi не зависят от εit. Кроме того, Xitне зависят от ui и εit для всех i и t. Модель со случайными эффектами применяется в том случае, если мы выбираем случайным образом Nобъектов из большой генеральной совокупности элементов, например, в случае исследований панелей домашних хозяйств, индивидуумов или мелких фирм. Другим примером могут служить представители однородных товарных групп, образованных товарами-заменителями.

Модель со случайными эффектами можно рассматривать как компромисс между сквозной регрессией, налагающей сильное ограничение гомогенности на все коэффициенты уравнения регрессии для любых i и t, и регрессией FE, которая позволяет для каждого объекта выборки ввести свою константу и, таким образом, учесть существующую в реальности, но ненаблюдаемую гетерогенность.

Поиски такого компромисса бывают вызваны следующими причинами:

• оценки модели FE хотя и состоятельны для статических моделей в отсутствии эндогенности, но часто не очень эффективны. Иными словами, может получиться так, что коэффициенты при наиболее интересующих нас переменных окажутся незначимы;

• модель FE не позволяет оценивать коэффициенты при инвариантных по времени регрессорах, так как они элиминируются из модели после преобразования «within».

Сквозная регрессионная модель хотя и лишена этих недостатков, но часто дает несостоятельные оценки, поскольку никак не учитывает индивидуальную гетерогенность.

В модели со случайными эффектами (ui – случайны) индивидуальная гетерогенность учитывается не в самом уравнении, а в матрице ковариаций, которая имеет блочно-диагональный вид, так как внутри каждой группы случайные эффекты корреллируют между собой. Для оценивания такой регрессии следует использовать обобщенный метод наименьших квадратов (GLS).

Выбор модели.

1. Тест Хаусмана — применяемый эконометрике тест для сравнения моделей, оцененных разными методами, один из которых позволяет получить состоятельные оценки (факторы модели являются экзогенными) и при нулевой и при альтернативной гипотезе, а другой — только при нулевой гипотезе. Если статистика теста превышает критическое значение, регрессоры модели нельзя считать экзогенными, поэтому лучше использовать метод инструментальных переменных. В противном случае можно считать, что регрессоры не хуже инструментов и применять обычный МНК.

2. Второй вариант теста - на первом шаге оценивается МНК-регрессия факторов на инструменты. На втором шаге оценивается (также с помощью МНК) регрессия объясняемой переменной на исходные факторы и оценки этих факторов, полученных на первом шаге (или остатки регрессий, полученных на первом шаге). Если коэффициенты при дополнительных переменных совместно значимы, то регрессоры являются эндогенными

Таким образом, последовательно рассмотрев основные преимущества и проблемы панельных данных, основные регрессионные модели и практический пример использования панельных данных, цель работы была достигнута. На практическом примере были разобраны регрессионная модель со случайными эффектами и модель с фиксированными переменными. Следует отметить, что панельные данные могут быть использованы как для анализа экономических взаимосвязей, так и социально-экономических, как например взаимосвязь содержания диоксида углерода в воздухе с ВВП.

Просмотров работы: 6233