МОДЕЛИ БИНАРНОГО ВЫБОРА

Орленко Е.К. 1

1Финансовый университет при Правительстве РФ

Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Модель бинарного выбора – это частный случай модели дискретного выбора, при котором зависимая переменная может принимать только два значения (1 или 0).

В моделях бинарного выбора двоичными переменными являются зависимые переменные.

Модель для двоичной переменной имеет вид

- скрытая (латентная) переменная,

Представленная модель называется моделью вероятности.

Расчетные значения модели интерпретируются как вероятности того, что зависимая переменная примет значение 1 при заданном значении объясняющих переменных.

При оценивании линейной вероятностной модели методом наименьших квадратов (МНК) сталкиваются с рядом проблем:

Биномиальное распределение остатков.
Гетероскедастичность и смещенность оценок.
Расчетные значений зависимой переменной могут выходить за пределы интервала [0; 1].
Неприменимость R².

Возможные пути решения перечисленных проблем:

1. Увеличение числа наблюдений.

2. Обобщенный МНК.

3. Искусственное введение ограничений:

Y=-2 ⇒ Y=0

Y=1,2 ⇒ Y=1

При этом псевдокоэффициент детерминации рассчитывается следующим образом:

- Выбирается пороговое значение результата (например, 0,5)

Y=0, если Y < 0,5

Y=0, если Y > 0,5

- определяется число совпадений фактических и расчетных значений результата (s)

- рассчитываем псевдокоэффициент детерминации R²_c=s/n.

Альтернативными способами оценивания параметров являются:

Подбор функции, область значений которой описывается отрезком [0;1], неубывающей на этом отрезке и обладающей свойством непрерывности.

Наиболее распространенные функции – стандартного нормального и логистического распределения.

Часто на практике используется логитовая модель вида:

где называется логитом, а Pi определяется вероятностью зависимой переменной Yt, рассчитываемой на основе логистического распределения:

В пробитовой модели, по аналогии с логитовой моделью, ненаблюдаемая величина Pi рассчитывается исходя из дистрибуанты нормального распределения как:

Параметры  логитовой и пробитовой моделей связаны соотношением:

На практике может использоваться любой из этих методов, поскольку все меры соответствия моделей эмпирическим данным оказываются для них идентичными.

Логитовый анализ используется в экономических исследованиях применительно к срезам индивидуальных данных тогда, когда эндогенная переменная имеет двоичный характер. Чаще всего эта переменная представляет результаты принятия рациональных экономических решений, например, приобретения автомобиля или квартиры, предоставления банковского кредита, слияния или поглощения фирм.

Пример.

В целях изучения востребованности нового товара на рынке (сыра) со стороны потребителя рассматривается зависимая переменная со следующим смыслом:

y=1, если новая продукция оказалась востребованной0 в противном случае

В качестве факторов рассматриваются следующие показатели:

х1 – экспертная оценка соотношения «цена-качество» в баллах,

х2 – экспертная оценка вкуса в баллах,

х3 – экспертная оценка упаковки в баллах.

Под «востребованной новой продукцией» понимается продукция, уровень продаж которой после выведения ее на рынок в течение года не опустился ниже минимально допустимого.

Таблица 1 – Экспертные оценки и оценка востребованности товара

№ пп	y	x1	x2	x3
1	0	6	7	1
2	0	4	6	3
3	1	7	3	8
4	1	6	5	10
5	0	2	3	1
6	0	3	4	2
7	1	8	9	10
8	1	5	8	6
9	0	4	4	3
10	0	3	5	3
11	1	9	6	10
12	1	8	10	6
13	1	7	10	9
14	0	4	3	6
15	0	2	1	2
16	1	8	7	10
17	0	5	4	3
18	0	2	3	4
19	1	9	6	7
20	1	7	8	10
21	0	2	6	3
22	1	5	3	6
23	0	6	4	2
24	0	8	5	6
25	1	10	6	4
26	0	4	3	4
27	0	5	4	1
28	1	5	9	10
29	1	10	8	7
30	1	7	9	9
31	1	6	10	8
32	1	9	8	6
33	0	8	1	5
34	1	9	6	8
35	1	3	10	9
36	1	7	8	10
37	1	10	5	7
38	1	9	6	8
39	0	2	4	3
40	0	4	6	10
41	1	10	5	8
42	1	9	6	1
43	1	5	9	10
44	0	2	4	3
45	1	7	8	10
46	1	10	5	7
47	0	6	4	2
48	0	8	5	6
49	1	10	6	4
50	1	5	9	10

По данным таблицы 1 в системе STATISTICA была построена следующая модель:

Py=1x=e-11,0446+0,7785x1+0,6418x2+0,4797x31+e-11,0446+0,7785x1+0,6418x2+0,4797x3

Анализ таблицы 2 позволяет сделать вывод том, что полученные оценки коэффициентов являются статистически значимыми (все стандартные ошибки меньше значений коэффициентов, а все вероятные ошибки меньше 0,05).

Таблица 2 – Оценки коэффициентов модели и их характеристики

Оценки коэффициентов	Стандартные ошибки	Статистики Вальда	Вероятности
b0=-11,0446	3,38390	10,6528	0,0010
b1=0,7785	0,3122	6,2158	0,0126
b2=0,6418	0,2995	4,5919	0,0321
b3=0,4797	0,2082	5,3077	0,0212

Из таблицы 3 видно, что с достаточным уровнем надежности не удалось предсказать значение моделируемого показателя только в двух отмеченных случаях.

Таблица 3 – Фактические и предсказанные значения востребованности нового товара

№ пп	y	y
1	0	0,1976
2	0	0,0665
3	1	0,5420
4	1	0,8365
5	0	0,0008
6	0	0,0055
7	1	0,9968
8	1	0,7029
9	0	0,0193
10	0	0,0169
11	1	0,9901
12	1	0,9887
13	1	0,9941
14	0	0,0420
15	0	0,0003
16	1	0,9887
17	0	0,0412
18	0	0,0035
19	1	0,9597
20	1	0,9870
21	0	0,0148
22	1	0,0872
23	0	0,0548
24	0	0,7809
25	1	0,9248
26	0	0,0165
27	0	0,0162
28	1	0,9683
29	1	0,9946
30	1	0,9890
31	1	0,9798
32	1	0,9815
33	0	0,1448
34	1	0,9746
35	1	0,8836
36	1	0,9870
37	1	0,9647
38	1	0,9746
39	0	0,0041
40	0	0,6721
41	1	0,9778
42	1	0,5726
43	1	0,9683
44	0	0,0041
45	1	0,9870
46	1	0,9647
47	0	0,0548
48	0	0,7809
49	1	0,9248
50	1	0,9683

Данные, представленные в таблице 4, позволяют рассчитать индекс отношения правдоподобия МакФаддена:

LRI=1-ln(b)lnL(b0)=1--9,7377-34,0146=0,7137

значение которого свидетельствует об адекватности построенной модели.

Таблица 4 – Тест правдоподобия 1-го типа

Максимальное правдоподобие	Хи-квадрат	Вероятности
-34,0146
-22,1826	23,6640	0,000001
-13,1069	18,1514	0,00020
-9,7377	6,7383	0,009436

Полученная модель используется для принятия решения о включении в ассортиментную линейку новой товарной продукции с заданными товарными характеристиками. Например, вероятность того, что новый сыр, товарные характеристики которого оценены экспертами следующим образом: соотношение «цена-качество» - 6 баллов, вкус – 7 баллов, упаковка – 7 баллов, окажется востребованным, равна:

Py=1x=e-11,0446+0,7785∙6+0,6418∙7+0,4797∙71+e-11,0446+0,7785∙6+0,6418∙7+0,4797∙7=0,74

Следовательно, новый продукт целесообразно включить в ассортиментную линейку, поскольку с вероятностью 0,74 он будет востребован на рынке.

Применение модели позволяет разрешить проблему отсутствия статистической информации о новом продукте и в тоже время дает количественное обоснование принимаемому решению, что естественным образом повышает его надежность.

Использованная литература

1) Леонов А. И. Ассортиментная политика предприятия: сущность, содержание, структура / А. И. Леонов // Предпринимательство. – 2004. - №3. – с. 98-108.

2) Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. – М.: Дело, 2007. – 504 с.

3) Носко В. П. Эконометрика для начинающих. – М. ИЭПП, 2005, с. 379.

4) Соловьев Б. А. Маркетинг / Б. А. Соловьев. – М.: Инфра-М, 2009. – 384 с.

Просмотров работы: 2628

Код для цитирования:

VII Международная студенческая научная конференция Студенческий научный форум - 2015

МОДЕЛИ БИНАРНОГО ВЫБОРА

Студенческий научный форум - 2015
VII Международная студенческая научная конференция