Модель бинарного выбора – это частный случай модели дискретного выбора, при котором зависимая переменная может принимать только два значения (1 или 0).
В моделях бинарного выбора двоичными переменными являются зависимые переменные.
Модель для двоичной переменной имеет вид
- скрытая (латентная) переменная,
Представленная модель называется моделью вероятности.
Расчетные значения модели интерпретируются как вероятности того, что зависимая переменная примет значение 1 при заданном значении объясняющих переменных.
При оценивании линейной вероятностной модели методом наименьших квадратов (МНК) сталкиваются с рядом проблем:
Биномиальное распределение остатков.
Гетероскедастичность и смещенность оценок.
Расчетные значений зависимой переменной могут выходить за пределы интервала [0; 1].
Неприменимость R2.
Возможные пути решения перечисленных проблем:
1. Увеличение числа наблюдений.
2. Обобщенный МНК.
3. Искусственное введение ограничений:
Y=-2 ⇒ Y=0
Y=1,2 ⇒ Y=1
При этом псевдокоэффициент детерминации рассчитывается следующим образом:
- Выбирается пороговое значение результата (например, 0,5)
Y=0, если Y < 0,5
Y=0, если Y > 0,5
- определяется число совпадений фактических и расчетных значений результата (s)
- рассчитываем псевдокоэффициент детерминации R2c=s/n.
Альтернативными способами оценивания параметров являются:
Подбор функции, область значений которой описывается отрезком [0;1], неубывающей на этом отрезке и обладающей свойством непрерывности.
Наиболее распространенные функции – стандартного нормального и логистического распределения.
Часто на практике используется логитовая модель вида:
где называется логитом, а Pi определяется вероятностью зависимой переменной Yt, рассчитываемой на основе логистического распределения:
В пробитовой модели, по аналогии с логитовой моделью, ненаблюдаемая величина Pi рассчитывается исходя из дистрибуанты нормального распределения как:
Параметры логитовой и пробитовой моделей связаны соотношением:
На практике может использоваться любой из этих методов, поскольку все меры соответствия моделей эмпирическим данным оказываются для них идентичными.
Логитовый анализ используется в экономических исследованиях применительно к срезам индивидуальных данных тогда, когда эндогенная переменная имеет двоичный характер. Чаще всего эта переменная представляет результаты принятия рациональных экономических решений, например, приобретения автомобиля или квартиры, предоставления банковского кредита, слияния или поглощения фирм.
Пример.
В целях изучения востребованности нового товара на рынке (сыра) со стороны потребителя рассматривается зависимая переменная со следующим смыслом:
y=1, если новая продукция оказалась востребованной0 в противном случае
В качестве факторов рассматриваются следующие показатели:
х1 – экспертная оценка соотношения «цена-качество» в баллах,
х2 – экспертная оценка вкуса в баллах,
х3 – экспертная оценка упаковки в баллах.
Под «востребованной новой продукцией» понимается продукция, уровень продаж которой после выведения ее на рынок в течение года не опустился ниже минимально допустимого.
Таблица 1 – Экспертные оценки и оценка востребованности товара
№ пп |
y |
x1 |
x2 |
x3 |
1 |
0 |
6 |
7 |
1 |
2 |
0 |
4 |
6 |
3 |
3 |
1 |
7 |
3 |
8 |
4 |
1 |
6 |
5 |
10 |
5 |
0 |
2 |
3 |
1 |
6 |
0 |
3 |
4 |
2 |
7 |
1 |
8 |
9 |
10 |
8 |
1 |
5 |
8 |
6 |
9 |
0 |
4 |
4 |
3 |
10 |
0 |
3 |
5 |
3 |
11 |
1 |
9 |
6 |
10 |
12 |
1 |
8 |
10 |
6 |
13 |
1 |
7 |
10 |
9 |
14 |
0 |
4 |
3 |
6 |
15 |
0 |
2 |
1 |
2 |
16 |
1 |
8 |
7 |
10 |
17 |
0 |
5 |
4 |
3 |
18 |
0 |
2 |
3 |
4 |
19 |
1 |
9 |
6 |
7 |
20 |
1 |
7 |
8 |
10 |
21 |
0 |
2 |
6 |
3 |
22 |
1 |
5 |
3 |
6 |
23 |
0 |
6 |
4 |
2 |
24 |
0 |
8 |
5 |
6 |
25 |
1 |
10 |
6 |
4 |
26 |
0 |
4 |
3 |
4 |
27 |
0 |
5 |
4 |
1 |
28 |
1 |
5 |
9 |
10 |
29 |
1 |
10 |
8 |
7 |
30 |
1 |
7 |
9 |
9 |
31 |
1 |
6 |
10 |
8 |
32 |
1 |
9 |
8 |
6 |
33 |
0 |
8 |
1 |
5 |
34 |
1 |
9 |
6 |
8 |
35 |
1 |
3 |
10 |
9 |
36 |
1 |
7 |
8 |
10 |
37 |
1 |
10 |
5 |
7 |
38 |
1 |
9 |
6 |
8 |
39 |
0 |
2 |
4 |
3 |
40 |
0 |
4 |
6 |
10 |
41 |
1 |
10 |
5 |
8 |
42 |
1 |
9 |
6 |
1 |
43 |
1 |
5 |
9 |
10 |
44 |
0 |
2 |
4 |
3 |
45 |
1 |
7 |
8 |
10 |
46 |
1 |
10 |
5 |
7 |
47 |
0 |
6 |
4 |
2 |
48 |
0 |
8 |
5 |
6 |
49 |
1 |
10 |
6 |
4 |
50 |
1 |
5 |
9 |
10 |
По данным таблицы 1 в системе STATISTICA была построена следующая модель:
Py=1x=e-11,0446+0,7785x1+0,6418x2+0,4797x31+e-11,0446+0,7785x1+0,6418x2+0,4797x3
Анализ таблицы 2 позволяет сделать вывод том, что полученные оценки коэффициентов являются статистически значимыми (все стандартные ошибки меньше значений коэффициентов, а все вероятные ошибки меньше 0,05).
Таблица 2 – Оценки коэффициентов модели и их характеристики
Оценки коэффициентов |
Стандартные ошибки |
Статистики Вальда |
Вероятности |
b0=-11,0446 |
3,38390 |
10,6528 |
0,0010 |
b1=0,7785 |
0,3122 |
6,2158 |
0,0126 |
b2=0,6418 |
0,2995 |
4,5919 |
0,0321 |
b3=0,4797 |
0,2082 |
5,3077 |
0,0212 |
Из таблицы 3 видно, что с достаточным уровнем надежности не удалось предсказать значение моделируемого показателя только в двух отмеченных случаях.
Таблица 3 – Фактические и предсказанные значения востребованности нового товара
№ пп |
y |
y |
1 |
0 |
0,1976 |
2 |
0 |
0,0665 |
3 |
1 |
0,5420 |
4 |
1 |
0,8365 |
5 |
0 |
0,0008 |
6 |
0 |
0,0055 |
7 |
1 |
0,9968 |
8 |
1 |
0,7029 |
9 |
0 |
0,0193 |
10 |
0 |
0,0169 |
11 |
1 |
0,9901 |
12 |
1 |
0,9887 |
13 |
1 |
0,9941 |
14 |
0 |
0,0420 |
15 |
0 |
0,0003 |
16 |
1 |
0,9887 |
17 |
0 |
0,0412 |
18 |
0 |
0,0035 |
19 |
1 |
0,9597 |
20 |
1 |
0,9870 |
21 |
0 |
0,0148 |
22 |
1 |
0,0872 |
23 |
0 |
0,0548 |
24 |
0 |
0,7809 |
25 |
1 |
0,9248 |
26 |
0 |
0,0165 |
27 |
0 |
0,0162 |
28 |
1 |
0,9683 |
29 |
1 |
0,9946 |
30 |
1 |
0,9890 |
31 |
1 |
0,9798 |
32 |
1 |
0,9815 |
33 |
0 |
0,1448 |
34 |
1 |
0,9746 |
35 |
1 |
0,8836 |
36 |
1 |
0,9870 |
37 |
1 |
0,9647 |
38 |
1 |
0,9746 |
39 |
0 |
0,0041 |
40 |
0 |
0,6721 |
41 |
1 |
0,9778 |
42 |
1 |
0,5726 |
43 |
1 |
0,9683 |
44 |
0 |
0,0041 |
45 |
1 |
0,9870 |
46 |
1 |
0,9647 |
47 |
0 |
0,0548 |
48 |
0 |
0,7809 |
49 |
1 |
0,9248 |
50 |
1 |
0,9683 |
Данные, представленные в таблице 4, позволяют рассчитать индекс отношения правдоподобия МакФаддена:
LRI=1-ln(b)lnL(b0)=1--9,7377-34,0146=0,7137
значение которого свидетельствует об адекватности построенной модели.
Таблица 4 – Тест правдоподобия 1-го типа
Максимальное правдоподобие |
Хи-квадрат |
Вероятности |
-34,0146 |
||
-22,1826 |
23,6640 |
0,000001 |
-13,1069 |
18,1514 |
0,00020 |
-9,7377 |
6,7383 |
0,009436 |
Полученная модель используется для принятия решения о включении в ассортиментную линейку новой товарной продукции с заданными товарными характеристиками. Например, вероятность того, что новый сыр, товарные характеристики которого оценены экспертами следующим образом: соотношение «цена-качество» - 6 баллов, вкус – 7 баллов, упаковка – 7 баллов, окажется востребованным, равна:
Py=1x=e-11,0446+0,7785∙6+0,6418∙7+0,4797∙71+e-11,0446+0,7785∙6+0,6418∙7+0,4797∙7=0,74
Следовательно, новый продукт целесообразно включить в ассортиментную линейку, поскольку с вероятностью 0,74 он будет востребован на рынке.
Применение модели позволяет разрешить проблему отсутствия статистической информации о новом продукте и в тоже время дает количественное обоснование принимаемому решению, что естественным образом повышает его надежность.
Использованная литература
1) Леонов А. И. Ассортиментная политика предприятия: сущность, содержание, структура / А. И. Леонов // Предпринимательство. – 2004. - №3. – с. 98-108.
2) Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. – М.: Дело, 2007. – 504 с.
3) Носко В. П. Эконометрика для начинающих. – М. ИЭПП, 2005, с. 379.
4) Соловьев Б. А. Маркетинг / Б. А. Соловьев. – М.: Инфра-М, 2009. – 384 с.
10