МОДЕЛИ БИНАРНОГО ВЫБОРА - Студенческий научный форум

VII Международная студенческая научная конференция Студенческий научный форум - 2015

МОДЕЛИ БИНАРНОГО ВЫБОРА

Орленко Е.К. 1
1Финансовый университет при Правительстве РФ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Модель бинарного выбора – это частный случай модели дискретного выбора, при котором зависимая переменная может принимать только два значения (1 или 0).

В моделях бинарного выбора двоичными переменными являются зависимые переменные.

Модель для двоичной переменной имеет вид

- скрытая (латентная) переменная,

Представленная модель называется моделью вероятности.

Расчетные значения модели интерпретируются как вероятности того, что зависимая переменная примет значение 1 при заданном значении объясняющих переменных.

При оценивании линейной вероятностной модели методом наименьших квадратов (МНК) сталкиваются с рядом проблем:

  1. Биномиальное распределение остатков.

  2. Гетероскедастичность и смещенность оценок.

  3. Расчетные значений зависимой переменной могут выходить за пределы интервала [0; 1].

  4. Неприменимость R2.

Возможные пути решения перечисленных проблем:

1. Увеличение числа наблюдений.

2. Обобщенный МНК.

3. Искусственное введение ограничений:

Y=-2 ⇒ Y=0

Y=1,2 ⇒ Y=1

При этом псевдокоэффициент детерминации рассчитывается следующим образом:

- Выбирается пороговое значение результата (например, 0,5)

Y=0, если Y < 0,5

Y=0, если Y > 0,5

- определяется число совпадений фактических и расчетных значений результата (s)

- рассчитываем псевдокоэффициент детерминации R2c=s/n.

Альтернативными способами оценивания параметров являются:

Подбор функции, область значений которой описывается отрезком [0;1], неубывающей на этом отрезке и обладающей свойством непрерывности.

Наиболее распространенные функции – стандартного нормального и логистического распределения.

Часто на практике используется логитовая модель вида:

где называется логитом, а Pi определяется вероятностью зависимой переменной Yt, рассчитываемой на основе логистического распределения:

В пробитовой модели, по аналогии с логитовой моделью, ненаблюдаемая величина Pi рассчитывается исходя из дистрибуанты нормального распределения как:

Параметры  логитовой и пробитовой моделей связаны соотношением:

На практике может использоваться любой из этих методов, поскольку все меры соответствия моделей эмпирическим данным оказываются для них идентичными.

Логитовый анализ используется в экономических исследованиях применительно к срезам индивидуальных данных тогда, когда эндогенная переменная имеет двоичный характер. Чаще всего эта переменная представляет результаты принятия рациональных экономических решений, например, приобретения автомобиля или квартиры, предоставления банковского кредита, слияния или поглощения фирм.

Пример.

В целях изучения востребованности нового товара на рынке (сыра) со стороны потребителя рассматривается зависимая переменная со следующим смыслом:

y=1, если новая продукция оказалась востребованной0 в противном случае

В качестве факторов рассматриваются следующие показатели:

х1 – экспертная оценка соотношения «цена-качество» в баллах,

х2 – экспертная оценка вкуса в баллах,

х3 – экспертная оценка упаковки в баллах.

Под «востребованной новой продукцией» понимается продукция, уровень продаж которой после выведения ее на рынок в течение года не опустился ниже минимально допустимого.

Таблица 1 – Экспертные оценки и оценка востребованности товара

№ пп

y

x1

x2

x3

1

0

6

7

1

2

0

4

6

3

3

1

7

3

8

4

1

6

5

10

5

0

2

3

1

6

0

3

4

2

7

1

8

9

10

8

1

5

8

6

9

0

4

4

3

10

0

3

5

3

11

1

9

6

10

12

1

8

10

6

13

1

7

10

9

14

0

4

3

6

15

0

2

1

2

16

1

8

7

10

17

0

5

4

3

18

0

2

3

4

19

1

9

6

7

20

1

7

8

10

21

0

2

6

3

22

1

5

3

6

23

0

6

4

2

24

0

8

5

6

25

1

10

6

4

26

0

4

3

4

27

0

5

4

1

28

1

5

9

10

29

1

10

8

7

30

1

7

9

9

31

1

6

10

8

32

1

9

8

6

33

0

8

1

5

34

1

9

6

8

35

1

3

10

9

36

1

7

8

10

37

1

10

5

7

38

1

9

6

8

39

0

2

4

3

40

0

4

6

10

41

1

10

5

8

42

1

9

6

1

43

1

5

9

10

44

0

2

4

3

45

1

7

8

10

46

1

10

5

7

47

0

6

4

2

48

0

8

5

6

49

1

10

6

4

50

1

5

9

10

По данным таблицы 1 в системе STATISTICA была построена следующая модель:

Py=1x=e-11,0446+0,7785x1+0,6418x2+0,4797x31+e-11,0446+0,7785x1+0,6418x2+0,4797x3

Анализ таблицы 2 позволяет сделать вывод том, что полученные оценки коэффициентов являются статистически значимыми (все стандартные ошибки меньше значений коэффициентов, а все вероятные ошибки меньше 0,05).

Таблица 2 – Оценки коэффициентов модели и их характеристики

Оценки коэффициентов

Стандартные ошибки

Статистики Вальда

Вероятности

b0=-11,0446

3,38390

10,6528

0,0010

b1=0,7785

0,3122

6,2158

0,0126

b2=0,6418

0,2995

4,5919

0,0321

b3=0,4797

0,2082

5,3077

0,0212

Из таблицы 3 видно, что с достаточным уровнем надежности не удалось предсказать значение моделируемого показателя только в двух отмеченных случаях.

Таблица 3 – Фактические и предсказанные значения востребованности нового товара

№ пп

y

y

1

0

0,1976

2

0

0,0665

3

1

0,5420

4

1

0,8365

5

0

0,0008

6

0

0,0055

7

1

0,9968

8

1

0,7029

9

0

0,0193

10

0

0,0169

11

1

0,9901

12

1

0,9887

13

1

0,9941

14

0

0,0420

15

0

0,0003

16

1

0,9887

17

0

0,0412

18

0

0,0035

19

1

0,9597

20

1

0,9870

21

0

0,0148

22

1

0,0872

23

0

0,0548

24

0

0,7809

25

1

0,9248

26

0

0,0165

27

0

0,0162

28

1

0,9683

29

1

0,9946

30

1

0,9890

31

1

0,9798

32

1

0,9815

33

0

0,1448

34

1

0,9746

35

1

0,8836

36

1

0,9870

37

1

0,9647

38

1

0,9746

39

0

0,0041

40

0

0,6721

41

1

0,9778

42

1

0,5726

43

1

0,9683

44

0

0,0041

45

1

0,9870

46

1

0,9647

47

0

0,0548

48

0

0,7809

49

1

0,9248

50

1

0,9683

Данные, представленные в таблице 4, позволяют рассчитать индекс отношения правдоподобия МакФаддена:

LRI=1-ln(b)lnL(b0)=1--9,7377-34,0146=0,7137

значение которого свидетельствует об адекватности построенной модели.

Таблица 4 – Тест правдоподобия 1-го типа

Максимальное правдоподобие

Хи-квадрат

Вероятности

-34,0146

   

-22,1826

23,6640

0,000001

-13,1069

18,1514

0,00020

-9,7377

6,7383

0,009436

Полученная модель используется для принятия решения о включении в ассортиментную линейку новой товарной продукции с заданными товарными характеристиками. Например, вероятность того, что новый сыр, товарные характеристики которого оценены экспертами следующим образом: соотношение «цена-качество» - 6 баллов, вкус – 7 баллов, упаковка – 7 баллов, окажется востребованным, равна:

Py=1x=e-11,0446+0,7785∙6+0,6418∙7+0,4797∙71+e-11,0446+0,7785∙6+0,6418∙7+0,4797∙7=0,74

Следовательно, новый продукт целесообразно включить в ассортиментную линейку, поскольку с вероятностью 0,74 он будет востребован на рынке.

Применение модели позволяет разрешить проблему отсутствия статистической информации о новом продукте и в тоже время дает количественное обоснование принимаемому решению, что естественным образом повышает его надежность.

Использованная литература

1) Леонов А. И. Ассортиментная политика предприятия: сущность, содержание, структура / А. И. Леонов // Предпринимательство. – 2004. - №3. – с. 98-108.

2) Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. – М.: Дело, 2007. – 504 с.

3) Носко В. П. Эконометрика для начинающих. – М. ИЭПП, 2005, с. 379.

4) Соловьев Б. А. Маркетинг / Б. А. Соловьев. – М.: Инфра-М, 2009. – 384 с.

10

Просмотров работы: 2634