В работе проводится экономико-математический анализ показателей, влияющих на стоимость спортивной команды. Проводится обоснование выбранных показателей. Актуальность работы определяется как применением эконометрического анализа в спортивной сфере.
Профессиональный спорт – это, прежде всего шоу, которое должно продаваться и приносить прибыль.
В данной работе исследуется Национальная Хоккейная Лига, т.к., США являются лидером во всем, что касается продажи различных видов шоу, в том числе и спортивных.
В качестве объекта исследования (Y) была выбрана стоимость «стоимость команды, в млн. $ (Y)», играющей в чемпионате НХЛ.
НХЛ интересна еще и тем, что последние годы в ней происходит удивительная аномалия. В сезоне 2012-2013, отчасти и из-за локаута, отчасти и из-за очень удачной политики менеджеров, при увеличении средней стоимости билета на 5,7%, посещаемость матчей выросла на 1,8%., а в сезоне 2012-2013 г составила 96%! И в текущем сезоне данная тенденция сохраняется.
Для исследования взяты 30 команд НХЛ (по данным на октябрь 2013 г.) Статистические данные выбраны с официальных сайтов команд и из статистических ресурсов США и Канады. Были выбраны ряд факторов, от которых, на мой взгляд, зависит «стоимость команды»:
- доход, приносимый командой за участие в соревнованиях, млн. $ (x1);
- операционная прибыль, млн. $ (x2);
- поступление средств с продажи билетов, млн. $ (x3);
- доход в расчете на 1 фаната, $ (x4).
Исходные данные для проведения расчетов и анализа приведены в таблице 1.
Название |
стоимость команды млн$ Y |
Доход Млн$ X |
Операционная прибыль млн$ |
Поступления с продажи билетов млн$ |
Доход в расчете 1 фаната $ |
Y |
X1 |
X2 |
X3 |
X4 |
|
Вашингтон |
397 |
102 |
1,7 |
19 |
10 |
Атланта |
316 |
99 |
-18,7 |
17 |
10 |
Бостон |
730 |
143 |
18,7 |
58 |
20 |
Голден стейт |
555 |
127 |
29,1 |
31 |
19 |
Даллас |
685 |
137 |
13 |
35 |
15 |
Денвер |
427 |
110 |
12 |
26 |
27 |
Детройт |
400 |
125 |
7,7 |
15 |
19 |
Индиана |
383 |
98 |
10,9 |
15 |
32 |
Кливленд |
434 |
128 |
18,6 |
24 |
41 |
Клипперс |
430 |
108 |
9,1 |
29 |
10 |
Лэйкерс |
1000 |
197 |
47,8 |
74 |
24 |
Майами |
625 |
150 |
14,9 |
61 |
19 |
Мемфис |
377 |
96 |
-12,5 |
15 |
36 |
Милуоки |
312 |
87 |
-0,5 |
14 |
24 |
Миннесота |
364 |
96 |
-4,5 |
16 |
15 |
Нью-Йорк |
1100 |
243 |
83,2 |
94 |
21 |
Оклахома |
475 |
127 |
29,9 |
43 |
71 |
Орландо |
470 |
126 |
12 |
76 |
40 |
Портленд |
457 |
117 |
-10,1 |
31 |
34 |
Сан-Антонио |
527 |
135 |
14,7 |
48 |
47 |
Торонто |
405 |
121 |
18,8 |
31 |
13 |
Филадельфия |
418 |
107 |
-0,8 |
26 |
10 |
Финикс |
474 |
121 |
13 |
28 |
18 |
Хьюстон |
568 |
135 |
26,6 |
28 |
16 |
Чикаго |
800 |
162 |
34,2 |
47 |
13 |
Шарлотт |
315 |
93 |
-13,3 |
14 |
25 |
Юта |
432 |
111 |
12,1 |
31 |
67 |
Сокраменто |
525 |
96 |
2,6 |
18 |
24 |
Нью Орлеан |
340 |
100 |
3,3 |
22 |
46 |
Бруклин |
530 |
84 |
-16,6 |
14 |
4 |
Работа выполнена в Пакете анализа электронного процессора Excel.
На первом этапе была определена матрица парных коэффициентов корреляции и проведен тест Фаррара-Глоубера для отбора показателей для последующего моделирования. Самый высокий показатель парной корреляции у показателя «доход, приносимый командой за участие в соревнованиях» (0,914) а самый низкий у показателя с «доход в расчете на 1 фаната» (-0,145). Другие показатели так же, как и х1, имеют довольно высокие парные корреляции с Y, что обуславливает необходимость проверки показателей на наличие между ними мультиколлинеарности. Для этого выполняется для оставшихся показателей (это x2, x3) тест Фаррара-Глоубера. Наблюдаемое значение статистики Фаррара – Глоубера находится по формуле:
Фактическое значение критерия FG при n (количество наблюдений, то есть штатов) равным 30 и при k (количество показателей) равным 4 составляет 89,04. Оно больше табличного значения 12,59 (находится с применением функции ХИ2ОБР). Таким образом, в массиве переменных существует мультиколлинеарность.
Через обратную матрицу проверяем наличие мультиколлинеарности каждой переменной с другими переменными и вычисляем значения F-критериев:
Так как все значения F-критериев больше табличного, то все исследуемые переменные мультиколлинеарны. Больше других влияет на общую мультиколлинеарность «доход, приносимый командой за участие в соревнованиях» (63,54) а самый низкий - «доход в расчете на 1 фаната» (1,34.
Проверка наличия мультиколлинеарности каждой пары переменных осуществляется через построение матрицы парных корреляций. Затем формируется таблица t-критериев (см. табл.2) для коэффициентов частной корреляции:
t12 |
10,658 |
t13 |
8,760 |
t14 |
-0,063 |
Tкрит = |
2,059 |
Из таблиц t-критериев видно, что две пары показателей «операционная прибыль» и «поступление средств с продажи билетов» имеют высокую статистически значимую частную корреляцию, то есть являются мультиколлинеарными. Необходимо исключить одну из переменных коллинеарной пары, чтобы уменьшить мультиколлинеарность. Очевидно, что показатель «операционная прибыль» сильно влияет на общую мультиколлинеарность, и он имеет высокое значение F-критерия (32,64). В результате проведения полного теста Фаррара-Глоубера на мультиколлинеарность из модели исключены два показателя «операционная прибыль» и «доход в расчете на 1 фаната».
На следующем этапе проводим пошаговый отбор показателей методом исключения из модели статистически незначимых параметров. При анализе на мультиколлинеарность были исключены два показателя, поэтому они не будут участвовать в пошаговом отборе. На первом этапе отбора показатель «доход, приносимый командой за участие в соревнованиях» является статистически значимым, так как его фактическое значение t-критерия больше табличного значения (), а параметр при x3 – «поступление средств с продажи билетов» является статистически незначимым (). Таким образом, получено регрессионное уравнение с двумя показателями: Y и x1. Запись эконометрической модели в данном случае будет следующей:
Y= -132,511 +5,229*Х1 + U
(55,58) (0,44) (78,29)
При увеличении «дохода, приносимого командой за участие в соревнованиях» на 1,0 млн. $ показатель «Стоимость команды» возрастем в 5,23 раза.
Необходимо проверить статистическую значимость уравнения с помощью F-критерия Фишера. Fтабл(0,05;1;28) = 4,196 меньше наблюдаемого значения 142,69. Так как , то уравнение регрессии статистически значимо. Таким образом, связь показателя «Стоимость команды» с включением в модель показателя «доход, приносимый командой за участие в соревнованиях» существенна.
При проверке предпосылки МНК о гомоскедастичности остатков в модели множественной регрессии видно, что проведенный тест Голдфелда-Квандта дает следующие значения: GQ=0,95; GQ-1 = 1,06. F-крит с уровнем значимости и двумя одинаковыми степенями свободы K=11 равен:
Fтабл(0,05;11;11)=2,82
GQ Se линейная множественная модель является точной.
В рамках анализа необходимо провести оценку степени влияния показателей на результирующую переменную «Стоимость команды» с помощью коэффициентов эластичности, и -коэффициентов и выбрать наиболее влиятельный показатель.
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении показателя на один процент находится по формуле, где – коэффициент регрессии, стоящий перед показателем в уравнении регрессии:
Эх1= 1,303, Эх2= -0,016, Эх3= 0,025
Из результатов анализа видно, что изменение Y по показателю x1 «доход, приносимый командой за участие в соревнованиях» больше единицы, т.е. при его изменении на 1% значение Y («Стоимость команды») увеличится в 1,3 раза, что соответствует экономической и реальной действительности. Другие же показатели эластичности достаточно малы и ими можно пренебречь.
Бета-коэффициенты показывают, на какую часть величины среднеквадратического отклонения (СКО) меняется среднее значение зависимой переменной с изменением независимой переменной на одно СКО при фиксированном на постоянном уровне значении остальных независимых переменных и находятся по формуле , где , – среднеквадратические отклонения соответствующих переменных:
βх1= 0,946, βх2= -0,075, βх3=0,042
Таким образом, при изменении каждого из показателей на одно СКО показатель «Стоимость команды» меняется соответственно на 0,94, -0,075, и 0,042 своего СКО.
Величина дельта-коэффициентов показывает долю влияния конкретного показателя в суммарном влиянии всех показателей,
где – коэффициенты парной корреляции,– коэффициент детерминации:
Δх1= 1,032
Δх2= -0,073
Δх3= 0,041
Как видно из величины дельта-коэффициентов доля влияния показателя «доход, приносимый командой за участие в соревнованиях» преобладает в совокупном влиянии всех других показателей.
Из проведенного анализа степени влияния показателей на результирующую переменную «Стоимость команды» на основании полученных результатов - коэффициентов эластичности, и -коэффициентов можно сделать вывод о преобладающем на нее влияния показателя «доход, приносимый командой за участие в соревнованиях».
Построим парную регрессию с наиболее влиятельным показателем и сравним множественную (для трех показателей) и парную регрессии на качество, см. таблицу.
Модели |
F-критерий |
Стандартная ошибка |
|
Парная Y= -132,511 +5,229*Х1 |
0,836 |
142,69 |
78,28845 |
Множественная линейная Y= -159,050+5,408Х1 - 0,695Х2+0,384Х3 |
0,837 |
44,69 |
80,85 |
Из сводной таблицы сравнения качества линейных парной и множественной моделей видно, что модели они сравнимы по качественным характеристикам. Значение коэффициента детерминации несколько больше у множественной модели по сравнению с парной, но не значительно. Это так и должно быть за счет увеличения числа объясняющих переменных. Однако, коэффициент Fмод парной регрессии (142,69) в 3,5 раза превышает Fмод множественной (44,69) и стандартная ошибка в парной регрессии меньше, чем во множественной.
Проведем проверку теста на «короткую» и «длинную» регрессии для отбора наиболее существенных объясняющих переменных. Рассмотрим две модели регрессии:
yi= β0 + β1 xi1 +…+ βk xik+ε i (длинную)
yi= β0 + β1 xi1 +…+ βk xik-q+εi (короткую)
Для выполнения теста необходимо построить по МНК длинную регрессию по всем показателям и найти для неё сумму квадратов остатков –. Тоже действие нужно провести для короткой регрессии. Затем следует рассчитать F-статистику:
и сравнить её с табличным значением.
Если Fнабл>Fтабл (α, v1=q, v2=n-k-1), гипотеза отвергается и надо выбрать длинную регрессию, в противном случае – короткую регрессию.
Сумму квадратов остатков равна 169968,4. Сумма квадратов остатков равна 170420,6. Fнабл = 0,06918, а Fтабл = 2,7426. Таким образом, короткая регрессия является статистически более значимой.
По линейной парной регрессии рассчитаем модельное значение Y показателя для каждого банка и найдем для них доверительные интервалы с 95% вероятности при U= Se* ta . В результате этого анализа были выявлены 2 команды, в которых превышено значение КНС: это «Нью-Йорк» и «Лэйкерс».
Список литературы:
Дрейпер, Норман, Смит, Гарри. Прикладной регрессионный анализ. – М.: Издательский дом «Вильямс», 2007.
Мур Дж., Уэдерфорд Л. и др. Экономическое моделирование в Microsoft Excel. – М. 2004.
Орлова И.В., Половников В.А. Экономико-математические методы и модели: компьютерное моделирование. / учебное пособие для студентов высших учебных заведений, обучающихся по специальности "Статистика" и другим экономическим специальностям / Москва, 2011. Сер. Вузовский учебник (3-е издание, переработанное и дополненное)
Эконометрика: учебник для магистров / под ред. И.И. Елисеевой. – М.: Издательство Юрайт, 2012.
Орлова И.В. Экономико-математическое моделирование: Практическое пособие по решению задач. - 2-е издание, испр. и доп. – М.: Вузовский учебник: ИНФРА-М, 2012.
9