Корреляционно- регрессионный анализ является одним из методов статистического анализа взаимосвязи нескольких признаков. Он определяется как метод, применяемый тогда, когда данные наблюдения можно считать случайными и выбранными из генеральной совокупности, распределенной по многомерному нормальному закону.
Корреляция (от лат. correlatio - взаимосвязь) - зависимость между величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.
Задачами корреляционно-регрессионного анализа являются отражение статистической связи в форме уравнения регрессии (регрессионный анализ) и измерение тесноты связи (корреляционный анализ), т.е. измерение всех основных параметров статистической связи.
Корреляционные связи различаются содержанием, направлением и формой.
Форма связи - это характер различия(изменения) среднего значения результативного признака (у) с различием (изменением) факторного признака (х).
Основные формы связи:
1 Линейная связь. Возникает в случае когда равным различиям
фактора соответствуют равные различия результативного признака. Выражается уравнением
͞у- среднее значение результативного признака
х- значения факторного признака
2 Параболическая связь. Равным значениям (х) соответствуют равномерно изменяющиеся различия ͞у. Выражается уравнением
3 Гиперболическая связь Равным различиям (приростам) х соответствуют постепенно уменьшающиеся изменения .Выражается уравнением
4 Логарифмическая связь. Равным различиям х соответствуют постепенно изменяющиеся изменения , но не имеет предела. Выражается уравнением
Многие формы связи хорошо отражаются математической формулой степенного уравнения
у=axb.Корреляционная зависимость по своему направлению может быть прямой, обратной и знакопеременной.
Прямой будет такая зависимость, когда явление -фактор и явление-результат изменяются в одном направлении, например уровень кормления и продуктивности скота.
Если явление- фактор изменяется в одном направлении, а явление-результат -в противоположным, то такая зависимость считается обратной. Например, при росте продуктивности, как правило, снижается себестоимость продукции.
Все перечисленные формы связей могут выражать прямую и обратную связь, знакопеременную -только параболическая зависимость.
Содержание корреляционной связи - это материальное отношение между х и у либо его отсутствие.
1 Причинная зависимость ͞у от х -важнейшая часть корреляционных связей, когда х - реальный фактор, а ͞у- результат, следствие. Например,
х -доза удобрений, ͞у - урожайность селскохозяйственных культур.
2 Взаимосвязь х с ͞у их равноправное положение в механизме причинной связи: например, между уровнями производительности труда работников и уровнем оплаты 1 чел.-ч труда.
3 Связь между двумя следствиями общей причины.(Приведем пример А.А.Чупрова: в качестве Х -число пожарных команд в городе, ͞У-сумма убытков за год в городе от пожаров. Оба признака являются следствием общей причины-величины города -Z)
4 Случайная корреляция реальной материальной связи между х и ͞у не существует.
5 Множественность причин и следствий - переплетение разных видов и форм связей - основа многофакторной корреляции.
В статистике принято различать следующие варианты зависимостей:
1 Парная корреляция - связь между двумя признаками (результативным и факторным или двумя факторными).
2 Частная корреляция - зависимость между результативным и одним факторным признаком при фиксированном значении других факторных признаков.
3 Множественная корреляция - зависимость результативного и двух и более факторных признаков, включенных в исследование.
Максимальное возможное абсолютное значение коэффициента корреляции r=1,00; минимальное r=0,00.
Общая классификация корреляционных связей
- сильная, или тесная при коэффициенте корреляции r>0,70;
- средняя при 0,50<r<0,69;
- умеренная при 0,30<r<0,49;
- слабая при 0,20<r<0,29;
- очень слабая при r<0,19.
Проранжируем значения уровня бедности со среднедушевыми денежными доходами населения
Таблица 5.1 Вспомогательные данные
Регионы |
уровень бедности ‰ |
среднедушевые денежные доходы населения |
Хi |
Yi |
di |
di2 |
Республика Татарстан |
8 |
17677 |
1 |
13 |
-12 |
144 |
Свердловская область |
10,1 |
10195 |
2 |
1 |
1 |
1 |
Челябинская область |
10,4 |
11055 |
3 |
3 |
0 |
0 |
Республика Башкортостан |
12 |
18158 |
4 |
14 |
-10 |
100 |
Нижегородская область |
12,5 |
12423 |
5 |
5 |
0 |
0 |
Тюменская область |
12,5 |
10885 |
6 |
2 |
4 |
16 |
Пермский край |
13,8 |
19422 |
7 |
15 |
-8 |
64 |
Кировская область |
14,1 |
13385 |
8 |
8 |
0 |
0 |
Оренбургская область |
14,2 |
16358 |
9 |
11 |
-2 |
4 |
Удмуртская Республика |
14,6 |
13398 |
10 |
9 |
1 |
1 |
Самарская область |
15,1 |
12700 |
11 |
6 |
5 |
25 |
Пензенская область |
15,5 |
20279 |
12 |
16 |
-4 |
16 |
Курганская область |
16,8 |
11961 |
13 |
4 |
9 |
81 |
Саратовская область |
16,9 |
12905 |
14 |
7 |
7 |
49 |
Ульяновская область |
17 |
13601 |
15 |
10 |
5 |
25 |
Чувашская Республика |
18,7 |
22128 |
16 |
17 |
-1 |
1 |
Республика Мордовия |
19 |
28049 |
17 |
18 |
-1 |
1 |
Республика Марий Эл |
24,6 |
16714 |
18 |
12 |
6 |
36 |
Итого |
|
|
|
564 |
Выборочный
коэффициент ранговой корреляции
Спирмена находят по формуле:
0,42-связь между уровнем бедности и среднедушевыми денежными доходами умеренная
Для того, чтобы при уровне значимости α проверить нулевую гипотезу Н0:ρГ=0 о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе Н1:ρГ≠0, надо вычислить критическую точку
где tкр(α,к=п-2) - критическая точка двусторонней критической области распределения Стьюдента.tкр(0,05,16)=2,12
Итак, , .Т.к. - нет оснований отвергнуть нулевую гипотезу, ранговая корреляционная связь между качественными признаками не значима
Таблица 5.2 Ранжированная таблиц
Регионы |
Уровень бедности ‰ |
Среднедушевые денежные доходы населения |
Хi |
Yi |
R |
Республика Татарстан |
8 |
17677 |
1 |
13 |
5 |
Свердловская область |
10,1 |
10195 |
2 |
1 |
16 |
Челябинская область |
10,4 |
11055 |
3 |
3 |
14 |
Республика Башкортостан |
12 |
18158 |
4 |
14 |
4 |
Нижегородская область |
12,5 |
12423 |
5 |
5 |
11 |
Тюменская область |
12,5 |
10885 |
6 |
2 |
12 |
Пермский край |
13,8 |
19422 |
7 |
15 |
3 |
Кировская область |
14,1 |
13385 |
8 |
8 |
7 |
Оренбургская область |
14,2 |
16358 |
9 |
11 |
4 |
Удмуртская Республика |
14,6 |
13398 |
10 |
9 |
5 |
Самарская область |
15,1 |
12700 |
11 |
6 |
6 |
Пензенская область |
15,5 |
20279 |
12 |
16 |
2 |
Курганская область |
16,8 |
11961 |
13 |
4 |
5 |
Саратовская область |
16,9 |
12905 |
14 |
7 |
4 |
Ульяновская область |
17 |
13601 |
15 |
10 |
3 |
Чувашская Республика |
18,7 |
22128 |
16 |
17 |
1 |
Республика Мордовия |
19 |
28049 |
17 |
18 |
0 |
Республика Марий Эл |
24,6 |
16714 |
18 |
12 |
0 |
Итого |
|
|
102 |
Выборочный коэффициент ранговой корреляции Кендалла находят по формуле:
0,33-связь между уровнем бедности и среднедушевыми денежными доходами умеренная
Для того, чтобы при уровне значимости α проверить нулевую гипотезу Н0:τГ=0 о равенстве нулю генерального коэффициента ранговой корреляции Кендалла при конкурирующей гипотезе Н1:τГ≠0, надо вычислить критическую точку
где zкр - критическая точка двусторонней критической области, которую находят по таблице функции Лапласа по равенству Ф(zкр)=(1 - α)/2.
Ф(zкр)=(1 -0 ,05)/2=0,475
Итак, .Т.к. - нет оснований отвергнуть нулевую гипотезу, ранговая корреляционная связь между качественными признаками не значима.БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Елисеева, И.И. Статистика. [Текст]:учебник/И.И.Елисеева.-М.: Высшее образование,2011.-565с.
2. Елисеева, И.И., Юзбашев, М.М. Общая теория статистики. [Текст]:учебник/И.И.Елисеева, М.М.Юзбашев.-М.: Финансы и статистика,2012.-655с.
3. Рафикова Н.Т. Основы статистики. [Текст]:учебник/ Рафикова Н.Т.-М.: Финансы и статистика,2005.-352 с.
4. Харченко Л.П., Долженкова В.Г., Ионин В.Г. Статистика. [Текст]:учебник/ Харченко Л.П., Долженкова В.Г., Ионин В.Г.-М.:ИНФРА-М,2006.-384с.
5. Официальный сайт Росстата [Электронный ресурс]: Режим открытого доступа www.gks.ru.