Корреляционный анализ - метод, позволяющий обнаружить зависимость между несколькими случайными величинами.
Допустим, проводится независимое измерение различных параметров у одного типа объектов. Из этих данных можно получить качественно новую информацию - о взаимосвязи этих параметров.
Например, измеряем рост и вес человека, каждое измерение представлено точкой в двумерном пространстве:
Несмотря на то, что величины носят случайный характер, в общем наблюдается некоторая зависимость - величины коррелируют.
В данном случае это положительная корреляция (при увеличении одного параметра второй тоже увеличивается). Возможны также такие случаи:
Отрицательная корреляция: |
Отсутствие корреляции: |
Взаимосвязь между переменными необходимо охарактеризовать численно, чтобы, например, различать такие случаи:
Для этого вводится коэффициент корреляции. Он рассчитывается следующим образом:
Задается массив из n точек {x1,i, x2,i}.
Рассчитываются средние значения для каждого параметра: .
Рассчитывается коэффициент корреляции: .
r изменяется в пределах от -1 до 1. В данном случае это линейный коэффициент корреляции, он показывает линейную взаимосвязь между x1 и x2: если r равен 1 (или -1), то связь линейная.
Коэффициент r является случайной величиной, поскольку вычисляется из случайных величин. Для него можно выдвигать и проверять следующие гипотезы:
Программная реализация проверки гипотезы о наличии корреляции между случайным величинами:
Рисунок 1. Результат работы програмы.
Список используемой литературы.
1. Ребро И.В. Прикладная математическая статистика (для технических специальностей): учеб. пособие / И.В. Ребро, В.А. Носенко, Н.Н. Короткова; ВПИ (филиал) ВолгГТУ .- Волгоград: ИУНЛ ВолгГТУ, 2011