ПРИМЕНЕНИЕ АЛГОРИТМА ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ ДЛЯ КЛАССИФИКАЦИИ СОСТОЯНИЯ СТРУКТУРЫ СЕНСОРНОЙ СЕТИ - Студенческий научный форум

IX Международная студенческая научная конференция Студенческий научный форум - 2017

ПРИМЕНЕНИЕ АЛГОРИТМА ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ ДЛЯ КЛАССИФИКАЦИИ СОСТОЯНИЯ СТРУКТУРЫ СЕНСОРНОЙ СЕТИ

Объедков Н.Ю. 1, Турута Е.Н. 1, Воронова Л.И. 1
1МТУСИ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
В статье рассматривается вариант применения алгоритма машинного обучения для оценки состояния структуры сенсорной сети и приводится результат данного исследования на примере обучающего набора входных данных. Статья выполнена в рамках курсового проекта по дисциплине «Machine Learning. Обучающиеся технические системы».

Исследование функционирования сенсорной сети в сочетании с алгоритмами машинного обучения является одним из перспективных направлений в области информационных технологий.

Оценка состояния структуры сенсорной сети является важной задачей для формирования корректного представления о функционировании сенсорной сети на основе информации от датчиков. В условиях, когда возможны отказы узлов, данную задачу лучше всего исследовать алгоритмами бинарной классификации, одним из которых является алгоритм логистической регрессии.

Описание сенсорной сети

Сенсорная сеть – это распределенная сеть необслуживаемых электронных устройств (узлов сети), обменивающихся информацией по беспроводной связи и способных регистрировать данные о параметрах состояния окружающей среды (температура, влажность и т.д.) и передавать их на базовую станцию с помощью ретрансляции от узла к узлу[1]. Сенсорная сеть применяется в самых разных различных областях[2]:

  • мониторинг окружающей среды;

  • безопасность и оборона;

  • здравоохранение;

  • контроль грузопотоков;

  • мониторинг транспортных магистралей;

Узел сети, называемый сенсором, содержит датчик, воспринимающий данные от внешней среды, микроконтроллер, память, радиопередатчик, автономный источник питания. Под отказом узла понимается событие, приводящее к невозможности передачи через него информации с входящих каналов на исходящие.

Описание работы алгоритма логистической регрессии

Логистическая регрессия — это статистическая модель, используемая для предсказания вероятности возникновения того или иного события[3]. Последовательность работы данного алгоритма в упрощенном виде состоит из следующих этапов:

  1. Инициализация переменных.

  2. Вычисление функции стоимости.

  3. Применение алгоритма градиентного спуска с использованием параметра регуляризации.

  4. Построение границы решений.

Рассмотрим более подробно данный алгоритм машинного обучения[4]. Во всех задачах бинарной классификации переменная y, которую мы пытаемся предсказать, принимает два дискретных значения: 0 либо 1:

 

(1)

Функция гипотезы в данном случае должна удовлетворять следующему условию:

 

(2)

Этому условию соответствует функция сигмоиды, которая называется логистической функцией.

 

(3)

(4)

(5)

На рисунке 1 приведен график сигмоиды.

Рис. 1. График функции сигмоиды

Из графика видно, что функция отображает все вещественные числа в интервале (0, 1), что позволяет как нельзя лучше использовать эту функцию для решения задачи бинарной классификации.

Значение функции гипотезы hθ при этом будет равно вероятности того, что результат равен единице.

 

(6)

Для того чтобы получить на выходе дискретные значения, а именно «0» или «1», функцию гипотезы необходимо интерпретировать следующим образом:

 

(7)

(8)

То есть при условии, что аргумент логистической функции больше или равен нулю, значение логистической функции будет больше или равно 0.5 (и наоборот):

 

(9)

А так как аргументом логистической функции будет являться произведение θTx, то получается:

,

(10)

когда

Исходя из вышеописанного, можно утверждать, что:

 

(11)

(12)

Получаем, что границей решений называется линия, которая разделяет зоны, где y = 0 и где y = 1.

Функция стоимости для логистической регрессии имеет следующий вид:

 

(13)

(14)

(15)

На рис. 2. представлены графики функции стоимости логистической регрессии.

Рис. 2 Графики функции стоимости логистической регрессии

При реализации алгоритмов машинного обучения существует проблема переобучения, которая характеризуется высокой дисперсией. Одним из способов решения этой проблемы является применение регуляризации.

Функция стоимости с параметром регуляризации выглядит следующим образом:

 

(16)

Результат исследования

На рисунке 3 представлен пример обучающего набора для задачи классификации состояния части структуры сенсорной сети, которая содержит как исправные, так и неисправные узлы. По осям графика расположены характеристики, по которым определяется исправность/неисправность узла – это время датчика в активном состоянии (ось x, сек) и мощность радиопередатчика (ось y, Вт). Для математического моделирования была использована программа Octave (GUI)[5].

Рис. 3. Часть структуры сенсорной сети с исправными (0) и неисправными (1) узлами

Обладая таким набором входных данных, необходимо определить нелинейную границу решений, разделяющую исправные и неисправные узлы, для того, чтобы в дальнейшем оценить состояние структуры сенсорной сети в целом.

Рис. 4. Нелинейная граница решений для разделения исправных (y = 0) и неисправных (y = 1) узлов части структуры сенсорной сети

С помощью изменения значения параметра регуляризации можно добиться большей точности работы алгоритмы, как следствие, более точной границы решений между работающими и неработающими узлами. В таблице 1 приведены результаты выходного значения y при разных значениях элемента регуляризации λ.

Таблица 1

Результаты эксперимента точности работы алгоритма логистической регрессии при разных значениях λ

λ

y (P), %

0.001

92.631579

0.01

90.526316

0.1

91.578947

1

86.315789

10

67.368421

Заключение

В данной статье рассматривалось применение алгоритма логистической регрессии для классификации состояния сенсорной сети. Был проведен эксперимент в программе Octave (GUI) с примером обучающего набора, для которого была определена нелинейная граница решений для разделения исправных (0) и неисправных (1) узлов части структуры сенсорной сети. Кроме того, была исследована точность алгоритма при различных параметрах регуляризации λ.

Список использованных источников:

  1. Турута Е.Н., Мочалов В.А. Проблемы проектирования отказоустойчивых сенсорных сетей.

  2. Области применения сенсорных сетей

http://www.meshlogic.ru/application.html

  1. Логистическая регрессия

https://ru.wikipedia.org/wiki/Логистическая_регрессия

  1. Онлайн-курс по машинному обучению:

https://www.coursera.org/learn/machine-learning/

  1. Официальный сайт программного обеспечения Octave (GUI): https://www.gnu.org/software/octave

Просмотров работы: 538