ИЗУЧЕНИЕ ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ОПТИМИЗАЦИИ КОЭФФИЦИЕНТА ЭФФЕКТИВНОСТИ ИСПОЛЬЗОВАНИЯ ЭНЕРГИИ ЦЕНТРА ОБРАБОТКИ ДАННЫХ - Студенческий научный форум

X Международная студенческая научная конференция Студенческий научный форум - 2018

ИЗУЧЕНИЕ ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ОПТИМИЗАЦИИ КОЭФФИЦИЕНТА ЭФФЕКТИВНОСТИ ИСПОЛЬЗОВАНИЯ ЭНЕРГИИ ЦЕНТРА ОБРАБОТКИ ДАННЫХ

Степанов К.А. 1, Ворожцов А.С. 1
1МТУСИ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
В статье проводится исследование возможности использования нейронных сетей для оптимизации коэффициента эффективности использования энергии центра обработки данных, который характеризует общую энергетическую эффективность оборудования центра обработки данных. Описано создание нейронной сети и проведен анализ ее работы. Статья выполнена в рамках курсового проекта по дисциплине «Machine learning. Обучающиеся технические системы». Анализ предметной области

Применение алгоритмов машинного обучения для обработки существующих данных, получаемых при мониторинге IT- и вспомогательной инфраструктуры серверной фермы, дает возможность добиться значительного улучшения эффективности работы центров обработки данных. Особенно в области оптимизации PUE (Power Usage Effectiveness) коэффициента эффективности использования энергии. Тысячи датчиков внутри типичного сверхбольшого центра обработки данных генерируют огромное множество данных каждую секунду. В настоящее время эти данные довольно редко используются для решения задач, отличных от мониторинга различных элементов инфраструктуры дата-центра. Достижения в области повышения вычислительной мощности и улучшение функциональных возможностей систем мониторинга создают большие возможности для применения агрегируемой информации при машинном обучении с целью повышения эффективности ЦОД. В настоящее время работа центров обработки данных требует огромное количество электроэнергии. В результате поиска способов снизить энергозатраты, владельцы центров обработки данных пришли к использованию нейронных сетей для оптимизации работы вычислительной инфраструктуры [1].

Но не так давно выяснилось, что при приближении к нулевому PUE отдача от инвестиций в повышение энергоэффективности ЦОД снижается. На представленном ниже графике это проиллюстрировано наглядно. На графике показана динамика коэффициента эффективности использования энергии в дата-центрах Google в разрезе последних пяти лет (рассматриваемый показатель снизился с 1.21 в 2008 году до 1.12 в 2013 году).

Рис 1 Динамика коэффициента эффективности использования энергии

в дата-центрах Google[1]

Эксперты Google утверждают, что активная работа с искусственными нейронными сетями позволит поисковому гиганту рационализировать расходование инвестиций на повышение энергоэффективности ЦОД и шагнуть в эру PUE < 1.10 [1].

Объем данных, генерируемых массивами механического и электроэнергетического оборудования внутри мощных дата-центров, а также сложные корреляции между подобными устройствами, затрудняют использование обычных инженерных формул для прогнозирования энергоэффективности дата-центра.

Искусственные нейронные сети идеально подходят для создания моделей, которые позволяют с легкостью прогнозировать различные исходы сложных взаимодействий физических систем внутри дата-центра. Все потому, что они могут вести поиск шаблонов в массивах данных и корреляциях между системами, не требуя предварительного определения этих бесчисленных корреляций.

Эти модели могут использоваться для точного прогнозирования PUE дата-центра(ов) и для автоматического определения проблем возникающих, если ЦОД слишком сильно отклоняется от прогнозной модели. Данная концепция позволяет выявить возможности для дальнейшего энергосбережения и протестировать новые конфигурации для повышения эффективности дата-центра[2].

Массив данных, используемых искусственными нейронными сетями при предиктивном моделировании PUE в рамках созданного алгоритма, включает в себя 19 различных переменных, полный перечень которых приведен в таблице ниже.

Таблица 1 Набор данных для реализации алгоритма

1

Общая IT-нагрузка на серверы [кВт]

2

Общая IT-нагрузка на сетевое оборудование [кВт]

3

Общее количество работающих насосов в системе обработки воды (Process Water Pump; PWP)

4

Средняя частота вращения электропривода с частотным регулированием (Variable Frequency Drive; VFD) в PWP [%]

5

Общее количество работающих насосов конденсаторной воды (Condenser Water Pump; CWP)

6

Средняя частота вращения VFD в CWP [%]

7

Общее количество работающих градирен

8

Средняя температура воды на выходе из градирен (Leaving Water Temperature; LWT) [в градусах по Фаренгейту]

9

Общее количество работающих чиллеров

10

Общее количество работающих сухих (поверхностных) воздухоохладителей

11

Общее количество работающих нагнетательных насосов для впрыска охлажденной воды

12

Среднее заданная температура воды в нагнетательных насосах для впрыска охлажденной воды [в градусах по Фаренгейту]

13

Средний перепад температуры на концах теплообменника [в градусах по Фаренгейту]

14

Температура наружного воздуха по влажному термометру (Wet Bulb; WB) [в градусах по Фаренгейту]

15

Температура наружного воздуха по сухому термометру (Dry Bulb; DB) [в градусах по Фаренгейту]

16

Энтальпия наружного воздуха (кДж / кг)

17

Относительная влажность наружного воздуха (Relative Humidity; RH) [%]

18

Скорость ветра за пределами здания [миль / ч]

19

Направление ветра за пределами здания [град]

Таким образом необходимо реализовать нейронную сеть, способную спрогнозировать значение коэффициента эффективности потребления энергии PUE.

Постановка задачи

Задача заключается в разработке нейронной сети способной спрогнозировать значение коэффициента эффективности потребления энергии PUE центра обработки данных на основе статистических данных. На вход нейросети в виде массива будут подаваться показатели различных датчиков, отслеживающих состояние стоек и окружающей среды.

Для обучения нейронной сети был сгенерирован предполагаемый набор данных, который состоит из 100 наборов 19 параметров. Пример входных данных изображен на рисунке 1.

Рис 2 Пример входных данных

Создание нейронной сети

Для обучения нейронной сети выделим из 100 наборов 80%, остальные 20% будут использованы для нужд тестирования. Обучение сети производилось в программном комплексе Octave 4.2.1.

Далее необходимо выбрать архитектуру нейронную сети. Данный процесс осуществляется эмпирическим путем. В рассматриваемой задачи используем 1 скрытый слой, а нейронная сеть – прямого распространения (персептрон) с обучением по алгоритму обратного распространения ошибки. Как показал эксперимент наибольшей точностью обладает нейросеть с конфигурацией 19-22-1, где 19 нейронов во входном слое, 22 в скрытом слое и 1 в выходном слое.

Перед началом обучения нейронной сети необходимо сгенерировать случайным образом значение её весов. Данная операция выполняется случайным образов в диапазоне [−𝜀; 𝜀] во избежание проблемы симметричных весов. Таким образом, веса для параметров будут случайно инициализированы значениям –𝜀 ≤Θ𝑖𝑗(𝑙)≤ ε.

𝜀= √6√𝐿𝑜𝑢𝑡+𝐿𝑖𝑛 (1)

где 𝐿𝑖𝑛 и 𝐿𝑜𝑢𝑡 число нейронов во входном и в выходном слоях относительно рассматриваемого тетта. То есть, в решаемой задаче для первого слоя 𝐿𝑖𝑛=400, 𝐿𝑜𝑢𝑡=50, для второго – 𝐿𝑖𝑛=50, 𝐿𝑜𝑢𝑡=2. Для определения непосредственно весов, используется следующая формула:

𝑊=𝑟𝑎𝑛𝑑(𝐿𝑜𝑢𝑡,1+𝐿𝑖𝑛)×2×𝜀−𝜀 (2)

где 𝑟𝑎𝑛𝑑– функция генерации случайных чисел в диапазоне от 0 до 1[3].

После обучения была получена зависимость, изображенная на рисунке 2.

Рис 3 Гистограмма распределения ошибки

По полученной гистограмме можно сделать вывод, что ошибка сети подчиняется нормальному закону распределения, т.е. можно разделить размер ошибки на 3 области (для упрощения распределение считается нормализованным):

±σ1 (область 1 сигма — величина ошибки в 68% процентах прогнозов находится в данном диапазоне);±σ2 (область 2 сигма — величина ошибки в 95% процентах прогнозов находится в данном диапазоне);±σ3 (область 3 сигма — грубые ошибки, промахи, менее чем в 5% процентах случаев, величина ошибки больше, чем в области ±σ2).

Ошибка для области σ1 составила 0.017, а для области σ2 – 0.032.

Причина грубых ошибок (промахов) в области ±σ3 – это работа сети с данными сильно отличающимися от тех, которые присутствовали в обучающей выборке.

Также важным показателем качества обучения нейронной сети является величина средней абсолютной ошибки.

Величина средней абсолютной ошибки составила 0.014.

Ниже представлен график зависимости коэффициента потребляемой мощности и величины абсолютной ошибки:

Рис 4 Зависимость коэффициента потребляемой мощности и величины абсолютной ошибки

Нейронные сети имеют способность к обобщению информации, т.е. способны давать прогноз, в том числе основываясь на данных с которыми сеть не работала до данного момента, используя закономерности обучающей выборки, но в данном случае не смотря на такую особенность сети следует помнить, что предположительный результат может сильно отличаться от фактического[4].

Заключение

В работе были изучены возможности применения нейронных сетей, для прогнозирования коэффициента эффективности использования энергии центра обработки данных, а также была создана нейронная сеть, обеспечивающая прогнозирование коэффициента потребляемой мощности центра обработки данных на основе 19 входных параметров.

Применение нейронной сети позволит спрогнозировать энергопотребление центра обработки данных при изменении различных параметров как самих серверных стоек, так и окружающей среды.

Список используемой литературы и источников:
  1. Система прогнозирования на базе нейронных сетей в промышленности - https://habrahabr.ru/post/171019/ 17 декабря 2013 г.

  2. Ирина Чучуева Создаем нейронную сеть для прогнозирования временного ряда - http://www.mbureau.ru/comment/465 1 декабря 2012 г.

  3. Andrew Ng Machine Learning Курс Стенфордского университета 2017г.- https://www.coursera.org/learn/machinelearning

  4. Ирина Чучуева Модели прогнозирования: нейронные сети - http://www.mbureau.ru/blog/modeli-prognozirovaniya-neyronnye-seti 29 апреля 2014 г.

Просмотров работы: 217