«ДЕРЕВО» РЕШЕНИЙ И АЛГОРИТМ ЕГО ПОСТРОЕНИЯ - Студенческий научный форум

IX Международная студенческая научная конференция Студенческий научный форум - 2017

«ДЕРЕВО» РЕШЕНИЙ И АЛГОРИТМ ЕГО ПОСТРОЕНИЯ

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
На практике результат одного решения заставляет нас принимать следующее и т.д. Эту последовательность нельзя выразить таблицей доходов, поэтому необходимо использовать другой процесс принятия решений, а именно – «дерево» решений.

«Дерево» принятия решений – это своеобразное средство поддержки принятия решений при прогнозировании, оно широко применяется в статистике и анализе данных. Первые идеи создания деревьев решений относятся к работам Ховленда (Hoveland) и Ханта (Hunt) конца 50-х годов XX века.

Прежде чем говорить о конкретных алгоритмах «дерева» решений, необходимо обратить внимание на основополагающие понятия, связанные с данным методом в целом.

Итак, «дерево» решений, подобно его «прототипу» из живой природы, состоит из «ветвей» и «листьев». Ветви, а иначе ребра графа, хранят в себе значения атрибутов, от которых зависит целевая функция. Листья – хранят запись о значении целевой функции. Существуют также родительский узел (предок) и дочерний узел(потомок), по которым происходит разветвление (Рис. 1).

 

Рис. 1 – «Общий вид «дерева» решений»

 

Цель построения дерева принятия решений – создать модель, по которой можно классифицировать случаи и решать, какие значения может принимать целевая функция, имея на входе несколько переменных.

Например, когда необходимо принять решение о выдаче кредита (целевая функция может принимать значения «да» и «нет») на основе информации о клиенте (несколько переменных: возраст, семейное положение, место работы и т.д.) К примеру, переменная «возраст» с атрибутом «менее 21года = да» сразу приведет от корневого узла дерева к его листу, при этом целевая функция «выдача кредита» примет значение «нет». Если возраст составляет более 21 года, то ветвь приведет нас к очередному узлу, который, к примеру, «спросит» нас о стабильности дохода клиента. Таким образом, классификация каждого нового случая происходит при движении вниз до листа, который и укажет нам значение целевой функции в каждом конкретном случае.

Рассмотрим на данном примере и общий алгоритм построения «дерева» решений. Вначале необходимо выбрать атрибут Q (в нашем случае, допустим: уровень дохода больше 50 000 руб./месяц) и поместить его в корневой узел.

Далее, из тестовых примеров (или набора данных) для каждого значения атрибута i (в нашем случае их два – «да» и «нет») выбираем только те, для которых Q=i. В конечном итоге мы рекурсивно строим «дерево» принятия решений.

На данный момент существует большое количество частных алгоритмов, которые помогают в реализации «дерева» решений CART, C4.5, NewId, ITrule, ID3, CN2 и т.д. Но наибольшее распространение и популярность получили только два:

  • CART (ClassificationandRegressionTree) – это алгоритм построения бинарного «дерева» решений – дихотомической классификационной модели. Каждый узел дерева при разбиении имеет только два дочерних узла. Данный алгоритм решает задачи регрессии и классификации.

  • C4.5 – это алгоритм построения «дерева» решений, количество дочерних узлов здесь не ограничено. Решает только задачи классификации, так как не умеет работать с непрерывным целевым полем.

Большинство из перечисленных выше алгоритмов являются «жадными алгоритмами». То есть, если один раз был выбран атрибут, по которому было произведено разбиение на подмножества, то такой алгоритм не может вернуться назад и выбрать иной атрибут, который дал бы лучшее разбиение.

Таким образом, «дерево» решений – основной и наиболее популярный метод, при помощи которого можно найти оптимальное решение. Действительно, построение «дерева» решений позволяет наглядно продемонстрировать структуру данных и создать работающую модель классификации данных, какими бы громоздкими они не были.

Список литературы

  1. Долгополова А. Ф., Гулай Т. А., Литвин Д.Б .Финансовая математика в инвестиционном проектировании (учебное пособие) // Международный журнал прикладных и фундаментальных исследований. 2014. № 8–2. С. 178–179.

  2. Гулай Т. А., Невидомская И. А., Мелешко С. В. Анализ и оценка приоритетности разделов дисциплины «Математический анализ» изучаемой студентами инженерных направлений // European Social Science Journal. 2013. № 8–2 (35). С. 109–115.

  3. Литвин Д. Б., Гулай Т. А., Долгополова А. Ф. Применение операционного исчисления в моделировании экономических систем // Аграрная наука, творчество, рост. 2013. С. 263–265.

  4. Гулай Т. А., Долгополова А. Ф., Литвин Д. Б. Государственное регулирование в системе агробизнеса // Учетно-аналитические и финансово-экономические проблемы развития региона : Ежегодная 76-я науч.-практ. конф. "Аграрная наука - Северо-Кавказскому региону". СтГАУ. 2012. С. 202–207.

  5. Смирнова Н. Б., Попова С. В. Использование понятий функции и предела в социально-экономической области человеческой деятельности // Культура и общество: история и современность : материалы III Всероссийской (с международным участием) науч.-практ. конф. Филиал Российского государственного социального университета в г. Ставрополь; под редакцией: О. Ю. Колосовой, Т. В. Вергун, Р. Ф. Гударенко. 2014. С. 181–185.

  6. Немцова А. В., Попова С. В. Применение средств матричной алгебры для решения задач экономического содержания // Современные наукоемкие технологии. 2014. № 5–2. С. 171–172.

Просмотров работы: 288