АНАЛИЗ И ИССЛЕДОВАНИЕ МЕТОДОВ АНАЛИЗА СООБЩЕНИЙ ПОЛЬЗОВАТЕЛЯ С ЦЕЛЬЮ ВЫЯВЛЕНИЯ ПРОТИВОРЕЧАЩИХ ФАКТОВ - Студенческий научный форум

IX Международная студенческая научная конференция Студенческий научный форум - 2017

АНАЛИЗ И ИССЛЕДОВАНИЕ МЕТОДОВ АНАЛИЗА СООБЩЕНИЙ ПОЛЬЗОВАТЕЛЯ С ЦЕЛЬЮ ВЫЯВЛЕНИЯ ПРОТИВОРЕЧАЩИХ ФАКТОВ

Нестерова Н.А. 1, Макушкина Л.А. 1
1Волжский политехнический институт (филиал) ФГБОУ ВПО "Волгоградский государственный технический университет"
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Введение

Достаточно объемная часть информационных ресурсов общества уровня развития, распологающихся в компьютерных сетях, представлена в виде текстов на естественно-языке (ЕЯ-текстами). Так как на сегодняшний момент можно наблюдать стремительный рост объемов информации данного типа все большую актуальность получают задачи автоматической обработки текстов (АОТ) на естественном языке, которые затрагивают обширный перечень практических приложений, которые представлены задачами получения знаний из текстов (Text Mining), задачами выполнения автоматической классификации и кластеризации текстовых документов, автоматического индексирования и реферирования, задачами семантического поиска, а также множеством задач подобного типа.

Целью данной работы является: повышение эффективности выявления противоречий в текстовых документах за счет анализа сообщений пользователя и построения семантической сети.

Чтобы достигнуть поставленную цель были решены следующие исследовательские задачи:

  • - Проведен анализ и исследование методов анализа сообщений пользователя с целью выявления противоречащих фактов.

  • - Составлено математическое описание системы анализа сообщений пользователя с целью выявления противоречащих фактов.

  • - Выполнена программную реализацию системы анализа сообщений пользователя с целью выявления противоречащих фактов.

  • - Проверена эффективность реализованных алгоритмов системы анализа сообщений пользователя с целью выявления противоречащих фактов.

Исследование методов анализа сообщений пользователя с целью выявления противоречащих фактов

В начале исследования были проанализированы следующие методы анализа текста: Интент-анализ, Контент-анализ, Фоносемантический анализ, Дискурс-анализ, Нарративный анализ, Экспертная оценка текста, Графематический анализ, Морфологический анализ, Синтаксический анализ и Семантический анализ.

Каждый из рассмотренных методов обладает своими достоинствами и недостатками и может использоваться для выполнения анализа текста для различных целей.

Важным моментом, объединяющим все рассмотренные методики анализа текста, является тот факт, что в их основе находится представление о единице анализа. Но вне зависимости от типа методики анализа текста ко всем единицам анализа предъявляются два ключевых требования, которые обычно достаточно трудно совместить на практике: единицы контент-анализа должны быть однозначно опознаны в тексте и одновременно с этим должны быть значимы для последующей интерпретации.

Был выбран семантический анализ текста, т.к. данный метод, направлен на создание семантической структуры каждого предложения, которая состоит из семантических узлов и семантических отношений. Основой для формулирования гипотез о составе семантических узлов является информация, которая получена в результате выполнения синтаксического анализа текста. Результаты анализа обычно представлен в виде семантического графа, которой строится из ряда этапов (выполнение инициализации семантических узлов и синтаксических вариан­тов фрагментов текста, выполнение построения множества сло­варных интерпретаций узлов, выполнение построения групп времени, выполнение построения узлов в кавычках и т. д.).

Также был выполнен анализ встречающихся типов противоречий. Первый тип противоречий – противоречия в понятиях, т.е. в сообщении присутствуем само понятие и его отрицание в явной или неявной форме. Второй тип противоречий – противоречия в предикатах, т.е. формулировка названий функций, выполняемых каким-либо субъектом или объектом противоречит имеющимся законам (физическим или гражданским). В результате анализа типов противоречий было выявлена необходимость задания четких правил классификации и выявления противоречий для корректного функционирования системы.

Заключение.

По выбранной тематике были проанализированы виды семантического анализа, анализ их применения в системах работы с текстом, также был выполнен анализ типов противоречий, которые могут быть обнаружены в тексте.

Библиографический список

  1. Андреев А.М., Березкин Д.В., Симаков К.В. Особенности проектирования модели и онтологии предметной области для поиска противоречий в правовых электронных библиотеках [Электронный ресурс] - 2013 - http://www.inteltec.ru /publish/ articles/textan/RCDL2004.shtml

  2. Рыбанов А.А. Метод адаптивного тестового контроля знаний на основе поиска по деформируемому симплексу// ОТКРЫТОЕ ОБРАЗОВАНИЕ Издательство: Российский экономический университет имени Г.В. Плеханова (Москва) ISSN: 1818-4243eISSN: 2079-5939 Номер: 3 Год: 2008 Страницы: 31-36

Просмотров работы: 484