Объём научно-технической информации представленной в электронном виде растёт с каждым днём. За несколько лет его количество становиться настолько большим, что возникают трудности с поиском нужного материала. Происходит процесс обесценивания информации за счёт большого объёма при поиске. Поисковые системы в сети интернет выдают материал разного рода, основываясь только по вводным словам в строке поиска. Следовательно, множество результатов данного поиска являются не приемлемыми. Узнать, подходит ли найденный материал, - это не малый объём времени и сил, здесь и появляется необходимость в наличии аннотации к любому текстовому материалу. Аннотации присутствуют не у каждого научно-технического материала, и поэтому автоматизированная система аннотирования документов является очень актуальным решением данной проблемы.
Постановка задачи
Для достижения поставленной цели были решены следующие исследовательские задачи:
Провести анализ современных подходов и методов, применяющихся при решении задачи автоматического аннотирования текста.
Разработать метод формализованного описания структуры научно- технического текста на русском языке, позволяющий автоматизировать процесс аннотирования
Разработать алгоритм определения функциональных отношений между фрагментами текста.
Разработать алгоритм построения структуры на основе множества функциональных отношений между фрагментами текста.
Реализовать систему автоматического аннотирования текста на основе разработанных алгоритмов и провести оценку эффективности разработанных методов и алгоритмов.
Заключение
Создание новых более эффективных алгоритмов и методов, существующих на данный момент, является актуальной задачей. Полученные алгоритмы должны учитывать иерархическую природу текста и его нелинейность. Итогом работы системы будет являться текст, представляющий собой сжатое изложение на русском языке исходного документа.
Библиографический список
Малюкова О.И., Свиридова О.В. Исследование и разработка алгоритмов информационной системы обработки статистических данных для медико-коммерческих фирм // Современная техника и технологии. 2016. № 10 [Электронный ресурс]. URL: http://technology.snauka.ru/2016/10/10774 (дата обращения: 03.01.2017).
Шохина Н.В., Свиридова О.В. Исследование и разработка алгоритмов автоматизированного формирования сопутствующей документации при использовании производственных ресурсов //NovaInfo.Ru (Электронный журнал.) – 2017 г. – № 58; [Электронный ресурс]. URL: http://novainfo.ru/article/10840 (дата обращения: 03.01.2017).
Яцко В.А. // Алгоритмы и программы автоматической обработки текста // Вестник ИГЛУ №1 (17) , 2012. [Электронный ресурс]. URL: http://cyberleninka.ru/article/n/algoritmy-i-programmy-avtomaticheskoy-obrabotki-teksta