Целью данной работы является повышение эффективности восприятия информации пользователем путем выполнения ее структуризации.
Для исследования структурированных массивов информации используется метод анализа фактографических данных, в котором выделены шесть различных задач, такие как: классификация, регрессия, кластеризация, выявление ассоциаций, выявление последовательностей, прогнозирование.
В настоящее время существует множество методов, с помощью которых решаются задачи классификации и кластеризации текстов.
Кластерный анализ занимает одно из центральных мест среди методов анализа данных и представляет собой совокупность методов, подходов и процедур, разработанных для решения проблемы формирования однородных классов в произвольной проблемной области.
Скорость поиска информации вручную обратно-пропорциональна объёму перебираемой информации, а следовательно вероятность качественной обработки большого массива текста человеком мала. В этом случае могут помочь автоматизированные алгоритмы, которые помогут выделить ключевые разделы в предложенном материале, упрощая работу человека и повышая качество восприятия знаний.
В качестве практического применения методов кластерного анализа были рассмотрены следующие системы: rapidminer, IBM SPSS Modeler, Demantra, SAS analytics.
В качестве критериев для выполнения сравнительного анализа перечисленных выше систем были предложены следующие: форматы загружаемых данных, качество сегментации данных, количество методов структуризации, вариация параметров структуризации.
Выполнив анализ рассмотренных систем можно сделать вывод: наилучшим среди аналогов является RapidMiner, так как имеет наибольший спектр реализуемых алгоритмов и лучшее качество кластеризованного материала.
Для повышения качества восприятия материала предполагается выполнить сравнительный анализ основных методов кластеризации и реализовать их в виде алгоритмов автоматизированной системы структуризации текстового материала, с помощью которой и будет выполнен сравнительный анализ.
Список литературы
Оценка качества структурирования учебного материала на основе метрик онтологических моделей Макушкина Л.А., Рыбанов А.А. Актуальные вопросы профессионального образования. 2014. Т. 11. №14 (141). С. 86-89.
Технология определения весовых коэффициентов сложности тем дистанционного курса на основе алгоритма саати рыбанов А.А, Макушкина Л.А. Открытое и дистанционное образование. 2016. №1 (61). С. 69-79.
Аналитическая платформа deductor как средство анализа результатов активности пользователей системы дистанционного обучения moodle Рыбанов А.А., Сержантова Е.О., Макушкина Л.А. Молодой ученый. 2013. № 5. С. 173-176.
Форматы и системы команд, методы адресации. Квантованный учебный текст с заданиями в тестовой форме Рыбанов А.А., Макушкина Л.А. Педагогические измерения. 2015. № 2. С. 50-57.
Алгоритмы работы программы автоматизированных обучаемых систем Макушкина Л.А., Немцова В.С. NovaInfo.Ru. 2015. Т. 2. № 33. С. 44-51.
Анализ существующих технологий smart-обучения Макушкина Л.А., Марьяновский А.В. NovaInfo.Ru. 2016. Т. 3. № 46. С. 54-56.