МОДЕЛЬ ДЕШИФРОВКИ ИСТОРИЧЕСКИХ РУКОПИСНЫХ ДОКУМЕНТОВ - Студенческий научный форум

VIII Международная студенческая научная конференция Студенческий научный форум - 2016

МОДЕЛЬ ДЕШИФРОВКИ ИСТОРИЧЕСКИХ РУКОПИСНЫХ ДОКУМЕНТОВ

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Автоматизированное анализ рукописных текстов востребован в разных сферах деятельности человека. Существует не малое количество различных исследований в этой области, направленных на решение этой задачи. В свой статье я приводу пример математической модели дешифровки исторических рукописных документов, которая лежит в основе многих разработок. Распознавание различных текстов проводится на базе полученной информации о символе, а также оперяясь на информацию, полученную из текстов самого автора.

Обозначим через последовательность рукописных символов. Довольно часто рукописные символы распознаются неоднозначно. Для символа обозначим через множество его возможных распознаваний. Каждому опознанному символу определяются его возможные трактовки . Тогда распознанный текст примет вид . Нужно вычислить такой набор индексов, чтобы вероятность верного распознавания была максимальной.

, где максимум берется по всем , ... ,.

Используя формулы умножения вероятностей она равна:

(1)

Оценим вероятность . Оценка сомножителя формулы (1)

при выглядит таким образом:

(2)

Для , оценка вероятности облегчается. Полученное уравнение представляет собой обыкновенное дифференциальное нелинейное уравнение второго порядка. Оно может быть решено при помощи численных методов. Однако встроенные функции решения дифференциальных уравнений, входящие в такие общеизвестные математические пакеты программ как MatCAD, MatLAB и Maple, не позволяют решать уравнения данного типа, а возможности программирования, например в MatCAD, достаточно ограничены. Первое слагаемое формулы (2) просчитывает точность опознания рукописного символа. Второе слагаемое формулы (2) просчитывает насколько данный фрагмент текста, принадлежит данному автору. Коэффициент определяется в зависимости от качества данного рукописного текста.

Задача первого слагаемого формулы (2) заключается в расчете точности распознавания символа данного рукописного текста. Точность распознавания символа рассчитывается по формуле, где - интервал между текущем символом и эталонном класса. Т.е. среди всех классов символов, используемых при записи этих рукописных текстов, нужно найти те, интервал между которыми минимален. Для вычисления данного интервала необходимо знать коэффициенты и , которые определяются исходя из системы уравнений (3)

(3)

где — интервал, при котором возникает первое вхождение символа не схожего с текущим, — интервал, при котором вошли все символы из этого класса, схожие с текущим. При данном значении высоты капли ее форма, в отсутствие внешнего магнитного поля, может считаться равновесной, при дальнейшем увеличении высоты капли, баланс сил действующих на каплю резко нарушается, что выражается в быстром изменении ее формы и отрыве верхней части капли.

Для дальнейших вычислений используется словарь программной системы Smalt. В базе данных, которой находится порядка ста тысяч слов.

Список литературы:

  1. Вдовин В.А., Муравьёв А.В., Метод адаптивной бинаризации растрового изображения. М: изд-во «Москва» 2012 - №4 с 110-124.

  2. Yanovskiy A. A., Simonovsky A. Ya., Kholopov V. L., Chuenkova I. Yu. Heat Transfer in Boiling Magnetic Fluid in a Magnetic Field // Solid State Phenomena. № 233-234. 2015. p.339-343.

  3. Yanovskii A.A., Simonovskii A.Ya., Klimenko E.M. On the Influence of the Magnetic Field upon Hydrogasdynamic Processes in a Boiling Magnetic Fluid // Surface Engineering and Applied Electrochemistry. – 2014. – Vol. 50, No. 3, pp. 260–266.

  4. Рабочая тетрадь «Математическая логика и теория алгоритмов» (учебное пособие) / Гулай Т.А., Мелешко С.В., Невидомская И.А., Яновский А.А. // Международный журнал прикладных и фундаментальных исследований. 2014. №8-2. С. 169.

  5. Яновский А.А., Симоновский А.Я., Савченко П.И. моделирование гидрогазодинамических процессов в кипящей магнитной жидкости // Информационные системы и технологии как фактор развития экономики региона: сб. науч. трудов: Ставрополь. 2013. С. 159-163.

  6. Яновский А.А. Управление теплообменными процессами при кипении магнитной жидкости на неограниченной поверхности при помощи магнитного поля/ Яновский А.А., Симоновский А.Я. // Физическое образование в вузах, 2012, Т.18, №1 С. 35-36

  7. Яновский А.А., Симоновский А.Я. Математическое моделирование формы пузырька пара в кипящей магнитной жидкости // Научно-практическая конференция «Финансово-экономические и учетно-аналитические проблемы развития региона»/ Ставрополь, 2013. С. 490-493

  8. Яновский А.А. Тепло- и массоперенос поле в кипящей магнитной жидкости в однородном магнитном поле / Яновский А.А., Симоновский А.Я., Чуенкова И.Ю. // Труды XI Международной конференции «Перспективные технологии, оборудование и аналитические системы для материаловедения и наноматериалов». 2014. Ч.1. Курск. С. 252-257.

  9. Яновский А.А. К вопросу о теплообмене в кипящей магнитной жидкости / Яновский А.А., Симоновский А.Я., Холопов В.Л. // В сборнике: ХI Всероссийский съезд по фундаментальным проблемам теоретической и прикладной механики сборник докладов. Составители: Д.Ю. Ахметов, А.Н. Герасимов, Ш.М. Хайдаров. 2015. С. 4336-4338.

  10. Яновский А.А., Спасибов А.С. Математическое моделирование процессов в кипящих намагничивающихся средах // Современные наукоемкие технологии. 2014.№5-2. С. 183-186.

Просмотров работы: 531