РАСПОЗНАВАНИЕ РЕЧЕВЫХ СООБЩЕНИЙ

Пекшев Ю.А. 1, Короткова Н.Н. 1

1Волжский политехнический институт (филиал) ФГБОУ ВПО "Волгоградский государственный технический университет"

Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

На сегодняшний день под определением распознавания речи скрывается целая сфера научной и инженерной деятельности. В общем, каждая задача распознавания речи сводится к тому, чтобы выделить, классифицировать и соответствующим образом отреагировать на человеческую речь из входного звукового потока.

Уровень современных аппаратных средств дает возможность реализации распознавания речи в реальном масштабе времени на обычном компьютере. Учитывая это, проблема повышения качества работы существующих подходов к идентификации речи обуславливает актуальность данной работы.

Целью работы является разработка математической модели идентификации голосового сообщения по фонемной составляющей, а также разработка комплекса программ, реализующего данную модель и позволяющего её тестировать. Для достижения цели необходимо выполнить следующие задачи:

1) Разработка математической модели идентификации голосового сообщения по фонемной составляющей и индивидуальным характеристикам голоса;

2) Программная реализация разработанной модели идентификации голосового сообщения;

3) Оценка разработанного модуля идентификации голосового сообщения.

В работе по методу Саати был проведен сравнительный анализ следующих Web–ресурсов: Google.ru(4,63), Speechpad.ru(3,27), Speech-to-text-online.com(3,63), August4u.net/?speech2text(2,89), Vorabota.ru/voice.html (2,92). Сравнительный анализ Web-ресурсов проводился по таким критериям, как: точность идентификации звуков, количество неправильно распознанных звуков при вводе длинных сообщений, скорость выполнения идентификации, возможность добавления новых слов в словарь, сохранение истории. Результат анализа таков, что только Google.ru имеет значение интегрального показателя качества, превышающий базовое значение. Предлагаемая методика экспертной оценки web-ресурсов позволила количественно оценить их качество с точки зрения уровня реализуемых функций и показала, что во всех Web-ресурсах отсутствует возможность добавления новых слов в словарь.

При разработки системы, направленной на идентификацию речевых сообщений необходимо обратить внимание на функцию добавления новых слов в словарь, которая отсутствует в рассмотренных web–ресурсах. Также, необходимо уделить внимание Вейвлет–преобразованиям, использование которых позволит увеличить точность распознавания фонем.

СПИСОК ЛИТЕРАТУРЫ:

Грачев, А.М. Адаптивные алгоритмы распознавания речевого сигнала / Грачев, А.М. // Вестник Нижегородского государственного лингвистического университета им. Н.А. Добролюбова. 2013. № 22. С. 32-39.
Деркач, С.В. Фонетические свойства гласных в спонтанной речи / Деркач, С.В. // экспериментально-фонетическое исследование на материале американского варианта английского языка. Благовещенск, 2014. С. 70-50.

Просмотров работы: 414

Код для цитирования:

IX Международная студенческая научная конференция Студенческий научный форум - 2017

РАСПОЗНАВАНИЕ РЕЧЕВЫХ СООБЩЕНИЙ

Студенческий научный форум - 2017
IX Международная студенческая научная конференция