ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ РАБОТЫ НЕЗРЯЧИХ И СЛАБОВИДЯЩИХ НА КОМПЬЮТЕРНЫХ УСТРОЙСТВАХ - Студенческий научный форум

VII Международная студенческая научная конференция Студенческий научный форум - 2015

ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ РАБОТЫ НЕЗРЯЧИХ И СЛАБОВИДЯЩИХ НА КОМПЬЮТЕРНЫХ УСТРОЙСТВАХ

Блинова А.А. 1
1Краснодар, Южный институт менеджмента
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Исследование программного обеспечения, описываемого в данной работе, производилось автором с позиции пользователя без зрительного контроля, для которого не возможна работа на компьютерных устройствах путём восприятия отображенной на экране информации с помощью зрения. Исследуемое программное обеспечение обеспечивает функции интерфейса стандартных компьютерных устройств, полностью или частично заменяющие зрительное восприятие информации. Программное обеспечение компьютерных устройств со специальной клавиатурой нами не рассматривалось.

Целями настоящей работы являются: подобрать программное обеспечение, дающее автору возможность обучаться в вузе на юридическом факультете путём активного использования нетбука и смартфона;

предоставить заинтересованным читателям результаты исследования, в частности, – ознакомить незрячих и слабовидящих с возможностью полноценной работы на стандартных компьютерных устройствах.

Для достижения поставленных целей автор сосредоточился на выполнении следующих задач:

– классифицировать тестируемые программы;

– протестировать программы на операционных системах Windows, Android и iOS (программное обеспечение для Linux и других операционных систем не исследовалось, поскольку эти системы не так широко распространены среди пользователей);

– сравнить протестированные программы и определить, какие из них наиболее удобны в использовании.

Для исследования автором был установлен ряд ограничений.

Ограничен выбор устройств для тестирования программ, так как приобретение таких устройств, как iPad и Macbook, автору и большинству пользователей не доступно по цене. Планшеты удобны для работы в виде трансформеров, однако, этот тип устройств тоже дорогой. Hromebook не рассматривался, поскольку работа на этом устройстве требует постоянного подключения к Интернету, что неудобно, устройство дорого стоит, к тому же Hromebook не имеет в России широкого распространения.

Исследовалось только бесплатное программное обеспечение.

Исследовалось только то программное обеспечение, которое поддерживает русский язык, так как автор является русскоязычным пользователем, а работа на компьютерных устройствах с помощью программ без поддержки русского языка, как для автора, так и для большинства пользователей, живущих в России, не удобна.

Тестирование программ производилось на следующих устройствах:

программы экранного доступа – на нетбуке Asus, операционная система (далее – «ОС») Windows 7, 2Гб оперативной памяти;

озвучивающие приложения для Android – на смартфоне Samsung Galaxy GT-S7262, ОС Android 4.1.2;

озвучивающие приложения для iOS и приложения, преобразовывающие аудио-речь – на iPhone 4S, iOS 8.1.2.

Тестируемые программы автор классифицировал следующим образом:

1. Программы экранного доступа.

1.1. Программы для работы на компьютере с ОС Windows.

1.2. Озвучивающие приложения для сенсорных устройств.

1.2.1. Озвучивающие приложения для ОС Android.

1.2.2. Озвучивающее приложение для iOS.

2. Программы, преобразующие речь в текст и в команды системе.

3. Браузерные приложения (тестирование на смартфоне).

В настоящее время существует довольно большое количество программ, позволяющих людям с частичным или полным отсутствием зрения работать на компьютере и различных мобильных устройствах путём преобразования информации, представленной на экране, в аудио-речь. Такие программы именуются программами экранного доступа.

Данные программы также озвучивают некоторые действия пользователя, например, при нажатии клавиш из динамика пользователь слышит название нажатой только что клавиши (эту функцию можно отключить).

Пользование программами экранного доступа предполагает отличное знание клавиатуры, так как взаимодействие пользователя с компьютером с помощью данных программ возможно только посредством клавиатурных команд, компьютерная мышь практически не используется.

Программы для работы на компьютере с ОС Windows

Самыми удобными из программ экранного доступа для Windows для автора являются Jaws и NonVisual Desktop Access (NVDA). Они преобразовывают в аудио-речь наиболее полный объем отображаемой информации и просты во взаимодействии с пользователем.

Jaws поддерживает наибольшее количество интерфейсов других программ, но имеет существенный недостаток: данная программа затрачивает много ресурсов, что приводит к затруднениям её использования при работе в интернете, таким как медленная загрузка страниц, и прекращение озвучивания загруженной страницы.

NVDA не имеет такого недостатка и удобна при работе в Интернете.

К NVDA необходимо устанавливать дополнительный синтезатор речи, так как встроенный синтезатор озвучивает информацию на экране очень неразборчиво. Наиболее благозвучным для автора синтезатором является Caterina, но данный синтезатор не озвучивает текста при печати, что сужает возможности его использования. Вторым по благозвучию русской речи автор считает синтезатор RHVoice, который содержит три голоса диктора: «Александр», «Алёна» и «Ирина». Автор предпочитает голос «Ирина», поскольку непрерывная речь голосов «Александр» и «Алёна» монотонна, и смысл озвучиваемой информации довольно трудно воспринимается. Существует портабельная версия NVDA, которая позволяет запустить данную программу на любом компьютере без установки, открыв файл с флешкарты. Синтезатор портабельной версии RHVoice не имеет голоса диктора «Ирина», поэтому эту версию NVDA не очень удобно использовать для чтения книг.

Программа NVDA имеет функцию озвучивания названия объекта при наведении курсора мыши на него. Эта функция имеет большое значение для пользователей, не обладающих достаточными знаниями управления компьютером с помощью клавиатуры, а так же для пользователей, которые частично используют зрение при работе на компьютере.

Для системы Windows, используемой на нетбуке, существуют программы голосового ввода текста и голосового управления, в том числе и встроенный англоязычный распознаватель речи. Но все эти программы требуют наличие хорошего микрофона, полной тишины при работе с программой и нуждаются в обучении, то есть в составлении программного словаря вручную.

Озвучивающие приложения для сенсорных устройств

Для работы с сенсорными устройствами также существуют приложения, преобразовывающие текст в аудио-речь. Особенностью таких приложений является то, что для обеспечения пользования сенсорными устройствами приспособлен жест двойное касание для активации объекта. То есть пользователь касается экрана, слышит название объекта, которого он коснулся, и при желании его активировать касается два раза любого места экрана.

Еще один облегчающий работу жест – проведение пальцем слева направо и наоборот. При каждом таком жесте приложение произносит название следующего по порядку объекта; и если пользователь желает активировать какой-либо объект, он после произнесения приложением его названия производит двойное касание в любой части экрана. Этот жест позволяет быстрее ознакомиться с отображенной информацией и легче ориентироваться на экране. Кроме этих двух главных жестов, озвучивающие приложения приспосабливают и другие жесты для работы с устройством.

Такие приложения расходуют много энергии – используемые автором модели смартфонов нуждаются в ежедневной полной зарядке.

Озвучивающие приложения для ОС Android

В системах Android есть встроенное приложение Talkback, Оно приспосабливает жестовое управление способами, рассмотренными выше, и имеет англоязычный синтезатор. Для удобства пользования можно установить дополнительный русскоязычный синтезатор. Автор протестировал синтезатор Vocalizer с предлагающимися к нему дикторами. Дикторов для Vocalizer есть несколько, но автору по звучанию больше понравился диктор Katya.

В отличие от Vocalizer приложение SVOX Russian Katja Trial, установленное автором, настолько затормозило работу системы смартфона, что от тестирования возможностей программы пришлось отказаться.

К сожалению, у озвучивающих информацию android-приложений есть весьма существенные недостатки:

– при наборе текста не поддерживается жест двойного касания, и при первом касании символ сразу вводятся;

– во время телефонного разговора невозможно нажать в случае необходимости отображенные на экране кнопки. Например, при звонке в некоторые учреждения нужно взаимодействовать с меню автоответчика, нажимая на кнопки 1, 2, 3..., что невозможно при пользовании озвучивающим приложением.

Озвучивающее приложение для iOS

На устройствах Apple встроено озвучивающее приложение VoiceOver, и предусматривающее использование жестов, и имеющее синтезатор с русскоязычным голосом. Любой пользователь iOS может без труда в любое время и в любом месте нахождения в основных настройках включить VoiceOver, когда, например, находится за рулем или занят делами по дому и хочет в это время почитать книгу.

VoiceOver не имеет тех недостатков, которые наличествуют в озвучивающих приложениях для Android. Поэтому автор предпочитает пользоваться iOS-системой.

Программы, преобразующие речь в текст и в команды системе

Значительно облегчает работу на сенсорных устройствах незрячих и слабовидящих пользователей возможность некоторых приложений преобразовывать аудио-речь в текст и в команды системе.

Для того чтобы ввести текст или задать системе определённую команду, нужно произнести желаемую фразу в микрофон устройства, и произнесённая речь в зависимости от функционала приложения преобразуется в текст или осуществляется заданное устройству действие. Большинство таких приложений оповещает пользователя звуковыми сигналами о том, что можно начинать речь, и об окончании распознавания речи. Это

особенно удобно для того, чтобы узнать о появлении текста в поле ввода или о начале выполнения команды.

Возможность приложений преобразовывать речь пользователя в текст устраняет неудобства, возникающие при наборе текста на экранной клавиатуре, такие как:

– необходимость для пользователя обладать твёрдым знанием расположения букв, цифр и символов на клавиатуре;

– довольно длительная тренировка точного попадания на желаемую букву, цифру или символ (особенно это имеет значение для пользователей системы Android, так как озвучивающее приложение данной системы, как было сказано выше, не обеспечивает жест двойного касания при наборе текста);

– для пользователей системы iOS касание каждого вводимого объекта 3 раза: одно касание для произнесения озвучивающим приложением буквы, цифры или символа, 2 быстрых касания - для его ввода (это затрачивает много времени и довольно утомительно).

Между тем, все преобразующие речь приложения работают только с подключением к Интернету. Автор считает это недостатком, поскольку без подключения к Интернету пользователь лишается возможности написать заметку путем диктовки текста, управлять устройством голосом, причём при постоянном использовании таких приложений утрачиваются навыки ввода текста и управления устройством вручную.

Тестирование приложений, преобразующих речь для ОС Android, не удалось произвести по причине технического сбоя смартфона и нехватки в рамках исследования времени для его починки.

Приложения голосового ввода текста для iOS

В смартфоны с ОС iOS встроена функция голосового ввода текста. При отображении клавиатуры на экране в любом приложении возле пробела есть кнопка «Диктовать».

Плюсы программного обеспечения данной функции: наличие оповещающих звуковых сигналов и возможность диктовать текст при отображении клавиатуры в любом приложении.

При тестировании автор выявил следующие недостатки:

– период времени между окончанием речи пользователя и звуковым сигналом завершения обработки составляет примерно-20-30 секунд, за это время могут быть произнесены случайные реплики находившихся рядом людей, и эти реплики тоже преобразовываются в текст;

– многие пунктуационные знаки не распознаются, например, произнесённые слова «восклицательный знак» не преобразовываются ни в словосочетание, ни в знак пунктуации, в то время как произнесённое слово «запятая» преобразовывается в пунктуационный знак с пробелом после него.

Приложение Dragon Dictation - это приложение, предназначенное для создания записей как с помощью отображенной на экране клавиатуры (с кнопкой «Диктовать»), так и с помощью голосового ввода текста. Для голосового ввода текста есть специальная кнопка «Записать».

Меню Dragon Dictation предоставляет возможность отправить введённый текст по email, СМС-сообщением, копировать и сохранить текст в самом приложении.

При тестировании программы автор выявил следующие положительные моменты: быстрое распознавание речи и отображение введённого текста незамедлительно после остановки речи, а также распознавание всех пунктуационных знаков при произнесении их названия.

Недостатком программы, на взгляд автора, является отсутствие оповещающих звуковых сигналов.

Speech Recogniser – приложение, предназначенное именно для голосового ввода текста, оно не отображает клавиатуру на экране. После голосового ввода отображенный текст можно редактировать с помощью экранной клавиатуры.

Меню Speech Recogniser так же предоставляет возможность отправить введённый текст по email, СМС-сообщением, копировать текст.

При тестировании программы автор выявил следующие положительные моменты: наличие оповещающих звуковых сигналов; возможность выбора стиля, размера и начертания шрифта; возможность перевода введенного текста на другие языки; возможность остановить распознавание речи путём нажатия кнопки «Стоп».

Программа распознаёт помимо речи пользователя и речь озвучивающего приложения VoiceOver Например, после нажатия кнопки голосового ввода на экране появляется текст «Идёт соединение... Прослушивание...». Приложение произносит это сообщение, и распознанный текст начинается с этих слов. Для пользователей VoiceOver это обстоятельство является существенным минусом. Но, если дополнительные функции Speech Recogniser необходимо применить к вводимому тексту, а так же если не требуется немедленного получения текста, можно коснуться кнопки голосового ввода для произнесения её названия озвучивающим приложением, затем жестом двойного касания тремя пальцами отключить синтезатор, при этом жестовое управление остаётся тем же, а озвучивание экрана отключается. После отключения синтезатора сделать два быстрых касания в любой части экрана для нажатия кнопки голосового ввода, произнести текст и включить синтезатор тем же жестом двойного касания тремя пальцами.

Приложения с возможностью голосового управления

Приложения, преобразовывающие речь в команды системе, удобны в особенности для пользователей, которые регулярно работают с большим количеством различных приложений. Голосовое управление позволяет сэкономить время на поиск нужного приложения.

Приложения голосового управления для Android

Приложение Assistent быстро распознаёт команды и выполняет их. Для выполнения некоторых команд Assistent запрашивает подтверждение в виде аудио-вопроса.

Возможно как голосовое управление, так и ввод команд на экранной клавиатуре в предназначенной для этого строке.

Некоторые команды выполняются без выхода из Assistent, например, настройки будильника или выполнение математических операций. Когда заданная команда требует запуска другого приложения, допустим, команда «Открой сообщения1», происходит выход из Assistent, и Assistent таким образом завершает свою работу. Для задания новой команды нужно заново запустить Assistent.

Данное приложение имеет звуковой сигнал, оповещающий об окончании распознавания речи.

Довольно много команд не распознаётся приложением Assistent.

Приложения голосового управления для iOS

В систему IOS встроено приложение, предназначенное для голосового управления – Speech Interpretation and Recognition Interface (Siri). Задать голосовую команду в этой программе можно после нажатия и удерживания кнопки «Домой». Siri имеет оповещающие звуковые сигналы. Существенным недостатком Siri является отсутствие поддержки русского языка.

Программа Speaktoit Assistent позволяет управлять устройством при помощи диалога, то есть пользователь произносит команду, и приложение даёт ответ на неё, сообщающий или о выполнении команды, или о невозможности её выполнения, или предлагает задать другие команды.

После каждого ответа приложения на команду пользователя Speaktoit Assistent включает распознаватель речи, позволяющий дать новую голосовую команду. Программа имеет оповещающие звуковые сигналы. Подача команд возможна и с помощью экранной клавиатуры.

Speaktoit Assistent не только распознаёт команды, запускающие приложения, но и осуществляет голосовой ввод текста. Например, после голосовой команды пользователя «Открой сообщения!» Speaktoit Assistent выполняет данную команду и спрашивает пользователя «Какое сообщение ты хочешь отправить?», пользователь может продиктовать текст сообщения, и продиктованный текст может быть отправлен.

Все команды выполняются без выхода из приложения Speaktoit Assistent и без открытия интерфейса других приложений. В окне Speaktoit Assistent отображаются в виде текста произнесённые команды и полученные ответы приложения на них.

Большинство голосовых команд распознаётся очень медленно, иногда период распознавания речи составляет одну минуту. Случается и неверное распознавание команд.

Бесплатная версия Speaktoit Assistent выполняет весьма ограниченное количество команд, к примеру, на команду «Открой будильник!» приложение даёт ответ «Эта функция не доступна на твоём устройстве», хотя это не так; на некоторые команды следует ответ «Я не могу это сделать, возможно, меня этому просто не научили». Для расширения возможностей, в том числе и возможности обучения приложения, Speaktoit Assistent предлагает установить платную версию. Однако платная версия не обещает безошибочного распознавания голосовых команд и увеличения скорости распознавания речи.

Браузерные приложения

Браузер Google Chrome, установленный на нетбуке, легко распознаёт речь при помощи функции «Голосовой поиск». Однако предоставляемая данным браузером возможность неактуальна, так как программы экранного доступа, предоставляя гораздо больший функционал (описан автором выше), очень плохо поддерживают интерфейс Chrome.

Браузер Google Chrome, установленный на смартфоне, предоставляет возможность голосового ввода текста в строку поиска. Ввод текста в адресную строку возможен путём голосового ввода при нажатии кнопки «Голосовой поиск». Поиск введённого текста осуществляется сразу после появления текста в строке поиска, без нажатия кнопки «Найти». Есть оповещающие звуковые сигналы. Речь распознаётся быстрее, чем встроенный распознаватель речи, но медленнее, чем при помощи программ Dragon Dictation и Speech Recogniser.

Приложение к браузеру Яндекс «Яндекс.Диктовка» очень быстро распознаёт речь, практически не допускает ошибок и расставляет пунктуационные знаки в зависимости от интонации. Данное приложение распознаёт и команды по формированию текста, например, команду «Удали весь текст!» или «Выдели последнее слово!». Яндекс.Диктовка позволяет отправить получившийся текст по email или сообщением и скопировать текст. Для запуска распознавания речи приложением предусмотрена голосовая команда Яндекс, «Записывай!» и кнопка запуска распознавания речи.

Однако приложение часто не реагирует и на голосовую команду, и на нажатие кнопки запуска распознавания речи. Оповещающих звуковых сигналов Яндекс.Диктовка не имеет, поэтому при удачном запуске распознавания речи пользователю неизвестно о возможности начать голосовой ввод. По причине затруднительного запуска распознавания речи использовать приложение Яндекс.Диктовка не представляется возможным.

Заключение

По степени значимости для пользователей с нарушениями зрения категории рассмотренных программ автор распределил следующим образом:

1 место - программы, преобразовывающие текст в аудио-речь,

2 место - программы с возможностью голосового ввода текста,

3 место - программы с возможностью голосового управления.

На нетбуке эффективно постоянное использование программу NVDA, а к Jaws следует, на взгляд автора, прибегать в тех случаях, когда интерфейс определённой программы, к примеру, антивирус Avast, не поддерживается NVDA.

НаAndroid-устройствах эффективно использование озвучивающего приложения Vocalizer в сочетании с браузером Google Chrome или приложением Яндекс.Диктовка.

При работе на iPhon: встроенный распознаватель речи VoiceOver имеет смысл использовать, если пользователь работает с приложением, и ему необходимо ввести текст, не выходя из приложения.

Если текст нужно ввести быстро, или пользователь находится в месте, где есть много звуковых помех (шум машин, разговор людей и т. п.), то лучше использовать программу Dragon Dictation.

Если к вводимому тексту нужно применить дополнительные функции данного приложения (перевод текста, изменение параметров шрифта), то лучше использовать программу Speech Recogniser.

Для быстрого поиска информации в Интернете целесообразно использовать браузер Google Chrome или приложение Яндекс.Диктовка.

Список протестированного программного обеспечения

  1. Браузер Google Chrome. Доступно для скачивания на официальном сайте разработчика. URL: https://support.google.com/chrome/answer/95346?hl=ru

  2. Синтезатор речи Caterina. В настоящее время не доступно для скачивания. Ранее можно было скачать на сайте разработчика – компании Nuance.com.

  3. Синтезатор речи RHVoice. Доступно для скачивания на сайте разработчика. Доступно для скачивания на сайте разработчика. URL: http://tiflo.info/rhvoice/

  4. Яндекс.Диктовка. Доступно для скачивания в Интернет-магазине apple.com. URL: https://itunes.apple.com/ru/app/andeks.diktovka/id927990975?mt=8

  5. Assistent для Android. Доступно для скачивания в Google play / Play Маркет. URL: https://play.google.com/store/apps/details?id=mobi.voiceassistant.ru

  6. Dragon Dictation. Доступно для скачивания на сайте разработчика. URL: http://www.nuance.com/for-individuals/mobile-applications/dragon-dictation/index.htm

  7. Jaws. Доступно для скачивания на сайте разработчика. URL: http://www.freedomscientific.com/

  8. NonVisual Desktop Access (NVDA). Доступно для скачивания на сайте русской поддержки программы. URL: http://nvda.ru/

  9. Speech Interpretation and Recognition Interface (Siri). Предустановленная программа на смартфонах с iOS.

  10. Speaktoit Assistant для iOS. Доступно для скачивания в Интернет-магазине apple.com. URL: https://itunes.apple.com/ru/app/speaktoit-assistent/id491854246?mt=8

  11. Speech Recogniser. Доступно для скачивания в Интернет-магазине apple.com. URL: https://itunes.apple.com/ru/app/on-air-messenger-speech-recognizer/id845982869?l=en&mt=8

  12. SVOX Russian Katja Trial. Доступно для скачивания в Google play / Play Маркет. URL: https://play.google.com/store/apps/details?id=com.svox.classic.langpack.rus_rus_fem_trial

  13. Talkback. Доступно для скачивания в Google play / Play Маркет. URL: https://play.google.com/store/apps/details?id=com.google.android.marvin.talkback

  14. VoiceOver. Доступно для скачивания в Интернет-магазине apple.com. URL: https://www.apple.com/ru/accessibility/ios/voiceover/

  15. Vocalizer. Доступно для скачивания на сайте Vocalizer for NVDA. URL: https://vocalizer-nvda.com/downloads

Просмотров работы: 3842