русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Программное обеспечение, позволяющее диктовать тексты


Дата добавления: 2013-12-24; просмотров: 1527; Нарушение авторских прав


Программное обеспечение для голосового управления компьютером

Распознавание речи

 

С некоторыми звуковыми платами поставляется программное обеспечение для распознавания речи. Заставить распознавать речь вы можете и свою плату, но для этого понадобится дополнительное программное обеспечение. Хотя технология распознавания речи пока несовершенна, уже сегодня существуют программы, позволяющие отдавать компьютеру команды голосом и даже диктовать ему тексты, которые раньше пришлось бы набирать.

 

Такое применение речевого интерфейса гораздо проще, поскольку программное обеспечение должно распознавать только слова из ограниченного набора (словаря). Этот тип программного обеспечения позволяет с помощью команд, подаваемых голосом, вызывать нужные приложения, открывать файлы и необходимые диалоговые окна.

Для среднего пользователя приложения этого типа имеют сомнительное значение. В течение некоторого времени компания Compaq поставляла компьютеры с микрофоном и приложением этого типа, причем стоимость самого приложения была очень низка. Наблюдать за множеством пользователей в офисе, говорящих с компьютерами, было, конечно, интересно, но эксперимент показал, что производительность фактически не увеличилась, зато много времени было потрачено впустую, поскольку пользователи были вынуждены экспериментировать с программным обеспечением, а кроме того, в офисе стало более шумно.

Однако для пользователей, которым в силу ограниченных возможностей сложно работать с клавиатурой, программное обеспечение этого типа может представлять определенный интерес. Поэтому технология распознавания речи непрерывно развивается.

 

 

Другой тип программного обеспечения распознавания речи гораздо сложнее. Преобразование речи в текст — необычайно трудная задача, прежде всего из-за различий в речевых моделях разных людей. Поэтому почти все программное обеспечение этого типа (а также некоторые приложения для подачи команд голосом) предусматривает этап “обучения” технологии распознавания голоса конкретного пользователя. В процессе такого обучения пользователь должен читать текст (или слова), выводимый программой на экран компьютера. И поскольку предполагается, что программе заранее известно то, о чем вы говорите, это помогает ей адаптироваться к вашей манере речи.



В результате проведенных экспериментов оказалось, что качество распознавания зависит от индивидуальных особенностей речи. Кроме того, как известно, некоторые способны надиктовать целые страницы текста и при этом не прикоснуться к клавиатуре, в то время как другие утверждают, что исправление множества ошибок значительно больше утомляет их, чем набор текста вручную.

Существует множество параметров, влияющих на качество распознавания речи, основные из них представлены далее.

· Программы распознавания дискретной и слитной речи. Слитная (или связная) речь, позволяющая вести более естественный “диалог” с компьютером, в настоящее время является стандартной, но, с другой стороны, существуют большие проблемы в достижении приемлемой точности распознавания.

· Обучаемые и необучаемые программы. Обучение программы для корректного распознавания речи дает хорошие результаты даже в тех программах, которые позволяют пропустить этот этап.

· Большие активные и общие словари. Программы с большим активным словарем значительно быстрее реагируют на устную речь, а программы, имеющие больший общий словарь, позволяют сохранить более уникальный запас слов.

· Производительность аппаратного обеспечения компьютера. Увеличение скорости процессоров и объема оперативной памяти приводит к ощутимому повышению скорости и точности программ распознавания речи, а также позволяет разработчикам вводить дополнительные возможности в новые версии этих приложений.

· Высококачественная звуковая плата и микрофон. Используйте высококачественное аппаратное обеспечение, рекомендуемое производителем для достижения наилучших результатов; наушники со встроенным микрофоном предназначены не для записи музыки или звуковых эффектов, а именно для распознавания речи.

 

Звуковой смеситель (микшер)

 

Если у вас есть несколько источников звука и вы хотите их проиграть через одну акустическую систему, то вам необходимо воспользоваться звуковым смесителем. Вы, наверное, видели такие устройства в музыкальных магазинах.

Большинство звуковых плат имеют встроенный смеситель звука (микшер), позволяющий смешивать звук от аудио-, MIDI- и WAV-источников, линейного входа и CD-проигрывателя, воспроизводя его на едином линейном выходе. Обычно интерфейсы программ для смешивания звука на экране выглядит так же, как панель стандартного звукового смесителя. Это позволяет легко управлять громкостью звука каждого источника.

 



<== предыдущая лекция | следующая лекция ==>
Разъемы звуковых плат | Оценка качества звукового адаптера


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.766 сек.