Набор голосом для windows

Использование режима диктовки для ввода текста голосом, а не с клавиатуры компьютера

С помощью диктовки вы можете преобразовывать произносимые слова в текст в любое время на компьютере с Windows 10. В диктовке применяется функция распознавания речи, встроенная в Windows 10, поэтому вам не нужно ничего скачивать и устанавливать, чтобы использовать ее.

Чтобы начать диктовку, выберите текстовое поле и нажмите клавишу с логотипом Windows + H для открытия панели инструментов диктовки. Затем произнесите необходимые слова. Чтобы прекратить диктовку в любой момент во время диктовки, скажите «прекратить диктовку».

Если вы используете планшет или сенсорный экран, коснитесь microphone кнопки «микрофон» на сенсорной клавиатуре, чтобы начать диктовку. Нажмите кнопку еще раз, чтобы прекратить диктовку, или скажите «Остановить диктовку».

Дополнительные сведения о распознавании речи см. в разделе Использование распознавания речи в Windows 10. Чтобы узнать, как настроить микрофон, см. раздел Настройка и проверка микрофонов в Windows 10.

Для диктовки необходимо подключение к Интернету.

Команды для диктовки

Используйте команды диктовки, такие как «delete that» или «select the previous word», чтобы выполнить действие на компьютере.

В следующей таблице указано, какие команды можно произносить. Если слово или фраза выделена полужирным шрифтом, это пример. Замените его похожими словами, чтобы получить нужный результат.

Clear selection; unselect that

Удалить последний результат диктовки или выделенный текст

Delete that; strike that

Удалить фрагмент текста, например текущее слово

Переместить курсор к первому символу после указанного слова или фразы

Go after that; move after word; go to the end of paragraph; move to the end of that

Переместить курсор в конец фрагмента текста

Go after word; move after word; go to the end of that; move to the end of paragraph

Переместить курсор назад на один фрагмент текста

Move back to the previous word; go up to the previous paragraph

Переместить курсор к первому символу до указанного слова или фразы

Go to the start of the word

Переместить курсор в начало фрагмента текста

Go before that; move to the start of that

Переместить курсор вперед к следующему фрагменту текста

Переход вперед к следующему слову; Переход к следующему абзацу

Переместить курсор в конец фрагмента текста

Move to the end of the word; go to the end of the paragraph

Ввести одну из следующих клавиш: TAB, ENTER, END, HOME, PAGE UP, PAGE DOWN, BACKSPACE, DELETE

Tap Enter; press Backspace

Выбрать определенное слово или фразу

Выбрать последний результат диктовки

Выделить фрагмент текста

Select the next three words; select the previous two paragraphs

Включить или выключить режим диктовки по буквам.

Start spelling; stop spelling

Диктовка букв, цифр, знаков препинания и символов

Вы можете диктовать большинство цифр и знаков препинания, произнося цифру или знак препинания. Чтобы продиктовать буквы и символы, скажите «start spelling». Затем произнесите символ или букву или используйте фонетический алфавит ИКАО.

Чтобы продиктовать прописную букву, произнесите «uppercase» перед буквой. Например, «прописные буквы A» или «прописные буквы». Когда все будет готово, скажите «остановить орфографию».

Далее представлены знаки препинания и символы, которые можно диктовать.

at symbol; at sign

Pound symbol; pound sign; number symbol; number sign; hash symbol; hash sign; hashtag symbol; hashtag sign; sharp symbol; sharp sign

Dollar symbol; dollar sign; dollars symbol; dollars sign

Percent symbol; percent sign

And symbol; and sign; ampersand symbol; ampersand sign

Asterisk; times; star

Open paren; left paren; open parenthesis; left paren

Close paren; right paren; close parenthesis; right parenthesis

Лучшие программы для набора текста голосом

Программы для преобразования голоса в текстовый документ могут пригодиться для записи длительных лекций или для быстрого набора книг, статей. В их основе используются специальные API-движки, которые распознают тон и фонетику воспроизводимых звуков и на их основе выстраивают слова, предложения. Естественно, каждая такая программа для голосового набора и сохранения текста работает не идеально, но для создания заметки под последующее редактирование отлично сойдёт.

Перечень лучших программ для голосового набора текста

Если ориентироваться на отзывы, оставленные пользователями на тематических форумах, для перевода голоса в текст самыми лучшими являются следующие программы:

  • MSpeech;
  • Dictate;
  • Speechpad;
  • VoiceNote II;
  • Speak a Message;
  • Voco

Каждая указанная программа для набора и редактирования текста голосом может использоваться на ПК в сочетании с любым микрофоном. Но для повышения качества распознавания звука рекомендуется использовать конденсаторные, при этом полностью отключая шумоподавление (если имеется) и прочие надстройки для обработки голоса (через настройки драйвера звуковой карты).

MSpeech

Программа для ввода текста голосом, в качестве движка используется Google API (считается самым эффективным в плане преобразования речи в текст). Главное преимущество: распознавание на более чем 50 языках, регулярно добавляется поддержка новых. Дополнительные функции:

  • поддержка голосовых команд (например, команды «старт», «стоп», «удалить»);
  • коррекция текста («логика» выстраивается на основе того же Google API), который позволяет быстро заменять повторяющиеся слова синонимами;
  • можно выбирать другие движки преобразования голоса (например, Microsoft Bing);
  • предусмотрена синхронизация вводимых заметок с сервисами облачного хранения данных (Google Disk).
Читайте также:  Para instalar windows 10

Приложение бесплатное, позволяет набирать неограниченное количество символов, но для своей работы требует наличия постоянного подключения к интернету. При этом потребляет достаточно большое количество трафика (от 1 до 5 мегабайт в минуту), а при включении синхронизации с Google Disk – и того больше.

Dictate

Преобразователь голоса в текст от компании Microsoft. Выпускается в форме дополнения для текстового редактора Word. Программа бесплатная, но требует наличие активированной лицензии для Microsoft Office. Сам плагин скачивается с официального сайта Майкрософт, устанавливается как обычное приложение. Набор заметок голосом выполняется в Word, Outlook или PowerPoint. Дополнительные функции:

  • преобразование текста на компьютере на более чем 60 языков;
  • автоматическое редактирование начитанных предложений (удаление ошибок, расстановка пунктуационных знаков);
  • распознавание надиктованных формул (пока что тестируется, часто срабатывает некорректно).

Разработчики утверждают, что Dictate, помимо распознавания текста, умеет самообучаться. Программа учитывает специфику фонетики конкретного пользователя, поэтому при частом её использовании точность ввода увеличивается. Но для её работы тоже требуется наличие постоянного доступа в интернет (без него тоже работает, но распознаёт некорректно). После установки приложения в Microsoft Word появляется дополнительная вкладка «Dictate» – там как раз и производится работа с транскрипцией звукового ввода. Работает только в Виндовс, в облачной версии Microsoft Office функция недоступна (но в скором времени обещают добавить).

Speechpad

Плагин для браузера Google Chrome (есть способ установки для всех браузеров на движке Chromium) для записи голоса и его последующего преобразования в заметку. Голосовой ввод текста выполняется с использованием Google API, поэтому функция доступна только при активном подключении к интернету. Сервис поддерживает сохранение всех ранее введённых текстовых заметок, их экспорт в Гугл Документы.

За счёт того, что это не отдельная программа, а надстройка для браузера, использовать её можно не только в среде Windows, но и в Linux-дистрибутивах, MacOS. При этом Speechpad печатает текст не только из речи в реальном времени, но и умеет его распознавать в аудиофайлах, видео (используя звуковую дорожку). Преобразование довольно точное, но вот с пунктуационными знаками часто возникают неточности, поэтому без последующего редактирования не обойтись.

VoiceNote II

Очередная программа для написания текста голосом. Тоже использует Google API, но выпускается и как расширение для браузера Google Chrome, и как отдельная программа для Windows. При работе требует наличия активного подключения к интернету. Из дополнительных функций стоит упомянуть:

  • интеграция собственных словарей пользователя (для слов, которые изначально распознаются неверно);
  • настройка микрофона (громкость, частота дискретизации, можно также выбрать другое звукозаписывающее устройство);
  • есть функция, когда записывающийся текст сразу же переводится на другой язык (всего поддерживается более 150 языков, в том числе и региональные диалекты).

Единственный недостаток Voice Note II – это то, что преобразующий текст в окне программы нельзя редактировать. Можно только скопировать в тот же блокнот или Microsoft Word.

Speak а Message

Программа использует собственный API, переводящий голос в текст на английском, немецком, французском или испанском языке. Русский тоже распознаёт, но только если включить в настройках «облачный перевод» и указать, какой именно API будет использоваться (корректней всего получается с Yahoo, если верить отзывам пользователей). В целом, точность распознавания голоса в данной программе средняя, но зато начитанный текст можно сразу отредактировать вручную и отправить в очередь печати (на физический или виртуальный принтер).

Разработчики утверждают, что приложение лучше всего подходит для записи подкастов с одновременным просмотром презентаций (для этого предусмотрен показ слайдов из картинок или презентации Power Point). И при голосовом вводе в отдельные файлы также сохраняется само аудио.

Программа использует собственные словари, поэтому при работе не требуется подключение к интернету. Но она является платной, выпускается в нескольких редакциях. Например, в Voco Professional поддерживаются голосовые команды, ввод знаков пунктуации. А Voco Enterprise оптимизирована для использования студентами и преподавателями: добавлены словари со сложными терминами, диктовка тематических формул. Дополнительные функции:

  • программа умеет печатать документы, созданные из заметок (сразу отправляя на принтер готовую страницу);
  • поддерживается автозамена любых произнесённых слов на указанные знаки, целые словосочетания;
  • поддерживается написание сложных формул (но потребуется провести «обучение» программы);
  • преобразование звукового файла в текст.

По качеству распознавания голоса не уступает Google API, но работает только на Windows 7 и выше. И приобретаемая лицензия – временная (есть и постоянная, но стоит недёшево).

Итак, голосовой ввод сегодня хоть и нельзя назвать идеально работающим, но он есть, и разработчиками алгоритмы распознавания текста постоянно модернизируются. Ещё лет 10 назад о таком функционале можно было лишь мечтать, сегодня же тот же Google с точностью в 80–90% правильно распознаёт вводимый голосом текст.

Набор текста голосом: проверенные программы и онлайн-сервисы

Развитие технологий распознавания голоса даёт пользователям новые возможности для взаимодействия с различными устройствами. Мы постепенно привыкаем к голосовым помощникам, но с помощью голоса можно не только узнавать погоду или включать музыку, но и набирать большие объёмы текста.

Что такое голосовой ввод текста

Голосовой ввод текста — это функция, основанная на технологии распознавании речи. Программа голосового ввода воспринимает произнесенные слова и преобразует их в письменный текст.

Не стоит путать голосовой ввод с голосовым управлением. Вторая технология упрощает пользователю выполнение каких-либо действий на устройстве — например, включает музыку или запускает приложения без помощи рук. Голосовой же ввод решает более узкую задачу — набор текста с помощью голоса.

Голосовой ввод применим в разных ситуациях:

  • для перевода аудиофайлов в текстовый формат — например, для расшифровки интервью или записи лекции;
  • для сохранения в файл большого объёма устного текста, ведь говорим мы намного быстрее, чем печатаем;
  • для преодоления физических ограничений, при которых нет возможности набирать текст на клавиатуре.
Читайте также:  How to install jar file in windows

Для использования голосового ввода нужен лишь микрофон. Владельцы ноутбуков могут использовать микрофон, встроенный в аппарат, а владельцы стационарных компьютеров — тот, что есть в веб-камерах, которые подключаются к ПК.

В принципе, для голосового ввода подойдёт любой микрофон, если говорить чётко и не очень быстро. Особой настройки оборудования тоже не требуется. Достаточно убедиться в том, что система воспринимает звук через микрофон.

Проверка и настройка микрофона

Прежде всего подключите микрофон к компьютеру. Если вы хотите использовать встроенное устройство ноутбука или веб-камеры, то ничего подключать не надо. Затем найдите на панели уведомлений значок динамика. Он может быть спрятан под галочкой.

Кликните по значку динамика правой кнопкой и выберите пункт «Записывающие устройства». Это откроет список оборудования, которое можно использовать для записи звука. В этом списке должен быть и ваш микрофон вне зависимости от того, подключен он отдельно или встроен в ноутбук.

Если в списке записывающих устройств пусто, кликните на свободном месте правой кнопкой мышки и отметьте пункты «Показывать отключенные устройства» и «Показывать отсоединенные устройства». После того как микрофон появится в списке, откройте правым кликом его меню и выберите опцию «Включить». Также убедитесь, что он назначен устройством по умолчанию.

Удостовериться в том, что система воспринимает звук с микрофона, очень просто: скажите в него что-нибудь. Если справа появляются зелёные полосы, значит всё готово к голосовому вводу. Попробуйте говорить тише или громче — вы заметите, как количество зелёных полос меняется в зависимости от громкости голоса.

При желании можно попробовать изменить стандартные параметры микрофона, добившись некоторого улучшения качества записи. Для этого:

  1. Кликните правой кнопкой по микрофону.
  2. Откройте его свойства.
  3. Перейдите на вкладку «Уровни».
  4. Поставьте максимальные значения громкости и усиления.
  5. Откройте вкладку «Улучшения».
  6. Включите подавление шума и эхо.

Количество опций для улучшения зависит от того, какая звуковая карта установлена на вашем компьютере. К сожалению, некоторые из них не имеют вообще никаких параметров для настройки, кроме управления громкостью и усилением. Но для голосового ввода это не критично — главное, чтобы система в принципе воспринимала звук через микрофон.

Программы для голосового ввода

Если вы планируете пользоваться голосовым вводом постоянно, то самое удобное решение — установить одну из программ, которая предоставляет такую возможность.

Dictate для MS Office

В 2017 году разработчики Microsoft выпустили дополнение Dictate. Оно доступно для бесплатной установки на Windows 8.1/10 в пакетах MS Office 2013 и старше. После инсталляции Dictate в Word, PowerPoint и Outlook появляется дополнительный раздел, позволяющий включить микрофон и использовать распознавание речи для начитки текста.

Спустя некоторое время Microsoft прекратила поддержку дополнения, интегрировав функцию распознавания речи в Office 365 и Windows 10. Если вы используете эту версию пакета приложений, то можете без труда наговорить любой текст через микрофон.

Как это сделать:

  1. Откройте Word.
  2. Нажмите сочетание клавиш Win+H.
  3. Кликните по значку микрофона и диктуйте текст.

Распознавание работает только в том случае, если в «Параметрах» включена соответствующая функция:

Несмотря на заявленную поддержку русского языка, качество его распознавания оставляет желать лучшего. Программа правильно записывает простые фразы, но на сложных предложениях часто спотыкается. Поэтому не стоит даже надеяться на то, что вы будете говорить безостановочно — для получения приемлемого результата необходимо делать паузы и чётко проговаривать все окончания. Распознавание аудиофайлов здесь не поддерживается — для этого нужны другие программы.

Расширение Dictate больше нельзя скачать с официальной страницы Microsoft, но оно осталось на других сайтах. Однако загрузка из сторонних источников может быть опасной из-за вирусной угрозы. Если у вас нет подписки на Office 365, то рекомендуем использовать другие программы для голосового набора текста.

MSpeech

MSpeech — простая программа для обработки речи и превращения голосового потока в текст, способная распознавать более 50 языков, среди которых русский.

После установки и запуска она сворачивается в системный трей. Чтобы вызвать её оттуда, кликните правой кнопкой мышки по иконке программы и выберите опцию «Показать».

Для управления записью здесь используются две кнопки — «Начать» и «Остановить».

Самые важные функции программы скрыты в её настройках. Нажмите на одноимённую кнопку, чтобы перейти в этот раздел. Здесь вы можете:

  1. Включить автозапуск приложения вместе с системой.
  2. Выбрать основной и дополнительный языки распознавания.
  3. Задать собственные команды для запуска других программ. Например, по ключевому слову «интернет» будет открываться Mozilla Firefox.
  4. Назначить горячие клавиши для управления записью.
  5. Включить передачу текста в другие программы: редакторы, офисные приложения, браузеры и т.д.

Для работы MSpeech требуется подключение к Интернету, так как программа использует Google Voice API.

Speechpad

Speechpad — это сервис, который можно использовать в браузере или интегрировать с операционными системами Windows и Linux для добавления голосового ввода в другие программы — например, «Блокнот» или офисные приложения.

Если вы хотите пользоваться голосовым вводом в Google Chrome, в том числе набирать сообщения и заполнять другие формы, сделайте следующее:

  1. Установите в Chrome расширение Speechpad.
  2. После инсталляции кликните по значку дополнения на верхней панели, чтобы открыть его настройки.
  3. Выберите язык голосового ввода.
  4. Нажмите «Save» и перезапустите браузер.
  5. Откройте любой сайт с текстовой формой. Это может быть поисковая строка Яндекса или диалог в соцсети.
  6. Кликните по полю правой кнопкой и выберите опцию «Speechpad».

Если голосовой ввод поддерживается, то форма окрасится в розовый цвет. Также вам нужно дать разрешение на использование микрофона, после чего вы можете диктовать текст.

Чтобы расширить действие сервиса на другие приложения Windows, необходимо установить дополнительный модуль интеграции.

Читайте также:  После апгрейда пк не запускается windows 10

  1. Скачайте модуль и распакуйте архив.
  2. Запустите файл install_host.bat.
  3. Зарегистрируйтесь в голосовом блокноте.
  4. Авторизуйтесь в кабинете пользователя и нажимаем на кнопку «Включить тестовый период».
  5. Откройте сайт голосового блокнота.
  6. Отметьте пункт «Интеграция с OS».
  7. Нажмите «Включить запись».
  8. Запустите любое приложение с текстовым редактором (например, Word) и диктуйте текст.

Интеграция с системой — платная услуга. Проверить её работу можно без покупки лицензии, но для постоянного использования требуется подписка: месяц — 100 рублей, 3 месяца — 250 рублей, 1 год — 800 рублей.

Voco — платное Windows-приложение для распознавания речи и преобразования её в текстовый формат. Оно даже поддерживает расстановку знаков препинания с помощью специальных команд.

Для проверки орфографии эта программа использует встроенные словари. Кроме того, вы можете научить её новым выражениям, открыв доступ к вашим письмам и документам.

  • Basic — 1718 рублей. Бесплатные обновления в течение 1 года. Продление подписки на апдейты — 559 рублей ежегодно.
  • Professional — 14 136 рублей. Продление подписки на обновления — 4937 рублей ежегодно.
  • Enterprise — от 50 749 рублей. Продление подписки на обновления — 17 786 рублей ежегодно.

Для домашнего использования оптимально подходит Voco.Basic. Однако в ней нет распознавания аудиозаписей и тематических словарей. Эти возможности доступны только в старших версиях.

Веб-сервисы и приложения для голосового ввода

Для использования голосового ввода от случая к случаю можно обойтись без установки на компьютер специальных программ. Скорее всего, вам будет достаточно возможностей веб-сервисов и расширений для браузера.

Google Docs

Простой инструмент голосового ввода есть в Google Docs — сервисе для работы с текстовыми документами. Для его использования достаточно иметь аккаунт почты Gmail.

Как пользоваться голосовым вводом в Google Docs:

  1. Откройте сайт поисковой системы Google.
  2. Авторизуйтесь под своей учётной записью Google или зарегистрируйте новый профиль.
  3. Кликните по квадрату из точек, чтобы раскрыть меню с сервисами.
  4. Нажмите «Ещё», чтобы увидеть полный список.
  5. Перейдите в «Документы».
  6. В поле «Создать документ» нажмите «Пустой файл».

На экране появится текстовый редактор Google. Чтобы включить голосовой ввод, раскройте меню «Инструменты» и выберите соответствующую опцию. Слева появится виджет с микрофоном. Выберите в нём язык, на котором вы будете говорить, а затем нажмите на иконку микрофона, чтобы включить распознавание. Значок должен стать красным. Если браузер запросит разрешение на использование микрофона, дайте его.

Запуск голосового ввода доступен также с помощью сочетания клавиш Ctrl+Shift+S. Функция запускается с языком, установленным по умолчанию.

После настройки начинайте говорить — Google Docs будет распознавать речь и превращать её в текст. Знаки препинания и новую строку проговаривайте словами, чётко произносите окончания слов — в противном случае исправлять текст придётся очень долго.

Speechpad

Speechpad — бесплатный сервис, который работает только в браузере Chrome. Выше мы рассказали, как настроить его интеграцию с Windows. Однако для набора небольшого фрагмента текста в этом нет необходимости — с задачей отлично справится веб-интерфейс голосового блокнота.

  1. Откройте сайт Speechpad.ru.
  2. Пролистните главную страницу до окна редактора.
  3. Выберите язык ввода.
  4. Нажмите на кнопку «Включить запись» и разрешите использование микрофона.
  5. Диктуйте текст.

Возле кнопки «Включить запись» вы увидите поле предварительного показа. В нём отображается то, что будет добавлено в документ.

Расставлять знаки препинания и переходить на новую строку можно голосом или кнопками, которые находятся между полем предварительного просмотра и редактором. При наведении на каждую кнопку появляется текст голосовой команды, к которой она применяется — например, «вопросительный знак» или «открыть скобку».

Итоговый документ доступен для скачивания в формате TXT.

VoiceNote

VoiceNote — ещё один сервис для преобразования голоса в текст, который работает только в Google Chrome. При попытке запустить его в другом браузере появляется сообщение об ошибке.

Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.

Как пользоваться VoiceNote:

  1. Откройте редактор.
  2. Нажмите на значок в виде земного шара и выберите язык ввода.
  3. Кликните по иконке микрофона.
  4. Разрешите использование записывающего устройства.
  5. Диктуйте текст.

Правила ввода здесь стандартные: знаки препинания можно проговаривать словами, а также голосом отправлять текст на новую строчку.

Полученный документ доступен для сохранения в формате TXT.

TalkTyper

TalkTyper — онлайн-редактор для голосового ввода. Главное его достоинство — поддержка 37 языков. Однако TalkTyper, как и предыдущие сервисы, работает только в Google Chrome.

Принцип ввода текста в этом редакторе не отличается от других: вы указываете язык, нажимаете на значок микрофона и разрешаете его использование. Знаки препинания и новая строка проговариваются словами.

Результат обработки текста в TalkTyper можно сохранить в виде документа в формате TXT, скопировать в буфер обмена, распечатать, отправить по почте, твитнуть и перевести на другой язык.

Voice Notepad

Voice Notepad — ещё один сервис для преобразования голоса в текст, работающий только в Chrome. Он поддерживает больше 120 языков ввода. В остальном функциональность у него такая же, как у сервисов, перечисленных выше: расстановка знаков препинания голосом, сохранение документа в формате TXT, копирование в буфер обмена, отправка по почте или на печать и т.д.

Особенность онлайн-сервисов заключается в том, что все они работают только в Google Chrome. Это связано с тем, что в их основе лежит лицензионная гугловская технология распознавания речи. Другие браузеры её не поддерживают или поддерживают с ограничениями. Например, Speechpad можно запускать в Яндекс.Браузере, однако в чужеродной среде он часто работает с ошибками. Так что если вы не пользуетесь Google Chrome, проще всего установить одну из программ для голосового ввода на компьютер и забыть про неудобства.

Оцените статью