- Программы для перевода голоса в текст
- MSpeech
- Lossplay
- Transcriber-Pro
- Express Scribe
- Голосовые переводчики реального времени
- Microsoft Translator — облачный сервис машинного перевода, поддерживающий работу с текстом, голосом и изображениями. С его помощью можно автоматически переводить и озвучивать беседы с несколькими пользователями. Он предоставляется бесплатно для персонального некоммерческого использования.
- Google Translate — мощная система перевода, работающая как онлайн, так и офлайн. В настоящее время поддерживает 103 языка в текстовом режиме и более 30 языков при использовании голосовых функций.
- SayHi — необычный переводчик от молодой частной компании из Уилмингтона (штат Делавэр). Это бесплатное приложение, которое не содержит рекламы и предлагает очень качественный машинный перевод более чем на 90 языков.
- Day Translations
- Заключение
Программы для перевода голоса в текст
Любой пользователь компьютера может столкнуться с ситуацией, когда необходимо голосом ввести какой-либо текст на компьютере. Помимо стандартных решений Windows, существуют сторонние приложения, позволяющие сделать это. Предлагаем рассмотреть лучшие из них.
MSpeech
Первым делом рассмотрим бесплатную утилиту MSpeech от независимого разработчика Михаила Григорьева, распространяющего свой продукт бесплатно с открытым исходным кодом. В основе решения лежит технология Google Voice API, предназначенная для распознавания человеческой речи и дальнейшего ее преобразования в текст. Распознанный текст вводится в специальное окно, откуда его можно легко перенести в другие приложения разными способами. Поддерживается порядка 50 различных языков, включая русский. Доступны горячие клавиши для удобной активации и завершения записи.
Предусмотрен простой текстовый редактор, в котором можно выполнить первичную коррекцию полученного текста: заменить определенные слова другими или изменить первые буквы предложений на прописные. В качестве источника звука можно использовать любое устройство, подключенное к компьютеру. Если их несколько, то MSpeech предложит выбрать подходящее. Меню программы поддерживает русский язык. Помимо этого, она совместима со следующими интерфейсами: Microsoft SAPI, Google Text-to-Speech, iSpeech Text-to-Speech, Yandex Text-to-Speech и др.
Lossplay
На очереди еще одно простое приложение для транскрибации, которое изначально создавалось командой разработчиков с разных стран. Сейчас в качестве создателя выступает один независимый программист, продолжающий развивать его. LossPlay можно использовать не только для перевода голоса в текст, но и в качестве обычного плеера для прослушивания музыки и других аудиофайлов. Решение поддерживает любое актуальное расширение от MP3 до WMA. Управление воспроизведением осуществляется с помощью настраиваемых горячих клавиш.
LossPlay оптимизирован для работы с текстовыми документами Microsoft Word. Распознаваемый текст вводится в программе без участия пользователя. Помимо этого, предусмотрена функция автоматической вставки тайм-кодов всех фраз. Интерфейс рассматриваемого решения представлен в виде привычного плеера с дополнительными функциями. При этом с меню справится даже начинающий пользователь. LossPlay распространяется на бесплатной основе на русском языке.
Transcriber-Pro
Transcriber-Pro — программа от российских разработчиков, предназначенная для ручной расшифровки аудио и видеофайлов в текст. Присутствует встроенный текстовый редактор со всеми необходимыми функциями для качественной транскрибации: вставка временных меток и дикторов, простая навигация по записи, коррекция без повторного прослушивания, формирование профессиональное стенограммы и др. Управление осуществляется с помощью настраиваемых горячих клавиш, что делает решение более удобным.
Рассматриваемое приложение позволяет работать в команде над одним проектом. Предусмотрена оперативная техническая поддержка для обладателей платной лицензии. Подписка оформляется на год. На официальном сайте можно ознакомиться с системными требованиями, посмотреть наглядный видеоролик по работе с Transcriber-Pro, а также увидеть подробное руководство пользователя.
Express Scribe
Express Scribe — многофункциональный инструмент для ручной расшифровки аудиозаписей, представленный в виде удобного плеера с дополнительными возможностями. В одном интерфейсе сосредоточен звуковой и текстовый модуль, что избавляет пользователя от необходимости переключаться между окнами. Среди примечательных особенностей стоит отметить возможность переключаться между звуковыми дорожками, переходить к конкретным ее частям, а также добавлять заметки с тайм-кодами.
Для открытия файла можно использовать директорию компьютера, FTP-сервер, компакт-диск, электронное письмо или внешние накопители. Помимо этого, Express Scribe поддерживает портативное аудиозаписывающее оборудование. Рассматриваемое решение работает с огромным количеством звуковых форматов: WAV, MP3, WMA, VOX, AU, DSS и др. Поддерживаются расширения диктофонов Philips Digital Recorder, GSM 6.10, ALaw, DSP и т. д. Стоит отметить, что некоторые форматы недоступны в демо-версии, а русский язык здесь вообще не предусмотрен.
Voco — простая утилита для автоматического распознавания человеческой речи и преобразования в текст. Она работает в фоновом режиме, а соответствующий значок можно найти в трее. Микрофон запускается при нажатии комбинации горячих клавиш, после чего пользователь произносит нужные слова и уже через несколько секунд они появляются на экране. Благодаря совершенным алгоритмам система практически не ошибается, а скорость ее работы превышает опытных стенографистов.
Механизм Voco позволяет выставлять знаки препинания голосом и переводить курсор на новую строчку или абзац. Помимо этого, предусмотрена функция расшифровки аудио или видеофайла, но она доступна только в платной версии. Утилита имеет развивающийся словарный запас, который может пополнить любой пользователь. База уже насчитывает более 85 тысяч слов. Для получения демо-версии необходимо заполнить специальную анкету. Присутствует русская локализация.
Это были наиболее надежные и популярные средства для перевода голоса в текст. Одни из них работают в автоматическом режиме, где достаточно загрузить аудиофайл или воспользоваться микрофоном, другие же представляют собой лишь вспомогательный инструмент, значительно упрощающий ручную транскрибацию.
Голосовые переводчики реального времени
Популярный справочник «Этнолог: Языки мира» в последней редакции содержит сведения о 7106 языках, однако 90% мирового населения использует лишь около ста из них. Эту сотню самых распространенных языков уже освоили на достаточно высоком уровне системы машинного перевода. Некоторые из них бесплатно помогают преодолеть языковой барьер сразу в нескольких сценариях практического применения. Они распознают иностранные надписи на фотографиях, автоматически выбирают язык оригинала, захватывают речь с микрофона и озвучивают перевод. Для обзора мы отобрали лучшие сервисы, способные переводить живую речь.
Microsoft Translator — облачный сервис машинного перевода, поддерживающий работу с текстом, голосом и изображениями. С его помощью можно автоматически переводить и озвучивать беседы с несколькими пользователями. Он предоставляется бесплатно для персонального некоммерческого использования.
Доступны мобильные версии Microsoft Translator для Windows ,Android и iOS.Также можно воспользоваться голосовым и текстовым переводчиком через веб-интерфейс.
Для компаний предусмотрена интеграция Microsoft Translator в различные бизнес-программы через библиотеку интерфейсов Cognitive Services APIs. Она может использоваться при локализации справок и веб-сервисов, в работе международного колл-центра, для автоматического перевода презентаций прямо во время вебинаров и во множестве других сценариев. Большая часть статей на собственном сайте Microsoft переведена на десятки языков при помощи MS Translator.
С помощью MS Translator гораздо проще читать лекции студентам из разных стран, объединять учебные группы, говорящие на разных языках, и проводить конференции. Например, средняя школа Белвью (штат Вашингтон) с помощью MS Translator сегодня ведет образовательные программы более чем на 80 языках. Среди ее учеников английский является родным менее чем для 30%. До внедрения автоматического перевода их приходилось разделять на группы с обучением на испанском, корейском и китайском (диалект путунхуа) языках. Это были преобладающие варианты, но всегда находились ученики, не попадающие ни в одну из групп. Им просто приходилось отказывать ввиду нехватки переводчиков.
В ролике ниже демонстрируется функция голосового перевода MS Translator для преодоления языкового барьера и поддержания живого общения между собеседниками из разных стран.
Google Translate — мощная система перевода, работающая как онлайн, так и офлайн. В настоящее время поддерживает 103 языка в текстовом режиме и более 30 языков при использовании голосовых функций.
Благодаря интеграции Google Translate с приложением Google Lens появилась возможность переводить изображения с камеры смартфона, что сильно упрощает туризм и чтение инструкций на иностранных языках. Достаточно навести камеру на дорожный указатель, вывеску, название товара или любую другую надпись, как на экране появится перевод. Дополнительно ИИ распознает достопримечательности и показывает краткую информацию о них. Технология использует оптическое распознавание текста (OCR), поэтому иногда возникают проблемы при переводе рукописных заметок и применении стилизованных шрифтов.
Базовые функции Google Translate доступны через веб-интерфейс. У него есть возможность работать с переведенным текстом прямо в браузере: выбирать варианты из списка, быстро находить подсвеченный фрагмент в оригинале и уточнять контекст. Для перевода можно вставить текстовый фрагмент из буфера обмена, указать URL веб-страницы (в Google Chrome уже интегрирована опция перевода сайтов) или загрузить файл в одном из популярных форматов (документы MS Office, PDF, ODF, RTF, TXT).
Благодаря технологиям машинного обучения Google Translate постоянно совершенствуется. Это очень помогает при работе с устойчивыми выражениями, которые бессмысленно переводить дословно. Кроме того, искусственный интеллект автоматически выберет язык оригинала и даже диалект, если вы затрудняетесь указать его вручную. В отличие от большинства сервисов автоматизированного перевода, здесь для многих слов сразу предлагается транскрипция и возможность услышать их правильное произношение диктором.
Все расширенные функции доступны в бесплатных мобильных приложениях для Android и iOS. Среди них стоит отметить возможность текстового перевода без подключения к Интернету: достаточно заранее скачать набор словарей, предоставляемый для 59 языков.
Распознавание речи происходит преимущественно в облаке, поэтому поддержка голосового перевода в режиме живого общения пока ограничена тридцатью двумя языками. Однако в них вошли практически все распространенные языки Европы, Азии, Северной и Южной Америки.
Оптическое распознавание текста в приложениях реализовано для 38 языков и работает так же, как и в Google Lens: можно загрузить графический файл или просто навести камеру на текст для его перевода.
Если вы любите создавать рукописные заметки, приложение Google Translate поможет и в этом. Оно автоматически преобразует их в текст и переведет на любой из 93 языков. Особенно востребована эта функция в Китае, где туристы часто хотят пообщаться с монахами, давшими обет молчания. Им не запрещено писать иероглифы, в том числе на сенсорном экране. Также она пригодится для беседы со слабослышащими и глухонемыми людьми.
После установки Google Translate при выделении текста из любого приложения в контекстном меню появляется пункт «Перевести». Так вы получите мгновенный перевод без копирования текста и переключения окон.
SayHi — необычный переводчик от молодой частной компании из Уилмингтона (штат Делавэр). Это бесплатное приложение, которое не содержит рекламы и предлагает очень качественный машинный перевод более чем на 90 языков.
Приятной особенностью является его легковесность. Дистрибутив занимает всего 5,7 Мб и работает даже на старых смартфонах (требуется Android 4.4 и выше). Другая отличительная черта — возможность выбрать тип озвучки (мужской или женский голос) и настроить скорость произношения. Это бесценное качество для тех, кто изучает язык или просто не успевает за скороговоркой электронных дикторов других приложений.
Все функции перевода выполняются в облаке, поэтому SayHi нетребователен к ресурсам, но ему нужно надежное подключение. Приложение не поддерживает загрузку словарей для офлайнового использования и не работает без Интернета.
Day Translations
Иногда бесплатные сервисы не справляются. Например, плохо читается надпись, у собеседника специфическое произношение или просто требуется максимально высокое качество перевода для серьезных задач. Тогда на помощь приходят гибридные решения, сочетающие скорость систем на базе ИИ с уровнем профессиональных лингвистов.
Такой метод использует в своем одноименном онлайн-сервисе компания Day Translations Inc. Она была основана в Нью-Йорке в 2007 году, и с тех пор предлагает услуги перевода более чем на ста языках.
Вы можете использовать бесплатное приложение от Day Translationsдля получения мгновенного машинного перевода. В основном окне программы выполняется работа с текстом, а голосовой перевод устных реплик доступен на вкладке Interpret.
На момент написания этой статьи (ноябрь 2019 года) была доступна версия 2.0.2. Она оставила в целом приятное впечатление, но в ходе тестирования выявились и некоторые минусы. В частности, Day Translations не позволяет изменять вручную неуверенно распознанные слова. Программа сама подменяет их сходными по звучанию и сразу озвучивает перевод. Еще одно существенное ограничение касается работы с текстом. В бесплатной версии установлен лимит на перевод в объеме до 30 тыс. символов в сутки.
Если программа не справляется, то прямо в ней можно воспользоваться платными услугами профессиональных переводчиков. Они всегда доступны в чате и готовы помочь там, где ИИ не распознает оригинал или плохо улавливает контекст. По большому счету, это единственное преимущество программы.
Заключение
Большинству пользователей в зарубежных поездках поможет сервис Google Translate, доступный как через веб-интерфейс, так и через мобильное приложение с интеграцией функций перевода в контекстное меню. За счет офлайновых словарей он выручит и там, где нет Интернета.
Если вам требуется локализация программ, быстрый перевод презентаций или чтение лекций для зарубежных студентов, обратите внимание на Microsoft Translator. В этом сервисе доступна интеграция через API и специальные инструменты для образования.
Обладателям старых смартфонов стоит присмотреться к SayHi как самому легковесному приложению. Его функция выбора голоса и настройки скорости озвучки существенно упрощают живое общение.
По возможности используйте несколько переводчиков для перекрестной проверки результата. Благо, они бесплатные и не занимают много места в памяти смартфона.