- Выбираем голосовой синтезатор речи с русским голосом
- Переводчик Google
- RHVoice
- Acapela
- Vokalizer
- Festival
- ESpeak
- 4 thoughts on “ Выбираем голосовой синтезатор речи с русским голосом ”
- Озвучка текста голосом — программы для чтения текста живым голосом (синтезаторы речи)
- Синтезаторы речи: что выбрать
- Для телефона
- Онлайн-сервисы
- Для ПК/ноутбука (под Windows) ✌
- Программы для чтения
- Голосовые движки: мужские и женские
Выбираем голосовой синтезатор речи с русским голосом
Недавно передо мной встала проблема выбора голосового синтезатора речи. Основные требования — это поддержка русского языка и более-менее нормальное произношение.
Для тех, кто не в курсе того, что такое синтезатор речи, расскажу — это специальная программа, смысл работы которой заключается в преобразовании письменного текста в устную речь. Это и есть так называемый синтез.
Зачем это надо? Ну, например, когда надо записать голосовое сообщение чужим голосом. Иностранцам оно может быть полезно для того, чтобы услышать произношение того или иного слова. Синтезатор речи удобен для чтения, когда надо включить ребенку сказку, которой нет в аудиокнигах. Да и вообще, ситуации всякие бывают.
Так вот, в процессе выбора я нашел несколько очень полезных инструментов, среди которых работающих в режиме онлайн с поддержкой русского языка и сейчас я Вам о них и расскажу.
Переводчик Google
Вот поистине многоцелевой продукт, которых можно использовать совершенно по-разному. Главные преимущества:
— это совершенно бесплатный сервис;
— работа в режиме Онлайн без установки. Нужен только доступ в Интернет;
— на мой взгляд этот синтезатор речи имеет лучший голосовой модуль, самое близкое к натуральному;
— наверное самая лучшая команда разработчиков и техподдержка в мире;
— самое большое количество поддерживаемых языков.
К сожалению, вариант голоса только один — женский. Выбора я не нашел.
RHVoice
Отличный многоязычный синтезатор речи от российского разработчика — Ольги Яковлевой. Есть версии, как для операционных систем семейства Windows, так и для Linux. Разработчик синтезатора — Ольга Яковлева. Программа распространяется совершенно бесплатно и доступна на официальном сайте в двух вариантах: как SAPI5-совместимая самостоятельная версия и как модуль для бесплатной программы экранного доступа NVDA. Этот синтезатор голосовой речи умеет озвучивать русские тексты тремя голосами — Елена, Ирина и Александр.
Acapela
Acapela — это, пожалуй, один из самых популярных и распространенных голосовых синтезаторов в мире. Главная особенность — это озвучка текстов более чем на тридцати языках мира. Если рассматривать русский язык, то тут доступны два голоса — Николай и Алена. Причем последний более совершенен и естественен в плане произношения. В демонстрационном режиме на сайте доступен только голос Алена.
Программа доступна для скачивания на официальном сайте и поддерживает все популярные современные операционные системы — Windows, Linux, Mac. Есть даже версии для Android u iOS.
Vokalizer
Женских голос Milena — это ещё один очень популярный движок голосового синтезатора речи от компании Nuance — он очень высококачественный и естественно звучащий. Его Вы можете услышать в call-центрах и в различных сетевых речевых системах, а также в различных приложениях приложениях — таких как Moon+ Reader Pro, Full Screen Caller ID , Cool Reader, в навигационной программах TomTom, iGo Primo.
Среди плюсов можно отметить возможность установки различных словарей, регулировки громкости, ударения и скорости чтения.
Код программы открытый, скачать его бесплатно можно на официальном сайте, собственно как и инсталлятор самой программы.
Festival
Festival — это не просто очередной голосовой речевой синтезатор, а уже целая система распознавания и синтеза речи с различными API. Разработчик — Исследовательский Центр Речевых Технологий университета Эдинбурга.
Festival предназначен для поддержки нескольких языков. По умолчанию поддерживает английский, валлийский и испанский языки. Но есть возможность подключить голосовые пакеты других языков: чешский, финский, хинди, итальянский, маратхи, польский, русский и телугу.
Код программы открытый, сам голосовой синтезатор распространяется по лицензии open source и доступна только для операционных систем Linux. Правда есть портированная версия по Макинтош.
ESpeak
Последняя в моём обзоре система синтеза речи — программа ESpeak — разрабатывается уже около 8 лет. Последняя версия — 1.48.04 от 6 апреля 2014. Данный голосовой синтезатор речи кроссплатформенный — есть версии под Windows, Linux, Mac OS X, и даже под RISC OS, хотя последние две уже давно не поддерживаются.
Отдельно отмечу, что eSpeak используется в мобильных операционных системах Android, правда имеет при этом ряд существенных ошибок.
Программа поддерживает пятидесяти различных языков, поддержка которых указывается при установке программы.
Один из главных минусов это голосового синтезатора — генерирование голоса только в файл формата WAV. Скачать программу бесплатно можно на официальном сайте.
От себя добавлю лишь, что мне понравились RHVoice и Vokalizer, хотя тут во много дело индивидуальное и во многом зависит от того, что Вы хотите получить. Так что пробуйте, ставьте и смотрите. Я думаю, что один из представленных вариантов Вам обязательно должен подойти.
4 thoughts on “ Выбираем голосовой синтезатор речи с русским голосом ”
В заголовке поста графическое изображение женщины с микрофоном — Татьяна-IVONA, в моём случае, версии 1.60.70 польского производства, ранее. К этому синтезатору я пришёл через два года, перебрав все выше указанные, ну, Милена, ещё ничего но, я так и не смог её заставить на сто процентов «принимать» «в себя» мои исправления дикции и фонемные коррекции, и ещё десяток речевых синтезаторов в месте с программами озвучивания и редактирования произношения. На данный момент, Maxim-IVONA 1.60.72 с Balabolka 2.9.0.564 Final. Но сейчас уже есть 2.9.0.566 Final. Что сказать, я делаю аудио книги. Балаболка в плане коррекции произношения текста указаннными синтезаторами, максимально подходит, восприимчива и легка. Хотя есть заточенная читалка под ивону, это ивона реадер, но мне не нравится лично интерфейс этой читалки — редактора, в отличии от балаболки.
А что можете посоветовать для озвучки видео? Уже голову сломал, никак не могу определится! Собираюсь делать слайды для Ютуба и озвучивать разную тематику, но так как пока в силу обстоятельств не могу сам озвучивать, нужен хороший голосовой движок, чтобы народ нормально воспринимал!
Так понимаю ты или хочешь скрыть свой голос для анонимности или то что ты прыщавая школота?
На текущий момент, лучше чем Татьяна Максим ничего нет, в скажем так широком доступе. Я ими озвучиваю видео. В моём случае к примеру, голос свой, нет смысла скрывать, но часто бывает, синтезатор речи, по подготовленному тексту в разы лучше и доходчивей объяснит текущие моменты в видео материале. В этих синтезаторах нужный мне текст, я сразу корректирую, потом прослушиваю и если устраивает, записываю в несжатом аудио формате. Далее, подставляю в звуковую дорожку Вегаса. В процессе редакции видео файла, более точно корректирую и конкретней формулирую тексты по ходу ситуации. Это весьма удобно для многих случаев. Есть видео где я есть, но озвучка идёт синтезатором.
Озвучка текста голосом — программы для чтения текста живым голосом (синтезаторы речи)
Всем здравия!
Народная мудрость: «Испокон веков книга растит человека» .
Кто бы что не говорил о современном цифровом мире, что бумага скоро вымрет и т.д. — всё-таки книги, на мой взгляд, еще долго будут полезны и актуальны. Наоборот, современные технологии помогают более быстро и легко найти те книги и информацию в них, которая вам нужна.
Сейчас в один планшет, кстати говоря, можно загрузить целую библиотеку, и знакомиться с ней в любом месте, например, по дороге на работу, дома, на учебе и т.д.!
Но есть и еще один плюс, что дает нам современное ПО — это возможность слушать книги , так как будто бы их вам читает живой человек (такие программы, кстати, называют синтезаторами речи ) ! Современные голосовые движки позволяют слушать текст в мужском, женском, детском голосах. Обо всем, более подробно ниже.
Для того, чтобы приложения, представленные ниже, могли читать ваш текст книги (журнала, газеты и пр.) — необходим голосовой движок (синтезатор). Т.е. вам для работы нужна и программа для чтения, и движок!
От последнего, кстати, напрямую зависит качество чтения (чтобы не было «бэ-мэ», нужно выбрать хороший голосовой движок). О движках для ПК подробно во второй части этой статьи.
Синтезаторы речи: что выбрать
Для телефона
Синтезатор речи Google
Этот продукт по умолчанию встроен во многие смартфоны (правда, не всегда он указан в качестве синтезатора, используемого по умолчанию). В разделе «Язык и ввод» перепроверьте, задан ли он у вас как предпочитаемый модуль (в моем случае использовался движок от Samsung, примеры на скрине ниже 👇).
Настройки Android 10 — язык и ввод
Что касается использования — то при помощи него вы сможете озвучивать тексты:
- в Google Play Книгах;
- в Google Переводчике (причем, можно слушать и иностранный текст/слова);
- во многих приложениях-читалках, которые вы можете загрузить с Play Market и его аналогов (разумеется, что в настройках приложения нужно будет не забыть указать нужный вам синтезатор).
Voice Aloud Reader
Весьма добротное приложение, способное читать текст из самых разных источников: веб-страниц, статей (документов), электронные письма, SMS, PDF, FB2, MOBI, и т.д.
Voice Aloud Reader — скрины работы приложения
Пользоваться приложением крайне легко и удобно: загружаете на телефон нужный документ, добавляете его в библиотеку Voice Aloud Reader, открываете и запускаете чтение. Всё!
Также хотелось бы отметить, что в приложение встроен собственный менеджер голосов (правда, его звучание оставляет желать лучшего и я бы порекомендовал его заменить на продукт от Google 👆).
Кстати, при желании можно использовать сразу несколько голосов (для этого нужно установить хотя бы пару разных синтезаторов: Acapela, Ivona Google TTS, SVOX TTS и др.). Всё это добро есть на Play Market.
TTS Reader (для книжек)
Универсальная программа для чтения книг (поддерживает форматы: TXT, FB2, PDF, DJVU, EPUB, RTF, HTML и др.).
Мне она больше всего нравится своей библиотекой: во-первых, у вас все книги будут отсортированы (и вы легко найдете нужную), а, во-вторых, вы можете прямо в программе искать новые книжки. Удобно?!
Как запустить чтение в слух! TTS Reader
Что касается чтения вслух — то тут все просто! Когда откроете нужную книгу — нажмите по значку «головы с наушниками» , выберите движок, скорость, громкость (и др. параметры) и нажмите Play. 👆
Кстати, если вам будет нужно прерваться и остановить чтение — в TTS Reader реализованы удобные закладки (т.е. вы всегда сможете продолжить с того места, где остановились).
Онлайн-сервисы
Весьма интересное решение от Яндекс позволяет озвучивать текст длинной в 5000 символов голосом Алисы. Отмечу, что несмотря на небольшой объем — само качество чтения весьма достойное: их движок хорошо делает интонации и ставит неплохо ударения.
Yandex SpeechKit — скрин с офиц. сайта
Конечно, этот сервис не позволит прочитать целую книгу, но если вам нужно знакомится с какой-то статьей фоном — то почему нет.
Не многие обращают внимание, что помимо основной своей функции, онлайн-переводчики могут быть использованы для чтения небольших текстов (Яндекс в этом плане предпочтительнее, т.к. поддерживает до 10 тыс. символов).
Скриншот с сайта Google
Бесплатно : только 300 символов (т.е. маленький текст)
Весьма неплохой синтезатор, но платный. На русском разговаривает голосом «Алёнки». Для тестирования можете воспользоваться небольшим текстом, загрузив в спец. форму на главной страничке сайта (👇).
Acapela — чтение моей статьи
Впрочем, если вас не смущает ограничения бесплатной версии — то пользоваться можно и ей. 👌
Этот сервис, на мой взгляд, больше подходит тем, кто изучает иностранные языки. Он позволяет зачитывать вслух тексты как на русском, так и на английском, немецком, итальянском и др. языках.
Кстати, качество чтения у него всё-таки пониже, чем у вышеперечисленных решений.
Скриншот с главной странички сайта
Для ПК/ноутбука (под Windows) ✌
Программы для чтения
( прим. : для чтения текста)
Govorilka
Совсем небольшая программа, предназначенная для чтения текстов голосом. Программа может прочитать текст на различных языках, в зависимости от того, какой голосовой движок подключите. Дает возможность создания MP3 файлов (например, создавать аудиокниги, так популярные в последнее время).
Главное окно программы «Говорилка»
- чтение текста из различных файлов: DOS и Windows кодировке; читаемый текст может быть размеров в 2 ГБ; открывает файлы Word, Html;
- возможность регулировать скорость чтения, высоту голоса, громкость и пр.;
- возможность записывать читаемый текст в формат MP3 (кстати, записывать можно с повышенной скоростью);
- программа автоматически перелистывает странички (текст) книги по мере чтения (и показывает его вам);
- есть возможность корректировать отдельные слова и словосочетания, как их нужно правильно проговаривать;
- при закрытии программы — она автоматически запоминает последнюю позицию курсора;
- полностью на русском языке, работает во всех современных версиях Windows 7, 8, 10.
Demagog
Эта программа 2 в 1: это и текстовые редактор с поддержкой Юникода, и синтезатор речи (т.е. софт для озвучивания текста) с поддержкой SAPI4 / SAPI5 (прим.: о движках см. во второй части статьи). Программа отличается от многих своих конкурентов, т.к. при ее разработке были использованы специальные алгоритмы словарных замен, которые сказываются на правильности произношения читаемого текста. Так же в Demagog реализована бессловарная проверка орфографии.
Demagog — пример чтения // главное окно
Основные возможности программы:
- чтение текстов из различных форматов: MS Word, E-Book и HTML (поддержка импорта рисунков);
- возможность записи аудиофайлов в форматы: WAV, MP3, OGG, WMA, MP4;
- возможность подключения пользовательских аудиокодеков;
- подсветка орфографических ошибок;
- поддержка словарей произношения (формат DIC), возможность их редактирования;
- поддержка русского языка на 100%;
- работает в OS Windows XP, Vista, 7, 8, 10 (32/64 bits).
Balabolka
Основное предназначение программы «Балаболки» — это чтение «живым человеческим» голосом текстов книг, документов и т.д. Для чтения могут использоваться любые голосовые движки, которые установлены у вас на ПК.
- помимо «обычного» чтения (как умеют другие утилиты), «Балаболка» может читать текст из буфера обмена, показывать текст из различных документов, произносить набираемый на клавиатуре текст;
- поддерживает просто огромное число форматов файлов: AZW, AZW3, CHM, DjVu, DOC, DOCX, EPUB, FB2, HTML, LIT, MOBI, ODT, PDB, PDF, PRC, RTF, TCR, WPD;
- может проверять орфографию, делить большие документы на несколько маленьких, искать омографы;
- текст можно сохранить в формате аудиофайла форматов: WAV, MP3, MP4, OGG и WMA;
- умеет работать с пакетами от Microsoft Speech API (SAPI);
- можно изменять скорость и тембр речи;
- полная поддержка русского языка;
- ОС: Microsoft Windows XP/Vista/7/8/10.
ICE Book Reader
ICE Book Reader — это одна из самых мощных программ для чтения текстов (как в слух, так и просто с экрана ПК). Одно из главных достоинств: программа бережет ваше зрение, давая возможность настроить отображение текста из книги так, чтобы вам было максимально удобно (размер шрифта, отступы, цвет и т.д. — десятки всевозможных параметров).
Пример чтения книги
Что касается чтения книг вслух за пользователя — то ICE Book Reader это, разумеется, умеет делать (иначе бы я не включил ее в обзор). Поддерживает голосовые движки SAPI4 и SAPI5.
Кроме чтения, может создавать MP3/WAV файлы из книги (которые затем можно прослушать на любом MP3 плеере). При создании MP3 книг, кстати, не нужно хранить WAV файлы большого размера — программа на лету конвертирует их в MP3. Кстати, благодаря мульти-поточному ядру, программа может очень быстро создать аудиокнигу: несколько модулей синтеза речи (SAPI) могут одновременно «наговорить» на целую книгу.
Ну и последнее, ICE Book Reader позволяет навести порядок на жестком диске с книгами: способа управлять информацией 250000 книг! Программа работает во всех популярных версиях Windows: XP, 7, 8, 10.
Говорун
Сайт разработчика: http://govorunplus.narod.ru/
Простая и надежная программа, построенная на технологии MS Agent 2.0. Для синтеза речи может использовать любые SAPI-движки, которые есть в вашей системе. Дизайном программа не блещет, зато выполнена достаточно оригинально (скрин ниже). Да и программа достаточно многофункциональна (так что это тот случай, когда делать выводы по первому взгляду — преждевременно!).
Говорун — чтение текста
- читает и сохраняет форматы файлов: TXT, RTF (можно подготовить в любой версии Word);
- возможность работы с командной строкой;
- возможность интеграции в проводник, чтобы читать текст по правому клику по файлу (поддерживается только Win 98/ME, NT, 2000, XP);
- есть встроенный плеер медиа-файлов;
- в программу встроены анекдоты, афоризмы, юмор и пр. — никогда не даст заскучать;
- воспроизводимую речь можно записать в WAV-файл;
- программу можно настроить по себя: цвет, дизайн, шрифты и пр.;
- на русском языке, работает в Windows XP, 7, 8, 10.
RussAcc
Сайт разработчика: http://bzsoft.spb.ru/russacc.html
Очень быстрая и удобная программа для чтения вслух текстов и созданий аудиокниг (форматов много, особенно по сравнению с аналогичным софтом: wav, mp3, amr, aac). Кроме этого, программа позволяет правильно расставлять ударения в текстах и читать книги с экрана ПК. В программу встроен редактор и любой воспроизводимый ей текст — вы можете редактировать.
Главное окно программы // RussAcc
В настройках программы можно задать размер шрифта, указать цвет, которым выделять читаемый кусок. Можно указать и настроить параметры записи MP3: битрейт, кол-во бит и пр.
RussAcc поддерживает и работает со всеми популярными звуковыми движками. В своей же базе у программы для каждого слова есть особые его формы с ударениями в различных ситуациях (более 3 миллионов форм!).
Кстати, RussAcc поддерживает такой популярный формат электронных книг, как fb2 (а также может его конвертировать в обычный txt-файл). Поддерживает русский язык, совместимы с новыми ОС Windows 7, 8.1, 10.
Голосовые движки: мужские и женские
Движки синтеза речи — это специальное ПО, своего рода драйвера, необходимые для того, чтобы компьютер мог «заговорить» (т.е. для преобразования текста в речь). Движков сейчас в сети сотни: есть как платные, так и бесплатные. Наилучшее качество чтения, конечно же, показывают платные движки.
Важное замечание : движок синтеза речи не имеет никакого дизайна или интерфейса. После его установки в систему — вы не заметите ровным счетом никаких изменений! Чтобы работать с движком — вам нужна какая-нибудь программа для чтения текстов: Балаболка, Говорун, Ice Reader и пр., чуть выше я приводил те, которые «мне по душе» ✌).
Вот поэтому, кстати, часто пользователи ругают ту или иную программу, что она не может прочитать русский текст (или вообще не может). Просто они забывают о необходимости установки речевого движка.
Пару слов про стандарты.
Голосовые движки могут быть выполнены в разных стандартах (так называемых), самые основные три: SAPI 4, SAPI 5 или Microsoft Speech Platform (примечание: почти в каждой программе для чтения, вы можете выбрать речевой движок).
Добротный стандарт, был актуален десяток лет назад. На сегодняшний день устарел, и на современных компьютерах/ноутбуках его использование не оправдано.
Почти все современные голосовые движки построены на этом стандарте (как платные, так и бесплатные). Наиболее популярный стандарт, можно найти движок с мужским, женским, детским голосами.
Microsoft Speech Platform
Microsoft Speech Platform – большой набор инструментов для разработчиков, которые позволяют реализовывать возможность преобразования текста в речь.
это набор инструментов, позволяющих разработчикам различных приложений, реализовывать в них возможность преобразования текста в голос.
Примечание! Чтобы синтезатор речи работал, необходимо:
Microsoft Speech Platform — Runtime – серверная часть платформы, предоставляющая API для программ;
Microsoft Speech Platform — Runtime Languages – языки для работы серверной части.
Несколько голосовых движков
Тext-to-speech engines Дигало // Николай
Очень популярный русский голосовой движок (голос мужской!). Подойдет для большинства программ, которые умеют читать текст голосом. На мой скромный взгляд, один из лучших общедоступных движков для синтеза речи (на русском языке). Кроме русского, кстати, на сайте разработчика доступны движки еще для нескольких языков. Минус : без регистрации работает всего две недели.
Acapela // Голосовой движок (модуль) Алена
Алёнка — относительно новый русский женский речевой движок от компании Acapela. Работает по стандарту SAPI-5 с частотой 22 КГц. Некоторые пользователи считают, что голос у «Алены» приятнее, чем у «Николая».
Голосовой движок (модуль) Катерина 2
Компания разработчик: ScanSoft RealSpeak
Довольно неплохой речевой движок с женским голосом. После доработки движка, он стал сопоставим с «Николаем». Существенному обновлению подверглась фонетическая база движка, изменен алгоритм постановки ударений (что положительно сказалось на звучании), устранена проблема со скоростью произношения.
RHVoice
RHVoice — это многоязычный синтезатор речи с открытым исходным кодом. Можно использовать в ОС Windows и Linux. Синтезатор совместим с SAPI5. Разработчик синтезатора — Ольга Яковлева.
Кстати, движок основан на речевой базе, записанной дикторами. Русские голоса «Елена» и «Ирина» доступны для скачивания на официальном сайте.
IVONA Tatyana/Maxim
Очень интересные молодые голосовые движки (их 2: мужской и женские голоса). Многие считают голос Татьяны одним из лучших (если не самым лучшим!). По ссылке выше, можно заслушать как будут звучать ваши тексты, так сказать, портфолио (на мой взгляд, очень приятно звучат).
Станет ли движок самым используемым — не знаю, время покажет!
Кстати, как думаете, будет ли когда-нибудь разработан речевой движок, который не отличишь от голоса обычного человека? Или может он уже есть, а я о нем не слышал. (скиньте название!)