Установка и настройка TTS RHVoice на Ubuntu 13.03
TTS RHVoice на текущий момент, я считаю самым лучшим из бесплатных голосовых движков для озвучки русского текста. Я сравнивал все бесплатные и платные TTS движки и этот показал лучшие результаты. При этом его сборка обычно не вызывает проблем. Жаль, что развитие этого движка идет довольно медленно, а вся доступная информация находится в Email листах рассылки. Так что пока довольствуемся тем — что есть.
Установка RHVoice
Стянуть исходники в текущий каталог:
Распаковываем движок, переходим в его каталог и запускаем компиляцию (сборку исходников):
При успешной установке видим сообщение: scons: done building targets..
Ошибка: RHVoice: error while loading shared libraries: libRHVoice.so.0: cannot open shared object file: No such file or directory скорее всего означает, что вы забыли выполнить sudo ldconfig .
Не удаляйте папку, в которой велась сборка — все сломается!
Использование
Все должно пройти гладко) Проверим.
Озвучить русский текст из консоли:
Озвучить русский текст под Manjaro:
Сохранить озвучку в файл:
Конфигурация и опции
Конфиг по умолчанию располагается в /usr/local/etc/RHVoice/RHVoice.conf или /etc/RHVoice/RHVoice.conf.
Документация по конфигу:
Удаление
Для удаления RHVoice переходим в каталог (который мы распаковали) и выполняем:
После этого нужно ручками подчистить файлы, иначе DEB-пакет не устанавливается:
Источник
Как установить RHVoice на Ubuntu Bionic
Заметка (RHVoice — голосовой движок ) по мотивам ранее написанной и практически используемой на Ubuntu Trusty, но сейчас оптимизированная для Ubuntu 18.04 Server amd64
Ведь работать данная заметка будет в паре с сервисом личной настройки своего «Умного Дома» на базе MajorDoMo. А как поставить MajorDoMo на Ubuntu 18.04 Server смотрите здесь (), я ведь использую только самолично настроенное, а не готовые сборки не пойми кого, чтобы не задавать на профильных ресурсах вопросы, у меня это не работает, почему?
$ hg clone —insecure https://172.35.35.8/hg/dproject
$ sudo apt-get install scons gcc git flite flite1-dev expat libunistring-dev libsox-dev libpulse-dev libao-dev build-essential libc6-dev g++-multilib -y
$ sudo git clone https://github.com/Olga-Yakovleva/RHVoice /usr/src/rhvoice
Cloning into ‘/usr/src/rhvoice’.
remote: Enumerating objects: 9154, done.
remote: Total 9154 (delta 0), reused 0 (delta 0), pack-reused 9154
Receiving objects: 100% (9154/9154), 316.04 MiB | 2.69 MiB/s, done.
Resolving deltas: 100% (5302/5302), done.
Checking out files: 100% (1345/1345), done.
ekzorchik@srv-bionic:/usr/src/rhvoice$ sudo scons
ekzorchik@srv-bionic:/usr/src/rhvoice$ sudo scons X11=no
ekzorchik@srv-bionic:/usr/src/rhvoice$ sudo scons install
ekzorchik@srv-bionic:/usr/src/rhvoice$ sudo ldconfig
ekzorchik@srv-bionic:/usr/src/rhvoice$ cd
- Звуковые профили голоса: /usr/local/share/RHVoice/voices/
- Конфигурационный файл: /usr/local/etc/RHVoice/RHVoice.conf
- Файлы голосового движка: /usr/local/share/RHVoice/
- Звуковые профили на иностранных языках: ekzorchik@srv-bionic:
English Esperanto Georgian Kyrgyz Russian Tatar Ukrainian
- Звуковые профили кто произносит: ekzorchik@srv-bionic:
alan anatol azamat clb irina natia slt talgat
aleksandr anna bdl elena natalia nazgul spomenka
$ sudo nano /usr/local/etc/RHVoice/RHVoice.conf
; Список голосовых профилей. Первым в профиле указывается основной
; голос (он будет читать числа и другой текст, для которого не удаётся
; автоматически определить язык). Далее следуют дополнительные
; голоса. Если в профиле заданы два голоса, чьи языки имеют общие
; буквы, то второй будет использоваться только в том случае, когда
; программа экранного доступа специально запросит использование
Чтобы проверить работу офлайного голосового движка RHVoice я сперва разверну Ubuntu 18.04 Server внутри Virtualbox на основной системе Ubuntu 18.04 Desktop ноутбука Lenovo E555, т. к. у меня уже был успешный опыт работы аудио под Virtualbox, подробнее смотреть заметку:
$ sudo apt-get install alsa alsa-tools lame -y
$ sudo adduser ekzorchik audio
Adding user ekzorchik’ to group audio’ .
Adding user ekzorchik to group audio
aplay: device_list:270: no soundcards found.
**** List of PLAYBACK Hardware Devices ****
card 0: Intel [HDA Intel], device 0: STAC9221 A1 Analog [STAC9221 A1 Analog]
Subdevice #0: subdevice #0
card 0: Intel [HDA Intel], device 1: STAC9221 A1 Digital [STAC9221 A1 Digital]
Subdevice #0: subdevice #0
$ lspci -v | grep Audio
00:05.0 Audio device: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) High Definition Audio Controller (rev 01)
Subsystem: SigmaTel 82801FB/FBM/FR/FW/FRW (ICH6 Family) High Definition Audio Controller
$ sudo nano /etc/modules
$ sudo modprobe -r snd_intel8x0
$ sudo modprobe snd_intel8x0
$ sudo lsmod | grep snd_intel8x0
snd_intel8x0 40960 0
snd_ac97_codec 131072 1 snd_intel8x0
snd_pcm 98304 5 snd_hda_intel,snd_hda_codec,snd_hda_core,snd_ac97_codec,snd_intel8x0
snd 81920 9 snd_hda_intel,snd_hwdep,snd_hda_codec,snd_hda_codec_idt,snd_ac97_codec,snd_timer,snd_intel8x0,snd_hda_codec_generic,snd_pcm
Теперь настал момент проверки работы аудиовоспроизведения под Virtualbox в текущей гостевой системе — Ubuntu 18.04 Server
$ sudo apt-get install moc -y
Копирую с основной систему в гостевую аудио файл для проверки воспроизведения:
$ scp /media/ekzorchik/own/02\ Midnight\ Rider.mp3 ekzorchik@172.33.33.25:/home/ekzorchik
02 Midnight Rider.mp3 100% 7442KB 26.0MB/s 00:00
Запускаю на гостевой системе проигрыватель и указываю на звуковой файл:
$ mocp 02\ Midnight\ Rider.mp3
Running the server.
Trying JACK.
Trying ALSA.
И аудио файл проигрывается из Ubuntu 18.04 Server amd64 основной системы Ubuntu 18.04 Desktop amd64 ноутбука Lenovo E555.
Так, а теперь проверяю, как будет работать офлайновый голосовой движок RHVoice установленный выше по заметке в текущую систему Ubuntu 18.04 Server amd64:
$ echo «Алиса, включи освещение в доме?» | RHVoice-test -t 1 -p Elena
default Engine is default
Воспроизведения не последовало.
Но не суть — это был эксперимент, никто и не надеялся, что под виртуализацией заработает проброс аудио как раньше.
Оформил данную заметку как скрипт, загрузил его к себе в Mercurial репозитарий, затем установил из него на основную систему Ubuntu 18.04 Desktop ноутбука Lenovo E555 и пробую как работает RHVoice:
$ echo day | RHVoice-test
default Engine is default
слово «day» воспроизвело.
А теперь с использование голосового профиля диктора:
$ echo «Алиса, включи освещение в доме?» | RHVoice-test -t 1 -p Elena
default Engine is default
Вполне себе ничего, стоит поиграться с настройками не будет такого отличительного металлического произношения.
Итого получается работоспособная заметка по установке RHVoice на Ubuntu 18.04 Server/Destkop
На этом у меня все с уважением автор блога Олло Александр aka ekzorchik.
Используйте прокси ((заблокировано роскомнадзором, используйте vpn или proxy)) при использовании Telegram клиента:
Поблагодари автора и новые статьи
будут появляться чаще 🙂
Карта МКБ: 4432-7300-2472-8059
Большое спасибо тем кто благодарит автора за практические заметки небольшими пожертвованиями. С уважением, Олло Александр aka ekzorchik.
Источник
Rhvoice ��� ������������ linux
Языковой пакет, версия 2.7.9 (Нужно устанавливать только если вы используете так называемый псевдо-английский режим с другими языками и не устанавливаете ни одного из английских голосов)
- Evgeniy-eng, версия 4.0.2007.9
- Alan, версия 4.0.2007.9
- Bdl, версия 4.1.2007.9
- Clb, версия 4.0.2007.9
- Slt, версия 4.0.2007.9
- Azamat, версия 4.0.1018.9
- Nazgul, версия 4.0.1018.9
- Volodymyr, версия 4.0.1011.9
- Marianna, версия 4.0.1011.9
- Anatol, версия 4.1.1011.9
- Natalia, версия 4.0.1011.9
- Aleksandr, версия 4.2.2009.13
- Aleksandr-HQ, версия 4.0.2009.14
- Yuriy, версия 4.0.2009.14
- Anna, версия 4.1.2009.13
- Evgeniy-rus, версия 4.0.2009.14
- Artemiy, версия 4.0.2009.14
- Tatiana, версия 4.0.2009.14
- Victoria, версия 4.0.2009.14
- Mikhail, версия 4.0.2009.14
- Arina, версия 4.0.2009.14
- Pavel, версия 4.0.2009.14
- Elena, версия 4.2.2009.13
- Irina, версия 4.1.2009.13
Языковой пакет, версия 2.7.2 (Нужно устанавливать только если вы используете так называемый псевдо-английский режим с другими языками и не устанавливаете ни одного из английских голосов)
- Evgeniy-eng, версия 4.0.2007.14
- Alan, версия 4.0.2007.13
- Bdl, версия 4.1.2007.13
- Clb, версия 4.0.2007.13
- Slt, версия 4.0.2007.13
- Azamat, версия 4.0.1018.13
- Nazgul, версия 4.0.1018.13
- Volodymyr, версия 4.0.1011.14
- Marianna, версия 4.0.1011.14
- Anatol, версия 4.1.1011.13
- Natalia, версия 4.0.1011.13
В большинстве случаев лучше устанавливать голоса непосредственно из основного приложения. Но если это по какой-то причине невозможно, вы можете установить языковые и голосовые данные, используя следующие пакеты:
Источник
Rhvoice ��� ������������ linux
RHVoice is a free and open-source speech synthesizer.
Speech synthesis method
RHVoice uses statistical parametric synthesis. It relies on existing open-source speech technologies (mainly HTS and related software).
Voices are built from recordings of natural speech. They have small footprints, because only statistical models are stored on users’ computers. And though the voices lack the naturalness of the synthesizers which generate speech by combining segments of the recordings themselves, they are still very intelligible and resemble the speakers who recorded the source material.
Initially, RHVoice could speak only Russian. Now it also supports:
- American English
- Brazilian Portuguese
- Esperanto
- Georgian
- Ukrainian
- Kyrgyz
- Tatar
- Macedonian
In theory, it is possible to implement support for other languages, if all the necessary resources can be found or created.
If you want to listen to an example of speech synthesis, You can use the TTS service on this page.
RHVoice supports the following platforms:
- Windows (prebuilt binaries is available here)
- GNU/Linux (building instructions can be found here. You can also look at packaging status.)
- Android (can be installed thru F-Droid or Google Play you can also download an APK consult this file)
It is compatible with standard text-to-speech interfaces on these platforms: SAPI5 on Windows, Speech Dispatcher on GNU/Linux and Android’s text-to-speech APIs. It can also be used by the NVDA screen reader directly (the driver is provided by RHVoice itself).
The main library is distributed under LGPL v2.1 or later. But it relies on MAGE for better responsiveness. MAGE is distributed under GPL v3 or later, so the combination is under GPL v3 or later. If you want to use the library in your program under GPL v2 or LGPL, compile the library without MAGE.
The following restrictions apply to some of the voices:
RHVoice Lab’s voices
All voices from RHVoice Lab’s site are distributed under the
You can send a request for integration of voice into any product to the laboratory’s e-mail address. If the approval is given by the speaker and our team you will get the appropriate permission.
Permission is hereby granted to use, copy, distribute and modify the product on condition that the product or its derivatives are not used commercially: you are not allowed to sell the product or its derivatives.
Regarding commercial use of the voice or any other use not listed here contact the developer acting as a representative of the rights holder.
Copyright (c) 2013 — 2018 Beqa gozalishvili, Olga Yakovleva, Vladimer urdulashvili
The Georgian voice can be used free of charge only by individuals for personal use.
Individuals can download voice from official sources of the project and use it for example with screen reading software or with software that can read text aloud.
Individuals can also redistribute the voice among other individuals by putting it on the network, portable devices or in any other way.
It is prohibited to copy, modify, distribute, sell or use this voice by Organizations and manufacturers for inclusion in their products or for any other use. To use the Georgian voice for such purposes, organizations and manufacturers must agree on the details with the copyright holders:
Copyright (C) 2018 — 2020 Olga Yakovleva, Fernando H. F. Botelho
See the documents in the licenses/voices subdirectory for more details.
About
a free and open source speech synthesizer for Russian and other languages
Источник
Rhvoice ��� ������������ linux
Language data package, version 2.7.9 (you only need to install this if you use the so-called pseudo-English mode with other languages and don’t install any of the English voices)
- Evgeniy-eng, version 4.0.2007.9
- Alan, version 4.0.2007.9
- Bdl, version 4.1.2007.9
- Clb, version 4.0.2007.9
- Slt, version 4.0.2007.9
- Azamat, version 4.0.1018.9
- Nazgul, version 4.0.1018.9
- Volodymyr, version 4.0.1011.9
- Marianna, version 4.0.1011.9
- Anatol, version 4.1.1011.9
- Natalia, version 4.0.1011.9
- Aleksandr, version 4.2.2009.13
- Aleksandr-HQ, version 4.0.2009.14
- Yuriy, version 4.0.2009.14
- Anna, version 4.1.2009.13
- Evgeniy-rus, version 4.0.2009.14
- Artemiy, version 4.0.2009.14
- Tatiana, version 4.0.2009.14
- Victoria, version 4.0.2009.14
- Mikhail, version 4.0.2009.14
- Arina, version 4.0.2009.14
- Pavel, version 4.0.2009.14
- Elena, version 4.2.2009.13
- Irina, version 4.1.2009.13
Language data package, version 2.7.2 (you only need to install this if you use the so-called pseudo-English mode with other languages and don’t install any of the English voices)
- Evgeniy-eng, version 4.0.2007.14
- Alan, version 4.0.2007.13
- Bdl, version 4.1.2007.13
- Clb, version 4.0.2007.13
- Slt, version 4.0.2007.13
- Azamat, version 4.0.1018.13
- Nazgul, version 4.0.1018.13
- Volodymyr, version 4.0.1011.14
- Marianna, version 4.0.1011.14
- Anatol, version 4.1.1011.13
- Natalia, version 4.0.1011.13
In most cases, you should use the main app itself to install the voices. But if this is not an option for any reason, you may install the language and voice data using the following packages:
Источник