Синтез речи для mac os

Содержание

Как я искал, и нашел русский голос для Mac OS
Русские не сдаются
Позабыты хлопоты, остановлен бег, вкалывают роботы, а не человек.
Цена решения
Тестируем
Резюме
Речь и VoiceOver в Mac OS X на русском язке
Как синтез речи появился на ПК
Синтезатор DECtalk
S. A. M. — Software Automatic Mouth

Как я искал, и нашел русский голос для Mac OS

Будучи пользователем PC я активно использовал «голосовые»решения.

Различные читалки и голосовые конвертаторы текста, переводя в «голос» интересные мне статьи и книги и слушая их на ходу с плеера или с компа перед сном. Это превратилось в устойчивую привычку, которая позволяла мне приятно и с пользой проводить время прогулок и дальних поездок. Около года назад, купив практически одновременно Macbook Air и iPhone, я с удивлением обнаружил такой факт:
С одной стороны Mac имеет прекрасную и глубоко интегрированную в ОС голосовую службу. Множество прекрасных встроенных голосов.
С другой стороны, русского голоса для мака нет!

Русские не сдаются

Я сгенерировал много поисковых запросов на русском и английском языках. И нашел некоторое количество интересной информации.
Во первых, не я один такой страждущий.
Во вторых, голоса действительно НЕТ!
В третьих, я нашел информацию, которая указывала, что какие то работы по созданию русского голоса для Mac от Acapela все же ведутся.

Я написал на английском и русском языках письмо в Acapela в том духе:
«Как же так? Популярность маков в Росии растет… А голоса нет?! Ведется ли такая работа?
И если да, то когда, где и за какие деньги я могу его получить. „
Ответа на своё письмо я так и не получил до сих пор.

Кстати, не так давно Acapela закончилa off-line приложение-переводчик iSpeak для iPhone за $1.99 с голосовым синтезом переведенного текста.

Но я не отчаялся.

Позабыты хлопоты, остановлен бег, вкалывают роботы, а не человек.

Что делать? Может я что-то пропустил?
Я решил сформировать поисковый запрос используя службу Google Web Alert. Хорошая вещь, я вам доложу, хотя все же средства для создания запроса, менее развитые чем в меню расширенного поиска.
И из-за этого к вам может приходить довольно много различного «мусора» или дублированная информация. Но все же сервис удобный, рекомендую к использованию.
В течении почти что года, из каждодневных отчетов службы, я выловил два «зернышка».
Нашлось целых две иностранные некоммерческие системы, которые пытаются развивать в том числе и свой русский голос для мака. Интересующимся скажу сразу. Установка их, дело нетривиальное и заморачиваться с установкой я не стал. В основном потому, что авторы честно признавались, что хотя система и рабочая, но синтез пока еще не очень совершенный и т.д.
И вот о чудо! Сегодня утром я получил очередное письмо от поисковика, которое содержало вот что:

“Google Web Alert for: Русский голос для Mac
Z-Store: Разве Мак говорит по-русски? Да, уже говорит.
Но что самое важное — версия iVox 1.3 наконец-то получила русский голос.… Для работы с русским языком программа требует установленной Mac OS X 10.5 и . »

Цена решения

Цена немалая, просят то ли $99, толи €99 (написано как то невнятно), идем и сравниваем с решениеми для других языков.
Хорошо бы, чтоб для русского языка появился вот такой пакет:
«Infovox iVox and GhostReader bundle
(includes Infovox iVox and GhostReader for one language of choice)
Single user license (non-Scandinavian language)» по цене US$ / Euro 109
т.е. мы имеем решение интегрированное в систему, и одновременно программу умеющую создавать аудиотреки для iTunes и аудиокниги.

Собственно имея mp3 файл, я уже около года создаю аудиокниги с помощью замечательной программки Audiobook builder, читаем про неё тут.
Программа недорогая, т.е. примерно 10$, что она стоит, она отрабатывает на славу. Мои аудиокниги в iPhone прекрасно оформлены и удобны в навигации.

Тестируем

Как говорит всем известный Бобук: «Все хорошо»
В самом деле, нам обещан тот же, хорошо знакомый многим, голос «Алена», завернутый в маковскую оболочку.
На PC голос звучит неплохо, попробуем его на маке. Конечно среди американских голосов есть голоса намного лучше, есть харАктерные голоса. Есть даже поющие голоса!
Но мы рады и этому.
Установочный пакет содержит два голоса, американский и русский.
Весит 325 Мб, отдается на хорошей скорости.
Загрузить демо-версию с русским голосом (326 МБ)
При установке потребуется 301 Мб места на диске, оставшиеся 24 Мб, это несколько видеоуроков включенных в пакет.
Версия полнофункциональная, но с ограничением 30 дней, что помоему совсем немало для тестирования.
Установка заняла около 2х минут и потребовала регистации (необязательно помоему) и перезапуска компьютера, что тоже неудивительно, учитывая глубокую интеграцию в ОС.
Перезагрузка и… И ничего!
Любая попытка запустить голос в любом приложении вызывает перезагрузку приложения.
Пробую посмотреть «Речь» в системных настройках.
Как только открываю этот раздел, перезагружаются и системные настройки.
Причем видно в панели некоторое время «загружаю голоса»
Вероятно сам голос и является причиной этого безобразия.
Впервые я встречаю такое «суровое» маковское приложение.
Ну что же, в комплект пакета входит и Uninstaller.
Если ничто так и не поможет, то попробую воспользововаться им.

А так хотелось закончить на позитивной ноте.

Резюме

За год я привык жить без русского или любого другого голоса на компьютере.
Для единственной PC программы которая мне нужна по работе и достойного аналога которой я не могу найти для MAC OS, я приобрел Parallels (кстати, сейчас на неё еще действует скидка в 20%) и как следствие могу прикрутить к маку любую «оконную» программу, а уж там то полно недорогих голосовых решений.
Ну и наконец, появились платформо независимые on-line сервисы трансляции текста в голос.
Есть такие и для русского языка. Например Ubot
Но пусть каждый сам сделает свой выбор.
Еще одно предположение, в перспективе выход Mac Os 10.6, может там мы сможем получить встроенный русский голос хорошего качеста? Учитывая, что Россия в последнее время все более становится полноценным членом Mac сообщества. Какие у кого есть мысли по этому поводу?

P.S.
Я думал, стоит или не стоит писать статью, имея ввиду неудачу с инсталяцией программы?
Решил написать по той причине, что возможно описанная проблема, это мои персональные грабли, и у других действително все будет хорошо.
С подачи makoomazan перенес топик из блога Apple в блог Mac OS X

Благодарности: признателен no_smokin автору Хабраредактора. Хабраредактор я оформил в виде «веб приложения» с помощь программки Fluid и с огромным удовольствием использовал при написании статьи.

Источник

Речь и VoiceOver в Mac OS X на русском язке

Я кое-что делал для iPhone и столкнулся с интересными «вещами». Эти «вещи» я быстренько приспособил для Mac OS X (развлечения ради), и вот, что получилось… Функционал «Речь» и VoiceOver в Mac OS X на русском языке. Кому-то это может оказаться полезным. Применений можно найти множество, но всё зависит от потребностей.

Эту маленькую статью я разобью на две части. Одна часть для обычных пользователей, которые просто хотят установить поддержку русской речи в Mac OS X. И для начинающих разработчиков, которым я расскажу, как устроен модуль и предоставлю исходные коды.

Для обычных пользователей

Системные требования:

Mac OS X 10.6
Подключение к сети Интернет

Папку «ruSynthesizer.SpeechSynthesizer» необходимо скопировать в папку
/Library/Speech/Synthesizers

Папку «Vasilisa.SpeechVoice» необходимо скопировать в папку
/Library/Speech/Voices

Если какой-то из папок нет, то её нужно создать. Активировать Василису можно в System Preferences (Системные настройки) > Speech (Речь).

Минусы:

Необходимо быстрое подключение к сети Интернет
Низкое качество звука
Длинные тексты не озвучиваются

Для начинающих разработчиков

Мы ничего не будем изучать и придумывать, а просто возьмём «готовое» и вылепим из него синтезатор за 5 минут.

Microsoft развивает семимильными шагами веб-сервис Microsoft Translator (бета). Одно из нововведений во второй версии — озвучивание текста на русском языке. Будем использовать этот веб-сервис.

Мы не будем детально изучать и вдаваться в подробности «Speech Synthesis Manager Reference» и «Speech Synthesis Programming Guide» от Apple, а возьмём готовый пример — SynthesizerAndVoiceExample. Этот пример есть в пакете Xcode v3.1.4. Этот пакет, чтобы достать из него примеры, можно загрузить с сайта Apple. В более поздних версиях Apple удалила все примеры, но выложила их у себя на сайте (SynthesizerAndVoiceExample выложить забыла).

По сути нам лишь нужно немного изменить несколько методов (буквально несколько строк в каждом методе) в файл SynthesizerSimulator.m проекта SynthesizerAndVoiceExample:

— (id)init;
— (void)startSpeaking:(NSString *)string;
— (void)stopSpeaking;
— (void)sound:(NSSound *)sound didFinishPlaying:(BOOL)aBool;

Самые главные изменения в методе startSpeaking. Мы просто делаем запрос к веб-сервису Microsoft и получаем звуковой файл.

Дополнительно, вам необходимо поставить свой appId при обращении к веб-сервису Microsoft. Его можно бесплатно получить по ссылке http://www.bing.com/developers/createapp.aspx

Изменяем описание голосового модуля для синтезатора Info-VoiceCF1.plist. Изменяем имя, локаль и диапазон произносимых символов. Готовый файл можно взять из финального проекта
http://www.yuriev.info/synth.zip

Всё, базовый синтезатор готов. 5 минут работы, а кому-то может оказаться очень полезным.

Источник

Как синтез речи появился на ПК

В прошлый раз мы рассказали о цифровых синтезаторах речи и вспомнили, как в 1974 году Дональд Шерман (Donald Sherman), страдающий от паралича мышц лица, впервые использовал компьютер с системой Text-to-Speech, чтобы заказать пиццу по телефону. Тогда синтезатор работал на мейнфрейме, установленном в лаборатории Мичиганского государственного университета. Но с развитием технологий и появлением персональных компьютеров, TTS-решения стали мобильнее.

Расскажем о некоторых ранних разработках того времени.

Фото Springsgrace / CC BY-SA

Синтезатор DECtalk

В 1981 году профессор Деннис Клатт (Dennis Klatt) из MIT связался с Digital Equipment Corporation, чтобы обсудить перспективы разрабатываемого им алгоритма для конкатенативного синтеза речи. Такая система соединяет в цепочку заранее записанные сегменты естественной речи. Представители компании увидели потенциал в наработках Клатта и решили использовать их, чтобы выпустить на рынок собственный голосовой синтезатор. Разработка велась три года, за которые проект успел дважды сменить название — с KLATTALK на CLATTER и, наконец, на DECtalk.

Релиз состоялся в 1984 году — корпус девайса был немногим больше кота. Устройство подключалось к любой вычислительной системе с асинхронным последовательным портом (COM-порт), а его поздние версии — к шине ISA. Также оно имело разъёмы для соединения с телефонной линией.

Эта особенность позволяла автоматизировать работу со входящими и исходящими звонками. Машина умела говорить девятью голосами: четырьмя мужскими, четырьмя женскими и одним детским. Каждый из голосов пользователь мог донастроить самостоятельно — изменить высоту звука и модифицировать передаточную функцию головы (стр.61). Более того, система позволяла корректировать произношение слов. Благодаря этой особенности её можно было научить петь.

Как и установка из Мичиганского государственного университета, DECtalk нашла применение в качестве «речевого протеза». Решение DEC было установлено в кресле известного астрофизика Стивена Хокинга вплоть до 2018 года. Тогда команда инженеров из Кембриджа заменила «ретрочип» на Raspberry Pi, но сохранила звук и интонации, генерируемые старым синтезатором, — так как ученый к ним привык.

В 90-х в компании DEC решили продать лицензию на технологию разработчиками сторонних аудиоустройств. Например, чип DECtalk стал частью звуковой карты Sound Blaster AWE32 (о реплике её прародителя мы писали у себя в блоге). В комплекте шло специализированное ПО TextAssist.

DECtalk стал довольно успешным продуктом. Однако по ряду причин Digital Equipment Corporation передали права на эту торговую марку компании Force Computers. Та, в свою очередь, перепродала её Fonix Speech, которая сегодня известна как SpeechFX. Она до сих пор предлагает синтезаторы речи на базе DECtalk для встраиваемых устройств.

S. A. M. — Software Automatic Mouth

В 1982 году разработчик Марк Бартон (Mark Barton) выпустил S. A. M. Это — один из первых коммерческих программных синтезаторов речи для 8-битных вычислительных систем: Atari 8-bit, Commodore 64 и Apple II.

В первом случае S. A. M использовал встроенный аудиочип POKEY. Его возможности позволяли создавать полифоническую музыку и эффекты в играх. И его реализация до сих пор используется в ряде эмуляторов, например MAME. В случае с Commodore 64 была задействована встроенная SID-схема с 4-битным ЦАП, что отрицательно сказалось на качестве воспроизведения речи.

Фото Federica Galli / Unsplash

Что касается версии для Apple II, то синтезатор работал со стандартной расширительной платой и 8-битным цифро-аналоговым преобразователем. Позже S. A. M. появился и на первом компьютере Macintosh. Стив Джобс лично настоял на том, чтобы программа вошла в раннюю версию Mac OS. Компания заключила партнерское соглашение с Бартоном, и его разработка, сменив название на MacInTalk, стала частью экосистемы «яблочной корпорации».

Новинку сразу включили в презентацию компьютера в 1984 году. Машина самостоятельно представила себя на сцене, начав с фразы: «Hello. I’m Macintosh».

«Привет, я Macintosh. Как же хорошо выбраться из этой сумки.

Я не привык к публичным выступлениям, но хотел бы поделиться с вами мыслью, которая впервые пришла мне, когда я увидел мейнфрейм IBM: „Не доверяйте компьютеру, который не можете поднять“.

Я бы мог говорить и дальше, но предпочту посидеть и послушать. С гордостью представляю вам человека, который стал для меня отцом… Стива Джобса».

Сегодня S. A. M. почти нигде не используется и служит историческим наследием — в сети можно найти веб-версию синтезатора (и код на GitHub). Хотя в 2017 году инди-разработчики из Airdorf Games использовали инструмент для озвучивания персонажей в компьютерной хоррор-игре Faith.

Разумеется, это не все — лишь одни из первых — синтезаторы речи для ПК, выпущенные на рубеже веков. Но они проложили дорогу современным решениям, которые звучат более реалистично. Об используемых в них технологиях мы продолжим рассказывать в следующем материале.

Дополнительное чтение из нашего корпоративного блога «Мир Hi-Fi»:

«Машинный звук»: синтезаторы на базе нейросетей
История аудиотехнологий: синтезаторы и сэмплеры
Как устроен Sporth — ЯП для музыкальных live-сессий
Траутониум: немецкая волна в истории синтезаторов
Где взять аудиосемплы для ваших проектов: девять тематических ресурсов

Источник