LINUX.ORG.RU

Для всех интересующихся компьютерным синтезом речи - голоса Cepstral


0

0

Один из самых качественных вариантов синтеза речи, - от фирмы Cepstral, -уже довольно давно доступен для скачивания в виде демо-версии. Помимо платформы Linux, есть поддержка таких платформ: Mac OS X, Windows и WindowsCE. Языки, на которых возможен синтез: американский и британский (по акценту) варианты английского, итальянский, канадский вариант французского, немецкий, американский вариант испанского. К сожалению, русский язык не поддерживается.

Есть Festival Wrapper (http://cepstral.com/cgi-bin/downloads...) - Perl-скрипт, который позволяет иметь доступ к голосам Cepstral Swift из Festival.

>>> Подробности



Проверено: Shaman007 ()

Это premium качество?... :-( Чувствую, не скоро ещё нормальный синтез будет доступен... :'-(

Atrus
()
Ответ на: комментарий от anonymous

> Без русского то языка?

Как раз для ATT есть русский :)

> Это premium качество?... :-(

А разве плохо? Не знаю как другие языки, но английский (как в британском так и в американском варианте) у Cepstral - неплохой. Только надо настроить громкость, темп, тембр (ничего не забыл?). А сам акцент очень даже натуральный.

anonymous
()
Ответ на: комментарий от anonymous

> А разве плохо?

По крайней мере я так слышу. Голос дрожит... Не знаю, может, если прикручивать движок к своему проекту, предавать в него больше информации, чем просто текст, то можно вытянуть... А так... Ну не похож он на настоящий. :-( А хотелось бы просто услышать, что хоть самые наворочненные и дорогие сумели подойти к неотличимому от настоящего синтезу.

P.S. Ты его не стандартную фразу заставляй говорить, пусть скажет: "Black cat sit on the mat and eat the fat rat." ;-)

atrus ★★★★★
()
Ответ на: комментарий от atrus

> Ты его не стандартную фразу заставляй говорить, пусть скажет: "Black cat sit on the mat and eat the fat rat."

Кого именно? Там целая куча голосов и довольно разных.

> Ну не похож он на настоящий. :-( А хотелось бы просто услышать, что хоть самые наворочненные и дорогие сумели подойти к неотличимому от настоящего синтезу.

Ну, "неотличимый" обычно только в MP3-демках ;). Но я из коммерческих, платных, - но при этом доступных для скачивания в виде рабочих демок, - знаю только: Cepstral и Digalo. Причём Digalo вроде только для Windows. Зато есть русский с фиговыми (типично французскими - на последний слог) ударениями (их можно поправить, но это очень долго).

А вообще голоса Cepstral всё же лучше, чем, допустим, Microsoft Sam.

LeOptic
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.