LINUX.ORG.RU

Недавно искал нечто похожее. В итоге пришел к выводу, что проще самому начитать.

Но вообще, послушайте как звучит та же самая тестовая фраза от rhasspy:

https://dropmefiles.com/HejVz

Если звучание приемлемое, то:

https://github.com/pndurette/gTTS https://gtts.readthedocs.io/en/latest/

Кратко:

sudo apt update && sudo apt install python3-pip && sudo pip3 install gTTS

Then we do the following: sudo nano ~/.profile And we add this line export PATH=«$HOME/.local/bin:$PATH»

To convert (in this case to mp3) a text file, we do:

gtts-cli -f text.txt --output audio.mp3 --lang ru

Разумеется, это не оффлайн. :( Есть опции: https://gtts.readthedocs.io/en/latest/cli.html

INX
()
Ответ на: комментарий от dataman

Возможно, человек ищет оффлайн, чтобы заморачиваться с регистрацией на каких-либо сервисах, и уж тем более с их оплатой.

В данном случае всё это работает без регистрации. В каких объемах - не проверял.

Ну и в любом случае, исхожу из того, что может кому пригодится. Не обязательно только автору темы.

INX
()
Ответ на: комментарий от INX

Кстати, если предполагается некоторый бюджет

он может и предполагаться, но в итоге должно быть оффлайн

попробовать в онлайн, если без регистраций, нашел https://apihost.ru/voice, очень неплохо, но по условию задачи не подходит

x905 ★★★★★
() автор топика

Звучит субъективно лучше silero. У последнего беда с мужскими голосами. Пощупать bark, как-то не довелось — его не прикручивали к Демагогу, что по своему тоже показатель.

Это же не для генерации аудиокниг? Из-за «любительских» голосов они как-то не очень для этой цели. Балаболка+Yuri Harpo звучит для меня лучше, чем silero и piper, не в последнюю очередь из-за возможности настроек пауз и профессионального диктора в основе, несмотря на менее живое звучание. Хотя в случае Piper надрессировать «правильную» модель проблем вроде нет.

ps. Не, в примерах барк не особо звучит, а у piper плавает скорость и высота речи относительно silero, но возможно это из-за запуска под wine.

luiswoo
()
Последнее исправление: luiswoo (всего исправлений: 2)
Ответ на: комментарий от luiswoo

попробовать bark и silero гдето можно без погружения в питон и модели ?

Это же не для генерации аудиокниг?

нет, нужно 2-3 предложения

у piper плавает скорость и высота речи относительно silero, но возможно это из-за запуска под wine

piper же нативно запускается, зачем тут wine ?

x905 ★★★★★
() автор топика
Ответ на: комментарий от x905

попробовать bark и silero гдето можно без погружения в питон и модели ?

https://huggingface.co/spaces/suno/bark

А ухудшенные, но более быстрые модели silero в коллабе. На mytts говорили, что более качественное они подспрятали. Но проще и быстрее скачать сборку https://aloys.narod.ru/sof/1/demagog.htm (где-то внизу) — работает в wine без видимых проблем (для одной задачи — другое не пробовалось). Если имелось ввиду что-то типа докера, то не знаю.

piper же нативно запускается, зачем тут wine ?

Мне нужна программа для создания аудиокниг. Экспериментальная сборка Демагога с piper — это самый простой вариант.

нет, нужно 2-3 предложения

Тогда и особого смысла связываться с silero нет. Они с piper примерно одинаково лажают с ударениями, а у silero новых публичных голосов скорей, из-за огороженности, всего и не появится.

luiswoo
()