TTS в онтопике.

0

1

Задался вопросом, а можно ли в 2025 году взять кусок книги/статьи/новости и попросить какую нибудь софтину зачитать его. Вроде бы уже пора...

На андроиде вопрос через жопу, но решается. А вот на линуксе вроде как по умолчанию рекомендуется Festival, но он же фактически неработоспособен! Говорить то вроде как умеет, но что это за идиотская политика вываливаться на каждом непонятном символе или английском слове или вообще знаке препинания? Быстрее самом начитать текст голосом чем отформатировать его в читаемую Фестивалем форму.

Есть какие то утилиты, способные переваривать произвольные новосные статьи с кучей англицизмов и аббривиатур и длинные книги? Желательно чтобы можно было запустить на Распберри Пи 4гб без видеокарты.

← Vitrualbox, Windows guest, 3D acceleration

не работает резолвинг через Amnezia VPN на WIFI →

Говорить то вроде как умеет, но что это за идиотская политика вываливаться на каждом непонятном символе…

Сначала, он был лучше. «Вываливаться» стал позже и чем дальше, тем хуже. Впрочем, когда писал свою «бубнилку», специальная функция в ней «форматировала текст». Но позже перешёл на rhvoice.

andytux ★★★★★
(11.05.25 12:54:46 MSK)

Ответ на: комментарий от andytux 11.05.25 12:54:46 MSK

RHvoise нужно собирать, а собирать под дебиан довольно тяжко. Особенно когда не хочется засирать систему...

Он хотя бы стоит того? На андроид я именно его и поставил, но там всякую пунктуацию, паузы и переключение языков и вывод в файл вроде как обрабатывает отдельная утилита. Без пульсы он сможет писать файлы напрямую?

kirill_rrr ★★★★★
(11.05.25 13:33:06 MSK) автор топика

И это в век, когда половина интернета завалена роликами с аишным голосом, которые даже умеют в интонации

PPP328 ★★★★★
(11.05.25 13:40:13 MSK)

Ответ на: комментарий от kirill_rrr 11.05.25 13:33:06 MSK

Репозиторий для *бунту: https://launchpad.net/~linvinus/+archive/ubuntu/rhvoice

andytux ★★★★★
(11.05.25 13:41:39 MSK)

мне кааатцо, сейчас прощеее андрюшкины говорилки запустить…

pfg ★★★★★
(11.05.25 13:57:33 MSK)

Ответ на: комментарий от PPP328 11.05.25 13:40:13 MSK

Ага, но не платить же какому нибудь яндексу за то что Алиса будет читать мне новости, которые ещё и грабить в файлы придётся.

kirill_rrr ★★★★★
(11.05.25 14:02:18 MSK) автор топика

Ответ на: комментарий от pfg 11.05.25 13:57:33 MSK

Мне тоже так показалось. Оказалось всё что больше 10-15 минут вываливается из памяти потому что андроид такой андроид.

kirill_rrr ★★★★★
(11.05.25 14:02:59 MSK) автор топика

Ответ на: комментарий от andytux 11.05.25 13:41:39 MSK

Ага, спасибо. Установилось и даже начало работать.

З.Ы. Кто бы мог подумать, что за собственно воспроизведение .txt отвечает RHVoice-test, который ставится из пакета speech-dispatcher-rhvoice и при этом оно не умеет альсу.

kirill_rrr ★★★★★
(11.05.25 14:56:03 MSK) автор топика
Последнее исправление: kirill_rrr 11.05.25 15:00:34 MSK (всего исправлений: 2)

Ответ на: комментарий от kirill_rrr 11.05.25 14:56:03 MSK

при этом оно не умеет альсу.

Когда весь цивилизованный мир переходит на трубопровод, цепляться за альсу это прямо таки лютое старообрядство.

ya-betmen ★★★★★
(11.05.25 15:07:09 MSK)

Ответ на: комментарий от ya-betmen 11.05.25 15:07:09 MSK

Но трубопровод тоже работает поверх альсы и не делает при этом ничего нужного! А этот светоч прогресса полез проверять jac и oss!

Кстати я наврал. Он умеет альсу, только неудачно попытался сконфигурировать карту или захватить её монопольно.

kirill_rrr ★★★★★
(11.05.25 16:53:04 MSK) автор топика
Последнее исправление: kirill_rrr 11.05.25 16:56:41 MSK (всего исправлений: 1)

Ответ на: комментарий от PPP328 11.05.25 13:40:13 MSK

Ну есть piper. Но он читает как говно

anonymous
(11.05.25 18:28:23 MSK)

Ответ на: комментарий от anonymous 11.05.25 18:28:23 MSK

А вот этот проектик прямо ВАУ. Распаковал и оно работает.

Но к сожалению качество звучания где то примерно на уровне RHVoice 1.8 на андроиде с утилитой, принудительно добавляющей паузы.

kirill_rrr ★★★★★
(11.05.25 19:26:55 MSK) автор топика

Ответ на: комментарий от kirill_rrr 11.05.25 13:33:06 MSK

RHvoise нужно собирать, а собирать под дебиан довольно тяжко.

Ну, жди пока кто-нибудь опакетит.

Особенно когда не хочется засирать систему…

А что, в дебиане mock ещё не придумали?

debugger ★★★★★
(11.05.25 19:37:03 MSK)

Ответ на: комментарий от debugger 11.05.25 19:37:03 MSK

Написано что он для сборки .rpm пакетов. Так что нет. checkinstall в дебиане либо всегда хреново работал, либо в дебиан 8 перестал нормально работать.

kirill_rrr ★★★★★
(11.05.25 19:46:24 MSK) автор топика

Ответ на: комментарий от debugger 11.05.25 19:37:03 MSK

Так то я поставил по совету версию 1.2 из ppa убунты и сам движок работает не хуже чем 1.8 на андроиде. Есть неприятная мелочь - читалка на адроиде работает черзе системный апи синтеза и добавляет свои фишки, а именно паузы между предложениями и строками. Вроде мелочь, а воспринимается сильно лучше. Ну и пультиязык в графическом конфигураторе лучше настроился.

kirill_rrr ★★★★★
(11.05.25 19:49:28 MSK) автор топика

Ответ на: комментарий от kirill_rrr 11.05.25 19:46:24 MSK

Написано что он для сборки .rpm пакетов.

mock, разумеется, для сборки .rpm. Я имел в виду какой-нибудь аналог, который позволяет строить .deb пакеты не засирая систему.

debugger ★★★★★
(11.05.25 23:11:02 MSK)

Это можно установить и использовать из консоли https://github.com/rany2/edge-tts
Качество терпимое.

theurs ★★
(12.05.25 10:46:21 MSK)

У мордокниги (запрещена в РФ) tts нейронка норм, в онтопике работает.

anonymous
(12.05.25 11:51:54 MSK)

Ответ на: комментарий от debugger 11.05.25 23:11:02 MSK

Чекинсталл, 50/50. Ну, сейчас скорее 1/20. Короче хрень.

kirill_rrr ★★★★★
(12.05.25 12:08:54 MSK) автор топика

Ответ на: комментарий от debugger 11.05.25 23:11:02 MSK

pbuilder. Похожая на mock штука.

anonymous
(12.05.25 12:23:33 MSK)

Silero https://github.com/snakers4/silero-models?tab=readme-ov-file#standalone-use

Из зависимостей только PyTorch

Корректировка ударений символом «+»

Корректировка остального через SSML https://github.com/snakers4/silero-models/wiki/SSML

anonymous
(19.05.25 10:53:02 MSK)

Ответ на: комментарий от anonymous 19.05.25 10:53:02 MSK

Говно. Числительные не может. И в мультиязык удобоваримо не может.

anonymous
(19.05.25 20:30:22 MSK)

Сегодня попробовал Coqui-ai TTS https://github.com/coqui-ai/TTS он заброшен, но работает неплохо

Для работы нужен python <= 3.11 (в убунте можно поставить через deadsnakes)

$ python3.11 -m venv tts_venv 
$ tts_venv/bin/pip install torch==2.5.1 tts # тут важно поставить старую версию torch, с новой не работает

$ tts_venv/bin/tts --text "Задался вопросом, а можно ли в 2025 году взять кусок книги/статьи/новости и попросить какую нибудь софтину зачитать его. Вроде бы уже пора...
На андроиде вопрос через жопу, но решается. А вот на линуксе вроде как по умолчанию рекомендуется Festival, но он же фактически неработоспособен! Говорить то вроде как умеет, но что это за идиотская политика вываливаться на каждом непонятном символе или английском слове или вообще знаке препинания? Быстрее самом начитать текст голосом чем отформатировать его в читаемую Фестивалем форму. 
Есть какие то утилиты, способные переваривать произвольные новосные articles с кучей англицизмов и аббривиатур и длинные books? Желательно чтобы можно было запустить на Raspberry PI 4GB без видеокарты." --model_name "tts_models/multilingual/multi-dataset/xtts_v2" --out_path speech.wav --speaker_idx "Damien Black" --language_idx "ru"

Скачает модель и сохранит результат в speech.wav

Можно менять голоса, список посмотреть так:

$ tts_venv/bin/tts --model_name "tts_models/multilingual/multi-dataset/xtts_v2" --list_speaker_idxs

Моделей много, можно попробовать разные, по идее русский поддерживают те, которые multilangual

$ tts --list_models

Запускается на CPU, наверно может и на GPU, но у меня по дефлту не подхватило CUDA, может нужно какие-то еще параметры задать.

masa ★★★
(19.05.25 23:26:50 MSK)
Последнее исправление: masa 19.05.25 23:45:00 MSK (всего исправлений: 5)

Ответ на: комментарий от masa 19.05.25 23:26:50 MSK

Резульат команды выше: https://0x0.st/8wAZ.wav

masa ★★★
(19.05.25 23:45:07 MSK)

← Vitrualbox, Windows guest, 3D acceleration

General

не работает резолвинг через Amnezia VPN на WIFI →

Похожие темы