LINUX.ORG.RU

CMU Sphynx, Ruby и распознавание голоса

 cmu sphynx, , voice to text


0

2

Есть задача.

Надо превратить в текст mp3 файл с помощью CMU Sphynx (не путать с поисковиком, они тёзки). Писать буду на Ruby, т.к. это впоследствии будет куском веб-приложения.

Собственно, нет ли у кого-нибудь простых примеров работы с этим CMU Sphynx'ом? Хотел найти как бы сделать типа sphynx --lang=en < somefile.mp --output = file_with_text.txt - не нашёл... Он вообще умеет в таком стиле работать? А то на офсайте примеры на Си все. Неохота мне на си писать :(

★★★★★

Есть задача.

Никогда не работал с этой штукой, но задача у вас интересная.

Собственно, нет ли у кого-нибудь простых примеров работы с этим CMU Sphynx'ом? А то на офсайте примеры на Си все. Неохота мне на си писать :(

Насколько я понял, на офсайте есть примеры и для Java. А значит, их можно легко использовать из JRuby.

Хотел найти как бы сделать типа sphynx --lang=en < somefile.mp --output = file_with_text.txt - не нашёл... Он вообще умеет в таком стиле работать?

А можно и не использовать JRuby. Вот более приятный вариант работы через http-api:

curl -X POST --data-binary @sentence.wav -H "Content-Type: audio/x-wav" http://localhost:8080/recognize
и получаем текст в json'е.

Подробнее: https://github.com/alumae/ruby-pocketsphinx-server

Anatolik ★★
()
Ответ на: комментарий от quickquest

Правительство готово выделить 317 млн рублей за решение этой задачи. Дерзай :)

Правительство распилит 317 мильёнов, а какой-нить студент установит им CMUSphynx и обучит его голосам дикторов. Круто ;)

Alve ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.