LINUX.ORG.RU

Истории успеха с распознаванием речи?

 ,


0

2

Попробовал julius (с английского). Скармливаю ему крохотный файлик с такими параметрами: AUDIO: 16000 Hz, 1 ch, s16le, 256.0 kbit/100.00% (ratio: 32000->32000) - выдает какую-то левую хрень вместо того текста, что произносится. Даже я лучше воспринимаю на слух. Что я не так делаю? Или какие есть нормальные опенсорсные или бесплатно-онлайновые средства распознавания речи из аудиофайлов?

P. S. модели для английского качнул с VoxForge, но вместо реального текста выдает что-то типа «PHONE JOHNSON». По-моему, он на что-то намекает.



Последнее исправление: greatchina (всего исправлений: 1)

Кстати, Google Speech API еще живой? Можно ли к нему получить доступ (ключ)? И если можно, то как?

greatchina
() автор топика
Ответ на: комментарий от RelativeLayout

Да мне хоть какой, но говорят, что API key надо.

greatchina
() автор топика

Попробовал pocketsphinx - гонит аналогичную пургу, даже не близко к тексту.

greatchina
() автор топика

Даже я лучше воспринимаю на слух.

Ясен пень.

Что я не так делаю?

Распознаешь произвольный текст.

Хочешь историю успеха не дожидаясь 2075ого — бери Sphinx и распознавай из фиксированных вариантов. Если это шуточки ради одного текста — сходи к автору и вежливо попроси выдать txt.

t184256 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.