LINUX.ORG.RU
ФорумTalks

ПО для оффлайн распознавания речи

 ,


2

4

Друзья, подскажите, пожалуйста, существует ли в природе какой-нибудь приличный софт для распознавания речи на русском языке, не требующий постоянного доступа к интернету? Желательно СПО, но нормально работающая проприетарщина тоже сойдёт.

★★★★

Ответ на: комментарий от next_time

проблемой распознавания изображений занимался

Судя по всему - очень поверхностно.

Отсечение частот - детский сад в звуке, примерно как и отсечение яркостей и цветов в изображении.

Serg_HIS
()
Ответ на: комментарий от Serg_HIS

ничего подобного — если предоставить алгоритмы выборки того, какие частоты нужно отсечь, задача будет решена

если вы взяли и вытащили весь набор гармоник характерных для данного инструмента, вы, по сути, и распознали этот инструмент. но, поскольку, инструменты, на самом деле, имеют широкие, перекрывающиеся друг с другом, диапазоны частот, задача нетривиальна

next_time ★★★★★
()
Ответ на: комментарий от next_time

инструменты, на самом деле, имеют широкие, перекрывающиеся друг с другом, диапазоны частот, задача нетривиальна

Тоесть вы всётаки начали понимать суть проблемы.

С голосом просто тоже самое, который идёт в перемешку с окружающими шумами.

Отсечение частот ничего не даёт в принципе.

Serg_HIS
()
Ответ на: комментарий от next_time

гармоник характерных для данного инструмента

Я вас разочарую

Гармоники - они у всех инструментов есть и они практически одинаковы. Гармоники кратны длине воспроизводящего элемента (например струны) и их бесконечно много. Самая громкая гармоника - это первая, равная длине воспроизводящего элемента, остальные затихают в логарифмической зависимости. Инструменты (как и фонемы) отличаются друг от друга тембральной окраской (сопутствующими подзвуками), которые определяются формой и структурой инструмента или видоизменением формы гортани в случае речи. Эта окраска имеет очень широкий диапазон и тупое отсечение частот ничего не даёт. Например шепот, чтобы совсем ярко показать о чём я говорю. Когда говорят шепотом, используется совсем другой спектр частот, но всё равно, голос и фонемы вполне распознаваемы.

Serg_HIS
()
Ответ на: комментарий от Serg_HIS

Эта окраска имеет очень широкий диапазон и тупое отсечение частот ничего не даёт.

тупое - не даёт, в этом вся и задача — сделать правильную выборку частот

next_time ★★★★★
()
Ответ на: комментарий от next_time

сделать правильную выборку частот

У вас есть понимание, как делать правильную выборку частот?

У меня например есть. И это далеко не просто выборка. Но задача слишком комплексная для качественного решения за вменяемое время для одного человека.

Но тут на сайте все орут, что всеСамлики. Все всё сами должны делать.

Ну-ну.

Serg_HIS
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.