LINUX.ORG.RU

История изменений

Исправление question4, (текущая версия) :

А оно вообще работает?

1.7.x с моделью Turbo очень хорошо работают с русским, английским, французским, немецким, украинским, китайским. (С тамильским не вышло.) Нередко правильно расставляют знаки препинания. Один раз опознало Трампа и подписало его реплики. Проблемы есть, когда несколько языков вперемешку. Или когда речь глушится музыкой.

Недостаток — низкая скорость. С Turbo моделью на 4 ядрах CPU 1.7.x с BLAS примерно втрое медленнее распознаваемой звуковой дорожки. Без BLAS — вчетверо. Для сравнения, питоновый Vosk немного быстрее звуковой дорожки, часовой фильм анализирует минут 55.

Tiny модель в тех же условиях делает намного больше ошибок, но работает в 2 с лишним раза быстрее звуковой дорожки.

Другой недостаток 1.7.х — ограниченная поддержка форматов, но наблюдается явный прогресс. 1.7.0 понимала только 16-битный WAV, 1.7.5 нормально обрабатывает звуковые файлы AAC, MP3 и Opus, но не работает с видео в MP4. Сейчас соберу и попробую 1.8.0.

Исправление question4, :

А оно вообще работает?

1.7.x с моделью Turbo очень хорошо работают с русским, английским, французским, немецким, украинским, китайским. (С тамильским не вышло.) Нередко правильно расставляют знаки препинания. Один раз опознало Трампа и подписало его реплики. Проблемы есть, когда несколько языков вперемешку. Или когда речь глушится музыкой.

Недостаток — низкая скорость. С Turbo моделью на 4 ядрах CPU 1.7.x с BLAS примерно втрое медленнее распознаваемой звуковой дорожки. Без BLAS — вчетверо. Для сравнения, питоновый Vosk немного быстрее звуковой дорожки, часовой фильм анализирует минут 55.

Tiny модель в тех же условиях делает намного больше ошибок, но работает в 2 с лишним раза быстрее звуковой дорожки.

Другой недостаток 1.7.х — ограниченная поддержка форматов, но наблюдается явный прогресс. 1.7.0 понимала только 16-битный WAV, 1.7.5 нормально обрабатывает звуковые файлы AAC, MP3 и Opus, но не работает с видео в MP4. Сейчас соберу и попробую.

Исправление question4, :

А оно вообще работает?

1.7.x очень хорошо работают с русским, английским, французским, немецким, украинским, китайским. (С тамильским не вышло.) Нередко правильно расставляют знаки препинания. Один раз опознало Трампа и подписало его реплики. Проблемы есть, когда несколько языков вперемешку. Или когда речь глушится музыкой.

Недостаток — низкая скорость. С Turbo моделью на CPU 1.7.x с BLAS примерно втрое медленнее распознаваемой звуковой дорожки. Без BLAS — вчетверо. Для сравнения, питоновый Vosk немного быстрее звуковой дорожки, часовой фильм анализирует минут 55.

Другой недостаток 1.7.х — ограниченная поддержка форматов, но наблюдается явный прогресс. 1.7.0 понимала только 16-битный WAV, 1.7.5 нормально обрабатывает звуковые файлы AAC, MP3 и Opus, но не работает с видео в MP4. Сейчас соберу и попробую.

Исходная версия question4, :

А оно вообще работает?

1.7.x очень хорошо работают с русским, английским, французским, немецким, украинским, китайским. (С тамильским не вышло.) Нередко правильно расставляют знаки препинания. Один раз опознало Трампа и подписало его реплики. Проблемы есть, когда несколько языков вперемешку.

Недостаток — низкая скорость. С Turbo моделью на CPU 1.7.x с BLAS примерно втрое медленнее распознаваемой звуковой дорожки. Без BLAS — вчетверо. Для сравнения, питоновый Vosk немного быстрее звуковой дорожки, часовой фильм анализирует минут 55.

Другой недостаток 1.7.х — ограниченная поддержка форматов, но наблюдается явный прогресс. 1.7.0 понимала только 16-битный WAV, 1.7.5 нормально обрабатывает звуковые файлы AAC, MP3 и Opus, но не работает с видео в MP4. Сейчас соберу и попробую.