30 сентября, после трёх месяцев разработки, состоялся выпуск 1.8.0 высокопроизводительной системы автоматического распознавания речи whisper.cpp, реализующей модель Whisper от OpenAI на языках C и C++ и распространяемой по лицензии MIT.
В проекте используется авторская тензорная библиотека машинного обучения GGML, написанная на языке C.
Основные изменения:
- Опция
-fa, --flash-attn
теперь включена по умолчанию. - Улучшена производительность для ряда платформ.
- В
server.cpp
добавлена поддержка параметраdtw.params
для моделиv3-large-turbo
. - В
server.cpp
добавлена опция-nlp, --no-language-probabilities
для отключения вычисления вероятности языка в подробном выводе в формате JSON. Это дорогостоящая операция, которая значительно увеличивает задержку ответов. - Исправлена ошибка, приводящая к сбою при выборе устройства GPU в системах с несколькими графическими процессорами.
- Предпочтение
curl
вместоwget
в скриптах загрузки моделей. - Обновлена библиотека GGML.
- Другие улучшения и исправления ошибок.