LINUX.ORG.RU

Llm


13

3

Всего сообщений: 60

См. также:

 , , ,

JetBrains открыла Mellum2 — MoE-модель для быстрых AI-сценариев в разработке

 , , mellum2,

Компания JetBrains открыла модель Mellum2, предназначенную для использования в AI-инструментах для разработки ПО. Модель опубликована под лицензией Apache 2.0, веса доступны на Hugging Face. В JetBrains подчёркивают, что Mellum2 обучалась с нуля и рассчитана не на мультимодальные задачи, а на работу с текстом и кодом: маршрутизацию запросов, RAG-конвейеры, суммаризацию, вспомогательных агентов и приватное развёртывание в инфраструктуре компаний.

Mellum2 построена по архитектуре Mixture-of-Experts. При общем размере в 12 млрд параметров на каждый токен активируется только около 2.5 млрд параметров, что должно снижать вычислительные затраты и задержки при инференсе. По утверждению JetBrains, по производительности на бенчмарках модель сопоставима с открытыми моделями близкого размера, но обеспечивает более чем двукратное ускорение инференса.

( читать дальше... )

>>> Источник (jetbrains.com)

unclestephen
()

Еще новости

Опросы

Август 2025

Галерея

Статьи

Май 2026

Февраль 2026

Январь 2026

2025

Форум

Май 2026

Апрель 2026

Апрель 2026

Март 2026

Февраль 2026