JetBrains открыла Mellum2 — MoE-модель для быстрых AI-сценариев в разработке

jetbrains, llm, mellum2, искусственный интеллект

Компания JetBrains открыла модель Mellum2, предназначенную для использования в AI-инструментах для разработки ПО. Модель опубликована под лицензией Apache 2.0, веса доступны на Hugging Face. В JetBrains подчёркивают, что Mellum2 обучалась с нуля и рассчитана не на мультимодальные задачи, а на работу с текстом и кодом: маршрутизацию запросов, RAG-конвейеры, суммаризацию, вспомогательных агентов и приватное развёртывание в инфраструктуре компаний.

Mellum2 построена по архитектуре Mixture-of-Experts. При общем размере в 12 млрд параметров на каждый токен активируется только около 2.5 млрд параметров, что должно снижать вычислительные затраты и задержки при инференсе. По утверждению JetBrains, по производительности на бенчмарках модель сопоставима с открытыми моделями близкого размера, но обеспечивает более чем двукратное ускорение инференса.

В JetBrains называют Mellum2 развитием первой модели Mellum, которая изначально создавалась для автодополнения кода. Новая версия расширена до более широкого класса задач, где требуется работать как с программным кодом, так и с естественным языком. Компания позиционирует Mellum2 как «фокусную» модель — не замену крупным универсальным LLM, а быстрый специализированный компонент для частых промежуточных операций внутри сложных AI-систем.

Среди предполагаемых сценариев использования называются классификация и маршрутизация запросов между моделями и инструментами, сжатие и обработка контекста в RAG-системах, подготовка данных для агентов, планирование, проверка промежуточных результатов и локальный запуск в средах, где нельзя отправлять исходный код или внутренние данные во внешние API.

На Hugging Face опубликована коллекция Mellum 2, включающая несколько вариантов модели: Thinking, Instruct, Thinking-SFT, Instruct-SFT, Base и Base-Pretrain. Модели распространяются в формате Safetensors по лицензии Apache 2.0.
Для запуска приведены примеры использования через Transformers, vLLM, SGLang и Docker Model Runner.

Технически более интересным выглядит не сам факт появления очередной открытой модели для кода, а выбранная JetBrains ниша. Компания делает ставку не на конкуренцию с самыми крупными универсальными моделями, а на дешёвые и быстрые компоненты, которые можно встроить прямо в IDE, внутренние ассистенты, корпоративные RAG-системы и агентные конвейеры. Для разработчиков и компаний это означает возможность запускать часть AI-логики локально или на собственных серверах, сохраняя контроль над кодом, данными и стоимостью инференса.

>>> Источник

Ссылка

← Опубликован NBD-VRAM

Froggy-BLC 1.01 (Книжная Система Сайта, CMS) →

Судя по тестам использовать сие никакого смысла нет - Qwen делает всё то же самое либо сравнимо, либо лучше.

zabbal ★★★☆☆
(02.06.26 17:44:54 MSK)

Ссылка

Тот кто ипользует ии при кодинге, то не програмисты, то халтурщики.

nixbrain
(02.06.26 17:56:45 MSK)

Ответ на: комментарий от nixbrain 02.06.26 17:56:45 MSK

Тот кто использует автомобиль для передвижения - лентяй, расточитель и убийца окружающей среды.

yvv1 ★★
(02.06.26 18:39:38 MSK)

Ссылка

12 млрд параметров

Пойдёт для автодополнений и генерирования коммит мессаджей разве что.

yvv1 ★★
(02.06.26 18:40:46 MSK)

Ссылка

AI от JetBrains? Нет, спасибо. Это просто тупая стохастическая функция..

dynamic_cast
(02.06.26 20:44:27 MSK)

Ссылка

Ответ на: комментарий от nixbrain 02.06.26 17:56:45 MSK

Тот кто ипользует ии при кодинге, то не програмисты, то халтурщики.

ножкой топнул?

gagarin0 ★
(02.06.26 21:03:05 MSK)

когда в из РФ можно будет купить продукт жб тогда и поговорим. не хотите наши деньги, увы.

ggrn ★★★★★
(02.06.26 21:43:46 MSK)

Ответ на: комментарий от ggrn 02.06.26 21:43:46 MSK

конкретно эту модель покупать не надо, ее можно свободно скачать, а для всего остального есть neovim

https://huggingface.co/collections/JetBrains/mellum-2

gagarin0 ★
(02.06.26 21:59:43 MSK)

Ответ на: комментарий от gagarin0 02.06.26 21:03:05 MSK

В ладошки хлопнул. Я иногда халтурю и переживаю из-за этого.

water_closed ★
(02.06.26 22:11:19 MSK)

Ссылка

Ответ на: комментарий от nixbrain 02.06.26 17:56:45 MSK

Тот кто ипользует ии при кодинге, то не програмисты, то халтурщики.

Это настолько тупо что мне кажется что этот коммент оставила старая LLM с ограниченным контекстом :)

zabbal ★★★☆☆
(02.06.26 22:34:54 MSK)

Ответ на: комментарий от gagarin0 02.06.26 21:59:43 MSK

а для всего остального есть

visual studio code, а вот неовим надо отправить в /dev/null :) вместе с емаксом….

DrRulez ★★★★★
(03.06.26 01:03:50 MSK)

Ссылка

Судя по всему JetBrains все. Но хорошая попытка выплать.

anonymous_sama ★★★★★
(03.06.26 01:49:22 MSK)

Ответ на: комментарий от zabbal 02.06.26 22:34:54 MSK

Можешь начинать записываться в сельскую библиотеку.

nixbrain
(03.06.26 05:36:32 MSK)

Ссылка

Ответ на: комментарий от gagarin0 02.06.26 21:03:05 MSK

нет, пукай пукнул! :о)

sunjob ★★★★★
(03.06.26 09:38:57 MSK)

Ссылка

Ответ на: комментарий от anonymous_sama 03.06.26 01:49:22 MSK

у них «хорошая попытка» закончилась на «редкаторе с наручниками», который портит код своим «улучшайзингом» (настроить, тем более, отключить - невозможно, тикеты висят с самого начала ...)

имхо, но если «устраивает» такой редактор - то он ваш :о)

sunjob ★★★★★
(03.06.26 09:42:33 MSK)