Кто-нибудь в языковых моделях разбирается?

0

1

https://shaochenze.github.io/blog/2025/CALM/
https://github.com/shaochenze/calm

Чем отличается предлагаемый подход?

Ссылка

←	Ещё один российский офис — Офис+

Новости на фронте Макбуков

→

В первом случае человека заменят индусом, во втором - пакистанцем.

somemong
(05.11.25 13:40:57 MSK)

Ссылка

Да вроде всё понятно написано:

Современные большие языковые модели (LLM) ограничены фундаментальным препятствием: они генерируют текст по одному токену за раз. CALM (Continuous Autoregressive Language Models) решает эту проблему, внедряя парадигмальный сдвиг в языковом моделировании. Вместо того, чтобы предсказывать по одному дискретному токену за раз, CALM учится предсказывать один непрерывный вектор, который представляет собой целый блок из K токенов.

dataman ★★★★★
(05.11.25 13:44:52 MSK)

Ответ на: комментарий от dataman 05.11.25 13:44:52 MSK

Я просто не понимаю, что представляет собой «непрерывный вектор» применительно к тексту.

question4 ★★★★★
(05.11.25 15:44:57 MSK) автор топика

Ответ на: комментарий от question4 05.11.25 15:44:57 MSK

Насколько я понял, каждой точке в этом пространстве вектора соответствует какой-то набор токенов, ну и близкие точки имеют близкие по смыслу наборы токенов (фразы например), ну и «непрерывный» видимо означает, что любой точке энкодер/декодер может родить какой-то свой набор токенов.

goingUp ★★★★★
(05.11.25 16:37:50 MSK)
Последнее исправление: goingUp 05.11.25 16:39:17 MSK (всего исправлений: 1)

Ссылка

Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)

←	Ещё один российский офис — Офис+

Talks

Новости на фронте Макбуков

→

Похожие темы