LINUX.ORG.RU

История изменений

Исправление One, (текущая версия) :

64 и больше, то попробуй gpt-oss-120b с квантизацией q6 или q4.

Обычно не хватает 64 для OSS-120b с его полным контекстным окном (128k токенов) ( Сама модель на FP4 весит 62-63гб.

Исправление One, :

64 и больше, то попробуй gpt-oss-120b с квантизацией q6 или q4.

Обычно не хватает 64 ( Сама модель на FP4 весит 62-63гб.

Исходная версия One, :

64 и больше, то попробуй gpt-oss-120b с квантизацией q6 или q4.

Обычно не хватает 64 ( Сама модель весит 62-63гб.