История изменений

Исправление One, 23.09.25 13:22 (текущая версия) :

64 и больше, то попробуй gpt-oss-120b с квантизацией q6 или q4.

Обычно не хватает 64 для OSS-120b с его полным контекстным окном (128k токенов) ( Сама модель на FP4 весит 62-63гб.

Исправление One, 23.09.25 13:16:

64 и больше, то попробуй gpt-oss-120b с квантизацией q6 или q4.

Обычно не хватает 64 ( Сама модель на FP4 весит 62-63гб.

Исходная версия One, 23.09.25 13:15:

64 и больше, то попробуй gpt-oss-120b с квантизацией q6 или q4.

Обычно не хватает 64 ( Сама модель весит 62-63гб.