История изменений
Исправление One, (текущая версия) :
64 и больше, то попробуй gpt-oss-120b с квантизацией q6 или q4.
Обычно не хватает 64 для OSS-120b с его полным контекстным окном (128k токенов) ( Сама модель на FP4 весит 62-63гб.
Исправление One, :
64 и больше, то попробуй gpt-oss-120b с квантизацией q6 или q4.
Обычно не хватает 64 ( Сама модель на FP4 весит 62-63гб.
Исходная версия One, :
64 и больше, то попробуй gpt-oss-120b с квантизацией q6 или q4.
Обычно не хватает 64 ( Сама модель весит 62-63гб.