История изменений

Исправление Skullnet, 08.05.25 03:19 (текущая версия) :

Для инференса и 1x хватит, зачем 8-16?

Потому что модель может кэшироваться между VRAM и RAM.

И вообще в 1x GPU будет неюзабельна.

Исходная версия Skullnet, 08.05.25 03:18:

Для инференса и 1x хватит, зачем 8-16?

Потому что модель может кэшироваться между VRAM и RAM.