Исправление Skullnet, 08.05.25 03:19 (текущая версия) :
Для инференса и 1x хватит, зачем 8-16?
Потому что модель может кэшироваться между VRAM и RAM.
И вообще в 1x GPU будет неюзабельна.
Исходная версия Skullnet, 08.05.25 03:18: