Посоветуйте железо для подкроватного сервера ИИ

для подкроватного

Raspberry Pi 4 https://vc.ru/dev/1764209-kak-zapustit-sobstvennuyu-neiroset-na-raspberry-pi-... или Raspberry Pi Zero https://3dnews.ru/1118461/sovremennuyu-iimodel-zapustili-na-kroshechnom-kompy...

vbcnthfkmnth123 ★★★★★
(03.04.25 06:28:21 MSK)

Ссылка

5090 лучше, там 32 Гб памяти. Поставишь 6 шт - норм будет.

Suigintou ★★★★★
(03.04.25 06:40:48 MSK)

Ответ на: комментарий от Suigintou 03.04.25 06:40:48 MSK

Зачем 6? Дораха жы

unclestephen ★
(03.04.25 06:43:23 MSK) автор топика
Последнее исправление: unclestephen 03.04.25 06:43:51 MSK (всего исправлений: 1)

Ответ на: комментарий от unclestephen 03.04.25 06:43:23 MSK

Это смотря какого размера нейронки гонять. Вариантов мало же, можно вписать всё что есть с >=24 Гб на борту в табличку и посчитать удельную стоимость.

Suigintou ★★★★★
(03.04.25 07:03:31 MSK)

Ответ на: комментарий от Suigintou 03.04.25 07:03:31 MSK

посмотрел цены на аренду, есть конечно и плюсы у аренды

но не потяну

unclestephen ★
(03.04.25 07:05:31 MSK) автор топика

Сервер ИИ завучит как Сервер с Операционной системой, почти все современные LLM сносно работают и без GPU

sparks ★★★★
(03.04.25 09:15:20 MSK)

Ссылка

Ryzen AI Max+ 395 же

devl547 ★★★★★
(03.04.25 09:17:32 MSK)

Ссылка

Сборка компьютера с 1 Tb RAM

Будешь DeepSeek R1 локально гонять.

greenman ★★★★★
(03.04.25 09:18:20 MSK)

Ссылка

Смотря какой ИИ. Я картиночки генерю с 16Гб ОЗУ и 8Гб видеокартой. Комп лично мне обошёлся в 7 тыс.р.

tiinn ★★★★★
(03.04.25 10:18:06 MSK)
Последнее исправление: tiinn 03.04.25 10:18:43 MSK (всего исправлений: 1)

Озвучь, какой тип ИИ ты хочешь, а них у всех разные системные требования. Возможно тебе придётся заказывать кастомную кровать, под которую влезет серверная стойка.

Khnazile ★★★★★
(03.04.25 10:24:55 MSK)

Ответ на: комментарий от Khnazile 03.04.25 10:24:55 MSK

И апгрейдить кондиционер в спальне. Тем более, что лето на носу.

anonymous
(03.04.25 10:37:15 MSK)

Ответ на: комментарий от anonymous 03.04.25 10:37:15 MSK

апгрейдить кондиционер

Возможно придется еще заказать дополнительной блок {А,Г,Т}ЭС для кондиционера

anonymous
(03.04.25 14:02:16 MSK)

Ссылка

HP Z2 Mini G1a Или что то на AMD AI 395+ главное чтобы память была LPDDR5x-8533

Карточки уже нет смысла брать, лучше потратить 2.5к$ на вот такого рода вещь

zxflux
(03.04.25 14:08:29 MSK)

Ответ на: комментарий от zxflux 03.04.25 14:08:29 MSK

AMD AI 395+

типа можно сделать много памяти и мощная видюха, спасибо

unclestephen ★
(03.04.25 15:19:30 MSK) автор топика

Ответ на: комментарий от Suigintou 03.04.25 06:40:48 MSK

5090 лучше, там 32 Гб памяти. Поставишь 6 шт - норм будет.

Лучше H200

vasya_pupkin ★★★★★
(03.04.25 15:24:44 MSK)
Последнее исправление: vasya_pupkin 03.04.25 15:27:51 MSK (всего исправлений: 1)

Ссылка

Если вы хотите локального чат-бота, то может хватить и «игрового» компьютера, причем не самого нового. Небольшую модель gpt-j для одного пользователя можно запустить даже на 1050ti.

Leupold_cat ★★★★★
(03.04.25 15:29:04 MSK)
Последнее исправление: Leupold_cat 03.04.25 15:56:04 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от unclestephen 03.04.25 07:05:31 MSK

Лучше всего арендовать LLM в облаке.

vbr ★★★★★
(03.04.25 15:52:41 MSK)

Ссылка

Братан, тебе надо более четко задачу сформулировать, может тебе хватит поставить ollama локально и выбрать модельку. А может ты хочешь на миллиардах параметров генерить свою поделку

AntonyRF ★★★★
(03.04.25 15:56:47 MSK)

Ссылка

Ответ на: комментарий от unclestephen 03.04.25 15:19:30 MSK

96 гигов так ещё когда ИИ ненужон можно и поиграть и что то поделать, там 16 ядер 32 потока

zxflux
(03.04.25 16:01:14 MSK)

Ссылка

У 395+ есть проблема в виде напаянной памяти, выливающаяся в необходимость покупать сразу с 128 на борту.

pekmop1024 ★★★★★
(03.04.25 16:05:36 MSK)

Ответ на: комментарий от pekmop1024 03.04.25 16:05:36 MSK

Это не проблема, это следствие высокой скорости памяти и её типа за 2.5к покупается на 128 гигов оперы, а содимм плашки это шлак

zxflux
(03.04.25 16:10:25 MSK)

Ответ на: комментарий от zxflux 03.04.25 16:10:25 MSK

Это не проблема, это следствие высокой скорости памяти и её типа за 2.5к покупается на 128 гигов оперы, а содимм плашки это шлак

Все равно какая-нибудь старая видяшка на 24 гига будет сильно интереснее в этом отношении. Смысла за этим гоняться нет. Оно интересно только непосредственно самим 128, но это не всем нужно.

pekmop1024 ★★★★★
(03.04.25 16:12:26 MSK)

Ответ на: комментарий от zxflux 03.04.25 16:10:25 MSK

Ну и для высокой скорости есть LPCAMM2 модули. Так чтто херовое оправдание для напаивания памяти.

pekmop1024 ★★★★★
(03.04.25 16:13:30 MSK)

Ссылка

Ответ на: комментарий от pekmop1024 03.04.25 16:12:26 MSK

Я не на столько богат чтобы покупать старую видяшку на 24 гига)))

А бокс от hp закинул в рюкзак с монитором 16 дюймовым и поехал куда глаза глядят) Захотел запитал от автомобиля, всего 150 ватт в пике а сколько у той видюхи и сколько ещё нужно иметь кроме видюхи?

Воооот

zxflux
(03.04.25 16:16:57 MSK)

Ответ на: комментарий от zxflux 03.04.25 16:16:57 MSK

При таком раскладе проще ноут на том же 395+ брать. :) Ибо юзкейс ну совершенно другой.

А так-то сетап с видяшкой тоже вполне влезает в рюкзак, ибо боксы с окулинком никто не отменял.

pekmop1024 ★★★★★
(03.04.25 16:19:41 MSK)

Ответ на: комментарий от pekmop1024 03.04.25 16:19:41 MSK

К боксу ещё не забудь блок питания ватт эдак на 700)))))))))

А ноут на 396 будет в рамках максимум 70ватт задушенный камушек, в любом случае на 70 ваттах он будет адски греться и будет в будущем отвал и деградация как текстолита так и самого кристала

Так что бокс типа hp за свои деньги лучшее решение что можно найти

zxflux
(03.04.25 16:22:05 MSK)

Ответ на: комментарий от zxflux 03.04.25 16:22:05 MSK

Так что бокс типа hp за свои деньги лучшее решение что можно найти

Неудобное решение в описанном тобой юзкейсе.

pekmop1024 ★★★★★
(03.04.25 16:48:11 MSK)

Ответ на: комментарий от pekmop1024 03.04.25 16:48:11 MSK

покажи где я описал какой то юзкейс)))))

zxflux
(03.04.25 16:50:14 MSK)

Ответ на: комментарий от zxflux 03.04.25 16:50:14 MSK

А бокс от hp закинул в рюкзак с монитором 16 дюймовым и поехал куда глаза глядят) Захотел запитал от автомобиля

Вот тут ты его описал.

pekmop1024 ★★★★★
(03.04.25 16:51:08 MSK)

Ссылка

Ответ на: комментарий от tiinn 03.04.25 10:18:06 MSK

Че за железо?

anonymous
(18.04.25 01:58:01 MSK)

а какое ПО будете ставить?

jura12 ★★
(18.04.25 02:05:15 MSK)

Ссылка

Ответ на: комментарий от anonymous 18.04.25 01:58:01 MSK

Че за железо?

Intel Atom J4005, 16Гб ОЗУ DDR4, мать Asrock J4005B-ITX, Nvidia P104-100 8Гб, SSD Kingston 256 Гб

tiinn ★★★★★
(18.04.25 06:04:18 MSK)
Последнее исправление: tiinn 18.04.25 06:04:33 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Khnazile 03.04.25 10:24:55 MSK

Хорошая кровать получится, с подогревом. Но шумная.

Hertz ★★★★★
(18.04.25 06:23:54 MSK)

Ссылка

Б/у 3090 24гб.

Ну реально 16гб бессмысленная трата денег, модели 22/24b впритык, 32b никак

One ★★★★★
(18.04.25 19:36:19 MSK)

Ссылка

подкроватный ИИ? А оно умеет ночью вылезать?

ivanich10 ★
(18.04.25 19:41:42 MSK)

Ссылка

Ответ на: комментарий от pekmop1024 03.04.25 16:19:41 MSK

При таком раскладе проще ноут на том же 395+ брать

И что на нем вертеть, llama 8b? Потратить 2000+ долларов, чтобы задыхаться уже на моделях весом в 16гб со скоростью 7-10 токенов в секунду?

One ★★★★★
(18.04.25 19:43:09 MSK)

Ответ на: комментарий от One 18.04.25 19:43:09 MSK

А оно как ни крути примерно столько потратить придется. Да и чего оно задыхаться будет? 3090 не задыхается с 24гб, а эта шняга с уровнем ноутбучной 4060 и 128 - вдруг задохнется?

pekmop1024 ★★★★★
(18.04.25 20:31:09 MSK)

Ответ на: комментарий от pekmop1024 18.04.25 20:31:09 MSK

Проще за 190к рублей купить комп из Китая с 395 процом и 128гб lpddr5x

zxflux
(18.04.25 20:34:09 MSK)

Ссылка

Ответ на: комментарий от pekmop1024 18.04.25 20:31:09 MSK

936.2 Гб/с у 3090, 256 Гб/с память у ai 395. При этом пиковая утилизация у выделенной больше.

Берёшь модель весом в 14гб, засовываешь в 3090, 936 / 14 * 70% =46 ожтдаемых токенов в секунду, засовываешь в АМД АИ 256 / 14* 50% = 9 токенов в секунду.

И ты потратил 200 тыс ради этого тормоза вместо 65к на б/у 3090.

One ★★★★★
(18.04.25 21:50:02 MSK)
Последнее исправление: One 18.04.25 21:50:43 MSK (всего исправлений: 1)

Ответ на: комментарий от One 18.04.25 21:50:02 MSK

1 Это теория это 2 у 3090 24 гига памяти

Посмотри реальные тесты

zxflux
(18.04.25 21:57:15 MSK)

Ответ на: комментарий от zxflux 18.04.25 21:57:15 MSK

Что мне смотреть? Я пользуюсь и 3090 и 8845hs, поднять всего лишь шину в два-два с половиной раза, это совсем мусорно за оверпрайс. Не будешь ты на AI395 пользоваться моделями выше 14b, если не эстонский тормоз. Куда лучше бесплатным Gemini пользоваться или немного платить за api сверх дозы

Недаром за 10к маки ультра продают для LLM

One ★★★★★
(18.04.25 22:18:41 MSK)
Последнее исправление: One 18.04.25 22:19:32 MSK (всего исправлений: 1)

Ответ на: комментарий от One 18.04.25 22:18:41 MSK

Ну Лан купи тогда за 2.5к долларов nvidia dgx spark

Мои потребности удовлетворяла специализированная модель для кода и работала она на Xe 96 eu

А уж 395 покрывать будет если всё таки куплю 500%

Я хз чего вы упёрлись как в маки так в видеокарты…

Может ты ещё и о диффузионных моделях для кода не слышал?)

А они оооочень быстрые если что

Если уж ты сравниваешь свой 8845 зажатый в пакет в 45 ватт

То наверное надо учесть что 395 это 120 ватт ;)

zxflux
(18.04.25 22:38:15 MSK)

Ответ на: комментарий от One 18.04.25 22:18:41 MSK

Ещё напоминаю что 8845 не имеет бекенда rocm для ml а так же не используется npu от слова совсем!

В новых процах и дравишках данный казус пофиксил и теперь одна часть использует npu другая жирная часть сети использует gpu

Это я в контексте диффузионных моделей там же внутри всё очень интересно ;)

Читай пожалуйста о LLada 2 и вот в интике пощупай ещё https://chat.inceptionlabs.ai

И пожалуйста включи логику и концентрацию чтобы ты мог анализировать ситуацию и по теплопакету и что разные поколения и что разные драйвера и ещё кучу переменных, а не пытаться втулить свои 3090 ссаные)))

zxflux
(18.04.25 22:46:58 MSK)

Ответ на: комментарий от zxflux 18.04.25 22:38:15 MSK

Эти ватты при узкой памяти будут влиять лишь на пиковую утилизацию памяти.

Для кода (генерации, отладки) локалки с жидкой длиной контекста вообще так себе. Если google ai студио начать пользоваться с длинной в миллион, то домашние LLMки лишь смех вызывают

One ★★★★★
(18.04.25 22:52:02 MSK)

Ссылка

Ответ на: комментарий от zxflux 18.04.25 22:46:58 MSK

Зачем мне напоминать то, чего нет? Прекрасно и через vulkan работает и через подмену id rocm на gtx1103. NPU вообще не нужен, причём производительность практически упирается в потолок памяти.

Ещё раз - я указанными выше устройствами пользуюсь, когда ты просто онанируешь в теории.

One ★★★★★
(18.04.25 22:55:37 MSK)
Последнее исправление: One 18.04.25 22:56:02 MSK (всего исправлений: 2)

Ответ на: комментарий от One 18.04.25 22:55:37 MSK

8845 в январе скинул уже ахахахахха

zxflux
(18.04.25 22:58:18 MSK)

Ссылка

Ответ на: комментарий от One 18.04.25 22:55:37 MSK

Читай неуч

https://medium.com/the-low-end-disruptor/what-is-diffusion-llm-and-why-it-matters-749033d1efb1

zxflux
(18.04.25 23:25:36 MSK)

Ответ на: комментарий от zxflux 18.04.25 23:25:36 MSK

Спасибо, поржал над глупышкой, что в гугле увидит необычное словечко и тает в ожидании чуда, и течёт как девятиклассница во время овуляции ))

One ★★★★★
(19.04.25 00:00:44 MSK)

Ответ на: комментарий от One 19.04.25 00:00:44 MSK

Да вот в чем дело, я уже попробовал эти модельки. Изучил работы и тех кто работает над этим. Это к слову китайцы, которые попустят мир llm как недавно дипсик попустил openai и прочих клаудь

Касательно железа, то увы и ах я жду отправок dgx потому что там есть кластеризация и сетевка на 400гбс

zxflux
(19.04.25 00:29:46 MSK)

Ссылка

Ответ на: комментарий от Suigintou 03.04.25 06:40:48 MSK

NVIDIA RTX PRO 6000 Blackwell Server Edition

CPU: 752 NVIDIA Blackwell Tensor Core; Precisions: FP64, TF32, BF16, FP16, FP8, INT8, FP6, FP4
RAM: 96GB GDDR7 ECC; 512-bit; 1.6TB/s
4x DisplayPort 2.1
PCI Express 5.0 x16
Power Connector	1x PCIe CEM5 16-pin
TDP: 600W; Thermal Solution: Passive

Для обучения ИИ важны тензорные ядра и объем памяти GPU.

DLSS4 = 3 * DLSS3

Теперь надо подобрать мать и проц, чтобы тянули несколько таких видях и оперативы добавить быстрой, чтобы данные модели не свопились на диске, а с RAM в VRAM передавалось без задержки…

Предлагается готовая оптимизированная сборка: https://www.nvidia.com/en-eu/data-center/gb300-nvl72/

anonymous
(19.04.25 08:04:53 MSK)

Похожие темы