Вопрос по локальным нейросетям

1

2

Всем добрый день. Я новичок в теме нейросетей, поэтому прошу сильно не ругать).

Появился ряд вопросов по этой теме: Сейчас стоит 2 задачи:

Хотим сделать транскрибатор с использованием openai Whisper на своем железе и
Есть желание сделать голосовое управление без интернета для home assistant.

Отсюда ряд вопросов:

Какие системные требования для сетей под такие задачи? (в сети пишут разные вещи, но все +- около топа/предтопа)
Возможно ли установить в пк 2 разные видюхи одновременно и заставить нейронку работать на этом винегрете? (например radeon mi50 + gtx1630/intel arc b580)
Пока копал тему железа, вспомнил про специфичную игрушку в виде Intel xeon phi sc7220. Реально ли такое задействовать для работы нейронки? Или будет только жрать и коптить, а практического толку не будет?
Я правильно понимаю, что нейронка будет грузить видюк на полную только в момент обращения к ней/скармливания данных, а не на постоянную?
Нужен ли отдельный ссд под вышеописанные задачи?
Будет ли иметь значение процессор для таких задач? (чтобы знать уже точно, что проц можно какой-нибудь i3 поставить, а приоритет отдать ускорителям)
Где можно почитать описание разных моделей что умеют, в каких задачах применяются и тд? (или может есть мануал для чайников? с малого к большому)
сейчас располагаю свободным железом в виде i3-4130, 7гб озу и майнерского варианта gtx 1050ti 3gb (p106-090). стоит ли пытаться заводить что-то из вышеперечисленного на этом железе ради эксперимента, или захлебнется?

Перемещено hobbit из general

←	Слетает выравнивание для строк с русскими символами. Unicode в Си.

Как получить уже вычисленный hash в std::unordered_map?

→

← 1 2 3 →

Ответ на: комментарий от tiinn 10.09.25 06:10:56 MSK

Даже для вывода изображения? В игрульках на майнинговых нвидиях через амд уже выводили

anonymous
(17.09.25 18:13:25 MSK)

https://habr.com/ru/articles/921540/

На Хабре полно статей на эту тему

AoD314 ★
(20.09.25 06:45:15 MSK)

Ответ на: комментарий от tiinn 08.09.25 21:50:49 MSK

драйвера надо ставить? какие, игровые? с сайта нвидии?

anonymous
(28.09.25 04:39:37 MSK)

Ответ на: комментарий от anonymous 28.09.25 04:39:37 MSK

Драйвера самые обычные с сайта нвидии. Ессно, с этими дровами работает генерация картинок, рендеринг в блендере, но не работают игры. Надо только не забыть одну галку в настройках поставить. Сейчас не скажу, комп переезжает в другой корпус, но она там одна.

tiinn ★★★★★
(28.09.25 17:40:24 MSK)
Последнее исправление: tiinn 28.09.25 17:43:34 MSK (всего исправлений: 1)

Ответ на: комментарий от tiinn 28.09.25 17:40:24 MSK

У встройки дрова сносить не надо? Или в диспетчере устройств отключать? Я так понимаю в биосе надо приоритетной выставить эту P104-100

P.S. Вчера вечером такую же карту получил. Вот думаю что с ней делать

anonymous
(28.09.25 20:37:47 MSK)

Ответ на: комментарий от tiinn 08.09.25 21:50:49 MSK

От 30 секунд на полуторке Stable Diffusion в качестве 512x512. На разбор промпта, ессно, пара минут требуется.

Что-то это совсем крайне печально, по сравнению с нормальным железом для задачи.

Ну и, что там SD 1.5 рисует на такой маленькой картинке, и сколько там чудес косяков, можно себе представить.

James_Holden ★★★★★
(28.09.25 20:39:59 MSK)
Последнее исправление: James_Holden 28.09.25 20:43:35 MSK (всего исправлений: 2)

Ответ на: комментарий от anonymous 28.09.25 20:37:47 MSK

Нет, у встройки дрова сносить не надо, она останется единственной видеокартой в системе.

Я так понимаю в биосе надо приоритетной выставить эту P104-100

Нет, она не видится биосом как видеокарта

tiinn ★★★★★
(28.09.25 21:21:34 MSK)

Ответ на: комментарий от James_Holden 28.09.25 20:39:59 MSK

Ну и, что там SD 1.5 рисует на такой маленькой картинке, и сколько там чудес косяков, можно себе представить.

Да, но полуторка делает хорошо развилки дорог, слияния рек, горные гряды, многоногих существ - достаточно просто растянуть холст до 1024х512.

Иногда, просто выдаёт прикольный визуальный стиль.

tiinn ★★★★★
(28.09.25 21:23:44 MSK)

Ответ на: комментарий от James_Holden 28.09.25 20:39:59 MSK

Что-то это совсем крайне печально, по сравнению с нормальным железом для задачи.

У мя стояла задача вкатиться максимально занедорого, для этого карточка прям огонь.

tiinn ★★★★★
(28.09.25 21:25:30 MSK)

Ответ на: комментарий от tiinn 28.09.25 21:25:30 MSK

У меня две полу-убитые P106-100. Я так понимаю они аналогично по скорости работают? Интересно, насколько интерфейс PCI-E 1.1 влияет на скорость работы.

bookman900 ★★★★★
(28.09.25 22:08:16 MSK)

Ответ на: комментарий от bookman900 28.09.25 22:08:16 MSK

Сравните с настоящей GeForce 1070, учитывая конфигурацию их компьютера

tiinn ★★★★★
(28.09.25 22:37:14 MSK)

Ответ на: комментарий от bookman900 28.09.25 22:08:16 MSK

Кстати, если я правильно понял, у вас карты с 6Гб RAM, тогда Forge Stable Diffusion для вас то, что доктор прописал. Обещают прирост производительности в 60%, по сравнению с Automatic1111

tiinn ★★★★★
(28.09.25 22:47:03 MSK)

Ответ на: комментарий от anonymous 28.09.25 04:39:37 MSK

Посмотрел. Потом, в настройках Nvidia будет один-единственный раздел «Управление счетчиками производительности ГП», надо радиокнопку поставить против пункта «Предоставление доступа к счетчикам производительности ГП всем пользователям», у меня без этого не работало.

tiinn ★★★★★
(29.09.25 14:12:03 MSK)

Одна видяха 8 гигов и / или восьмиядерник / 16 гигов. Больше - лучше.
Да. Radeon-rocm, nvidia-cuda. Intel-net (если есть вдруг вулкан, то можно через него работать)
ХЗ
Да, только память займёт.
Нет.
Если будешь гонять только на видяха, то нет.
Google llama.cpp
Стоит

Stage1 ★★
(30.09.25 01:52:30 MSK)

4х p104-100 прошитых на 8гб. LGA1150 мать на 4 слота pcie 16x. Xeon 1240v3 32 gb ram За 20-25к это добро можно на авито собрать.

Qwen 2.5 coder 32b gguf 6bit ctx 128 под llama-server(llama.cpp) прекрасно себя чувствует на таком железе. Входной промпт только долго может жевать, если контекст большой.

Под ллм еще можно два пк собрать по 2 гпу в каждый и на одном развернуть llama rpc server под докером(на хабре есть статья), соединить пеки гигабитным свитчом и не искать мать на 4 слота. Тут, все упирается в два сервера и стабильность/скорость сети. Либо райзерами обмазаться, если брать майнерскую мамку, только там будет pcie 1x со всеми вытекающими через узкое горлышко. Хотя на ллмках это не сильно чувствуется. 1x сравним по скорости с гигабитной сетью.

Если нужно картинки или видео, то ComfyUI. Там сейчас много интересного появилось под бюджетные риги с сетью и мультигпу.

Сорян за оффтопик. Про ттс и стт не знаю, просто делюсь опытом.

anonymous
(05.10.25 20:03:02 MSK)

← 1 2 3 →

←	Слетает выравнивание для строк с русскими символами. Unicode в Си.

Development

Как получить уже вычисленный hash в std::unordered_map?

→

Похожие темы