Ускорители NVIDIA получат прямой канал взаимодействия с NVMe накопителями

Ответ на: комментарий от imul 15.08.19 17:11:43 MSK

в том же в котором они хранятся сейчас, просто прочитать их можно будет не задействуя цп

Thero ★★★★★
(16.08.19 17:10:24 MSK)

Ответ на: комментарий от Thero 16.08.19 17:10:24 MSK

в том же в котором они хранятся сейчас, просто прочитать их можно будет не задействуя цп

То есть видеокарта должна понимать все файловые системы, которые можно навернуть на внешнее хранилище? Или там будет raw?

imul ★★★★★
(16.08.19 17:12:33 MSK)

Ответ на: комментарий от imul 16.08.19 17:12:33 MSK

Я так понимаю оно будет использоваться как тормозный имитатор видеопамяти. Те программы заливают во внутренних форматах туда сами всё.

anonymous
(16.08.19 17:16:38 MSK)

Ответ на: комментарий от A-234 16.08.19 17:02:45 MSK

«Всякие запросы к базам данных получают результат практически в момент считывания, там узким местом всегда была пропускная способность шины. »

Вот это верно, шина - головная боль современных видеокарт. Костыль в виде Slim так и не взлетел. Взлетит ли этот чудо-костыль.

anonymous
(16.08.19 17:20:33 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 17:16:38 MSK

Ок. Вот есть игруля например. У неё есть в файлах какие-то данные, нужные видеокарте.
Игруля льёт эти данные в видеокарту, а видеокарта переливает их в эту хранилку? А потом подгружает из этой хранилки по мере надобности уже без внешней помощи?
Или игруля льёт эти данные в хранилку в готовом для видеокарты виде? Но как она это делает?
Пусть не игруля, а какая-то очень серьёзная программа для физических/химических/etc рассчётов и ей надо залить какой-то датасет. Как это работает?

imul ★★★★★
(16.08.19 17:31:48 MSK)

Ответ на: комментарий от imul 16.08.19 17:12:33 MSK

Как писал выше, я считаю, что на ЦП остаются эти драйверы. А дальше 2 варианта: ЦП , как и раньше дергает dma, но указывает получателем не свою память, а память gpu. Просить gpu забирать из памяти уже не надо.; Или ЦП передаст карту блоков, а GPU по ней сам запросит.

Еще интересней отобразить накопители в общее адресное пространство по типу hUMA. Тогда в некоторых случаях даже «копирование» не нужно будет.

~~boowai~~ ★★★★
(16.08.19 18:14:17 MSK)

Ответ на: комментарий от imul 16.08.19 17:31:48 MSK

Раньше было так. Загрузка данных в память, потом в память видеокарты, потом рисовашки. Процесс рисовашек был трехступенчатым. Как сейчас - не знаю. Но идея древняя как мир.

anonymous
(16.08.19 18:27:53 MSK)

Ответ на: комментарий от anonymous 16.08.19 18:27:53 MSK

Опечатался, процесс инициализации данных для видеокарты был двухступенчатым. Третья ступень - сами рисовашки.

anonymous
(16.08.19 18:29:47 MSK)

Ссылка

Ответ на: комментарий от imul 16.08.19 17:12:33 MSK

ну не видеокарта а операционная система, тут же вопрос только в том как данные будут физически гоняться. сейчас когда система хочет загрузить данные в видеокарту, она их читает с диска в память силами процессора и потом оттуда грузит в видяху, для вычислительных теслакластеров это не очень, поэтому и хотят гнать данные с диска в видеокарту напрямую.. процессору остаётся только указать что брать и куда нести.

Thero ★★★★★
(16.08.19 18:31:22 MSK)

Ответ на: комментарий от imul 16.08.19 17:31:48 MSK

игруля льёт эти данные в хранилку в готовом для видеокарты виде?

Эм, а есть какой-то смысл делать иначе и где-то делается иначе? В крайнем случае драйвер за кадром делает чтоб было збс.

Но как она это делает?

Дёргает обычные API, драйвер делает чтоб всё было збс. Настоящая видеопамять работает как кэш для этого ssd.

anonymous
(16.08.19 18:39:48 MSK)

Ответ на: комментарий от anonymous 16.08.19 18:27:53 MSK

Раньше было так. Загрузка данных в память, потом в память видеокарты, потом рисовашки.

Ну этот процесс мне понятен в том плане где что лежит в виде удобном для хранения и как потом где оказывается уже в виде удобном для использования. Разница может быть в сжатии/шифровании в месте хранения.
А вот как в данном случае будет хранится и в каком виде будет перекладываться не совсем понятно.

imul ★★★★★
(16.08.19 18:42:33 MSK)

Ответ на: комментарий от anonymous 16.08.19 18:39:48 MSK

Эм, а есть какой-то смысл делать иначе и где-то делается иначе? В крайнем случае драйвер за кадром делает чтоб было збс.

Тогда игруля/операционка должна знать как укладывать данные в хранилку. Если это raw, или что-то особенное, то как минимум надо уметь в это писать.

Дёргает обычные API, драйвер делает чтоб всё было збс.

Драйвер видеокарты? Тогда в чём разница? Всё-равно же в этом случае ЦП пуляет в видеокарту. Просто не кусками по мере потребности, а вообще всё что может понадобиться, а может и не понадобиться.

imul ★★★★★
(16.08.19 18:45:48 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 01:43:30 MSK

Нет есть конечно и не PCI шина унутрях, но болт-то как раз PCI.

Ну это полуболт. Болт вообще задумывался как шланг диаметром с петабайт, но потом его урезали, чтобы продать одно и то же, просто убирая урезанные части постепенно. Это маргетинг. Болт, в своей первоначальной задумке, способен напряч писиай так, что от писиая пришлось бы отказаться. Да, всё равно всё упирается в проц в итоге — если но может только два писиай х16, то больше всё равно из него не выжать. Просто писиай — довольно широкая шина в аппаратном смысле, а болт — довольно узкая и работает по типу точка — точка, что логичнее с учётом ограниченности процессора и всяких SLI/CrossFire, которые и так на писиай кладут.

anonymous
(16.08.19 18:47:00 MSK)

Ответ на: комментарий от pihter 16.08.19 04:35:39 MSK

Это потакание сиюминутным тенденциям, вместо заблаговременного системного планирования. Именно такое привело к десктопным приложениям на js-фреймворках

+100

anonymous
(16.08.19 18:48:27 MSK)

Ответ на: комментарий от anonymous 16.08.19 18:48:27 MSK

Один фигню написал, другой заплюсовал, увидев привычное кряхтение про фреймворки. Типичные ЛОРодноклассники.

anonymous
(16.08.19 18:49:56 MSK)

Ответ на: комментарий от Thero 16.08.19 18:31:22 MSK

тут же вопрос только в том как данные будут физически гоняться. сейчас когда система хочет загрузить данные в видеокарту, она их читает с диска в память силами процессора и потом оттуда грузит в видяху, для вычислительных теслакластеров это не очень, поэтому и хотят гнать данные с диска в видеокарту напрямую.. процессору остаётся только указать что брать и куда нести

Как физически они будут гоняться понятно. Непонятно кто и как будет понимать куда в каком формате это писать и как это укладывать. По крайней мере мне это не понятно. Возможно просто от недостатка информации.

imul ★★★★★
(16.08.19 18:52:00 MSK)

Ответ на: комментарий от anonymous 16.08.19 18:47:00 MSK

«Да, всё равно всё упирается в проц в итоге — если но может только два писиай х16, то больше всё равно из него не выжать»

Сейчас все упирается в PCI. Красные и зеленые давно слюнями брызжут, глядя на реализацию тех же плоек.

anonymous
(16.08.19 18:52:01 MSK)

Ответ на: комментарий от pihter 16.08.19 04:39:05 MSK

Это ж, вроде, прошлый век. Я читал про спец-девайсы, которые бай дизайн заточены под взятие хешей для майнинга, мол, они на порядки уделывают в этой работе видюхи.

Это зависит от алгоритмов криптовалюты. А так же от уровня развития майнера. Т.к. желающих продать видяху или даже ферму какому-нибудь лошаре не убавиться.

Для битка, где нужен SHA256 ASIC-карты энергетически выгоднее и по производительности тоже. Есть крипты типа QuarkCoin, где алгоритм такой, что на видяхе не полетит, обязательно проц нужен, про ASIC-карты вообще молчу. И это сделано нарочно, чтобы от мамкиных майнеров избавиться (проблема в том, что популярность крипты обеспечивается мамкиными майнерами (невзлетел)). И есть типа Skycoin, где вообще можно майнить только на Orange Pi и подобных. Причём с ограничением на количество. Да ещё и фотку фермы нужно отправить, чтобы разрешили. С тем же итогом.

Но в общем и целом майнить на фидяхе энергетически не выгодно. Просто если сравнить навар со счётом на электричество.

anonymous
(16.08.19 18:54:58 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 18:52:01 MSK

В игрулях ничего не упирается в pci, если у тебя не pci-e v1 x8 чили что-то вроде.

Плойка это обычный лоу-энд пк с APU и всратым биосом.

anonymous
(16.08.19 18:55:36 MSK)

Ссылка

Ответ на: комментарий от boowai 16.08.19 18:14:17 MSK

Как писал выше, я считаю, что на ЦП остаются эти драйверы. А дальше 2 варианта: ЦП , как и раньше дергает dma, но указывает получателем не свою память, а память gpu. Просить gpu забирать из памяти уже не надо.; Или ЦП передаст карту блоков, а GPU по ней сам запросит.

Вот лежит на диске датасет запакованый. Его распаковали (ЦП), дёрнули ДМА, сказали кому. Дальше видюха получила и куда? Вываливает это частями в хранилку через ДМА, а потом из неё забирает по мере надобности? Или как?

imul ★★★★★
(16.08.19 18:55:40 MSK)

Ответ на: комментарий от imul 16.08.19 18:52:00 MSK

«Как физически они будут гоняться понятно. Непонятно кто и как будет понимать куда в каком формате это писать и как это укладывать. По крайней мере мне это не понятно. Возможно просто от недостатка информации.»

Ничего не поменяется, только медленная основная память не будет использоваться.

anonymous
(16.08.19 18:56:35 MSK)

Ответ на: комментарий от imul 16.08.19 18:55:40 MSK

Паковать и распаковать будет видеокарта.

anonymous
(16.08.19 18:57:55 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 16:28:45 MSK

Скорее всего достаточно поменять *инг на форму слова с окончанием на *ие, чтобы получилось по-русски, хоть и с англицизмом. Русскоязычные официальные термины иногда могут быть достаточно упоротыми, я его не осуждаю.

Не обязательно -ие, вообще вариантов очень много включая перестановку слов. Суть в переводе смысла, а не дословной кальке.

Да, упоростость слова может служить оправданием использования заимствования. Вот только -игн — это вообще не тот случай.

anonymous
(16.08.19 19:02:19 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 18:49:56 MSK

Один фигню написал, другой заплюсовал, увидев привычное кряхтение про фреймворки. Типичные ЛОРодноклассники.

Какие фреймворки, анон-сан? Ты видишь срачи где из нет. Отдохни на опеннете недельку, подходи потом.

anonymous
(16.08.19 19:04:55 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 18:52:01 MSK

Сейчас все упирается в PCI. Красные и зеленые давно слюнями брызжут, глядя на реализацию тех же плоек.

Я о том, что PCI-то может у тебя быть самым расчудесным, но больше чем проц потянет из него всё равно не выжать. Вообще. Если же говорить про нокбуки и прочий хлам, где конфигурация оборудования известна заранее, писиай вообще не нужен, а нужна точка-точка.

anonymous
(16.08.19 19:06:42 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 11:45:16 MSK

ПЗУ — read-only с очень ограниченным числом циклов перезаписи (если это вообще предусмотрено), что вы на нём считать собрались?

имеет место терминологическое непонимание: я имел в виду Постоянное Запоминающее Устройство в смысле энергонезависимой памяти. Термин применил неточно, каюсь

А ты меня понял, но все равно включил Шелдона — кайся тоже!

pihter ★★★★★
(16.08.19 19:08:38 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 12:07:42 MSK

Это и есть видеокарта. «Видео» в её название и наличие у неё видеовыхода это просто историческое наследие.

я все-же не соглашусь. Там специфическим образом устроенно: параллельные конвееры, которые хорошо считают далеко не всякое (тут я, повторюсь, не специалист) это именно попытка использовать устройство разработанное для одно цели для исполнения другой задачи. Сейчас это кажется «бесплатным» (ну, видюхи же уже и так есть, че-б не воспользоваться?) но в будущем мы за это заплатим, имхо

pihter ★★★★★
(16.08.19 19:13:36 MSK)

Ответ на: комментарий от anonymous 16.08.19 12:14:30 MSK

Это asic под одну задачу, а видюхи универсальные (правда производительность будет отвратительная если задача не подходит для архитектуры видеокарты).

так а я о том же

pihter ★★★★★
(16.08.19 19:14:39 MSK)

Ссылка

Ответ на: комментарий от pihter 16.08.19 19:13:36 MSK

Ну это как сказать. Для всяких FlowVision и прочих видях для рабочих станций изображение как таковое не имеет значения — но расчёты. А для пользовательского устройства — да. Но они так и так называются видео-. Даже для т.н. «машинного обучения» видеокарты, что вообще как минимум странно.

anonymous
(16.08.19 19:15:47 MSK)

Ответ на: комментарий от anonymous 16.08.19 18:56:35 MSK

А, я понял наконец-то. Всё проще, чем я себе напридумывал.

imul ★★★★★
(16.08.19 19:16:50 MSK)

Ссылка

Ответ на: комментарий от pihter 16.08.19 19:13:36 MSK

Ну так и процессор по сравнению с видеокартой тоже «хорошо считают далеко не всякое». Именно потому используют их вместе.

anonymous
(16.08.19 19:17:07 MSK)

Ответ на: комментарий от anonymous 16.08.19 19:15:47 MSK

Скорее внешнее вычислительное устройство — PPU — periphery processor unit. Или, для Среднего Урала, — popov processor unit.

anonymous
(16.08.19 19:18:00 MSK)

Ответ на: комментарий от anonymous 16.08.19 12:16:32 MSK

У тебя каша в голове.

ну, такие заявления, если я не метапрог, надо подтверждать (хотя бы тезисно) в чем я не прав? ты разъясни, а я послушаю, мож ума разума наберусь (без сарказма), я выше отметил, что я в сабжевом вопросе плаваю

Единственная задача большинства чипов в компе это вычисления, они натурально не умеют ничего другого

ну тут бы я поспорил: большинство — аналоговые: они каждый про свое, но уж не про вычисления

Видеокарты не исключение.

видеокарта — це ж не чип, це — компьютер в компьютере, только заточенная под определенную задачу

pihter ★★★★★
(16.08.19 19:19:59 MSK)

Ответ на: комментарий от anonymous 16.08.19 19:18:00 MSK

«Скорее внешнее вычислительное устройство — PPU — periphery processor unit. Или, для Среднего Урала, — popov processor unit.»

На сайте Nvidia выжжено клеймо - Graphic Card.

anonymous
(16.08.19 19:20:33 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 12:20:03 MSK

Зачем внутри вычислителя изобретать еще один вычислитель
Специализация. Архитектура процев заточена под быстрый однопоток, видеокарты под параллельные вычисления.

видеокарты заточены не под параллельные вычисления, а под отрисовку сцен в крайзисе (или че там у вас щас), не подменяйте понятия.

pihter ★★★★★
(16.08.19 19:22:49 MSK)

Ответ на: комментарий от pihter 16.08.19 19:19:59 MSK

Тогда любой soc (включая cpu) это «компьютер в компьютере», их там в компьютере тысячи штук и каждый занят чем-то своим, каждый со своей бинарной проприетарной прошивкой и соответствующими бэкдорами.

anonymous
(16.08.19 19:24:42 MSK)

Ответ на: комментарий от pihter 16.08.19 19:22:49 MSK

«видеокарты заточены не под параллельные вычисления, а под отрисовку сцен в крайзисе (или че там у вас щас), не подменяйте понятия.»

Заточены под вычисления, параллельные, все, что они делают большую часть времени - высисляют (матрицы, шейдеры и.т.д). Майнеры вас бы порвали на лоскутки.

anonymous
(16.08.19 19:25:41 MSK)

Ссылка

Ответ на: комментарий от Aceler 16.08.19 14:27:49 MSK

Так что сказать, что видеокарта заточена под видео уже нифига нельзя, она давно уже заточена под вычисления на шейдерах. То, что такие вычисления востребованы видеокартой, ради этого шейдерные блоки прикручивают к той части, что делает геометрию, это просто из-за удобства использования в играх.

я тут и не спорю, сегодня оно кажется бесплатным: видюхи уже есть, они заточены под определенный класс вычислений, бери-не-хочу. но ведь и телефонные линии когда-то казались идеальной последней милей, и использование надутой камеры от уазика казалось идеальным спасательным кругом )

короче, я повторяюсь, я думаю уже до всех дошла моя мысль — будем посмотреть что получится

pihter ★★★★★
(16.08.19 19:36:45 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 19:24:42 MSK

«Тогда любой soc (включая cpu) это «компьютер в компьютере», их там в компьютере тысячи штук и каждый занят чем-то своим, каждый со своей бинарной проприетарной прошивкой и соответствующими бэкдорами.»

Сидишь на Tails, обмотавшись фольгой с головы до ног ?

anonymous
(16.08.19 19:37:28 MSK)

Ответ на: комментарий от imul 16.08.19 18:55:40 MSK

В данном случае, и если данных слишком много, то лучше из основной памяти вернуть перекодированный набор на диск и передать адреса блоков gpu.

Тогда лучше или сразу использовать несжатые данные, или в совместимом формате.

В представленной nvidia реализации я вижу только чтение. Теоретически можно и записывить, и организовать файлы подкачки для gpu.

~~boowai~~ ★★★★
(16.08.19 19:41:46 MSK)

Ответ на: комментарий от anonymous 16.08.19 19:37:28 MSK

Не, венда десяточка, мне не о чем волноваться на самом деле. Кроме сохранности данных, а для этого есть бэкапы. И ключи просрать конечно неприятно было бы, но не смертельно. Я просто интересуюсь вопросами каких там дыр в железе опять нарыли (ещё до того как это стало мейнстримом).

anonymous
(16.08.19 19:45:44 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 19:15:47 MSK

Даже для т.н. «машинного обучения» видеокарты, что вообще как минимум странно.

об том и мое негодование )

pihter ★★★★★
(16.08.19 19:51:04 MSK)

Ответ на: комментарий от boowai 16.08.19 19:41:46 MSK

В представленной nvidia реализации я вижу только чтение.

Тогда я не понимаю как датасет окажется в нвме, если видеокарта оттуда может только читать.

imul ★★★★★
(16.08.19 19:52:04 MSK)

Ответ на: комментарий от anonymous 16.08.19 19:17:07 MSK

Ну так и процессор по сравнению с видеокартой тоже «хорошо считают далеко не всякое». Именно потому используют их вместе.

в таком случае нужно придумать другой процессор (мб сопроцессор) но не на видюху вешать. Возьмите наработки — запилите специальный девайс, а видюхам оставьте игры.

у меня холодильник холодит пиво, не надо пользоваться тем, что там холодно, чтоб охлаждать лазер — лазеру нужно сразу городить свое охлажедние

pihter ★★★★★
(16.08.19 19:53:54 MSK)

Ссылка

Ответ на: комментарий от pihter 16.08.19 19:51:04 MSK

«Даже для т.н. «машинного обучения» видеокарты, что вообще как минимум странно.

об том и мое негодование )»

Так это же мейнстрим распилов - куда ни плюнь про ИИ и квантовые вычисления говорят.

anonymous
(16.08.19 19:54:06 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 19:18:00 MSK

Или, для Среднего Урала, — popov processor unit.

щас смешно было

pihter ★★★★★
(16.08.19 19:54:43 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 19:24:42 MSK

Тогда любой soc (включая cpu) это «компьютер в компьютере», их там в компьютере тысячи штук и каждый занят чем-то своим,

да, а где тут противоречие с тем, что я сказал?

pihter ★★★★★
(16.08.19 19:56:33 MSK)

Ссылка

Ответ на: комментарий от imul 16.08.19 19:52:04 MSK

Он уже там. Давно лежал, или ЦП только что подготовил. Конечно это специфическое решение, иначе бы уже в directx добавили бы.

~~boowai~~ ★★★★
(16.08.19 20:02:54 MSK)

Ответ на: комментарий от pihter 16.08.19 19:19:59 MSK

аналоговые: они каждый про свое

Аналоговые это когда они работают с аналоговым сигналом. Извиняй, но таки каша.

anonymous
(16.08.19 20:14:52 MSK)

Ответ на: комментарий от anonymous 16.08.19 20:14:52 MSK

Аналоговые это когда они работают с аналоговым сигналом. Извиняй, но таки каша.

сам ты каша: я имел в виду всякие шим-контроллеры и операционные усилители. Посмотри на материнку — и скажи каких микрух больше

именно про аналоговый сигнал

pihter ★★★★★
(16.08.19 20:18:14 MSK)

Похожие темы