Ускорители NVIDIA получат прямой канал взаимодействия с NVMe накопителями

2

2

NVIDIA представила GPUDirect Storage — новую возможность, которая позволяет графическим процессорам напрямую взаимодействовать с хранилищем NVMe. Технология использует RDMA GPUDirect для передачи данных в локальную память графического процессора без необходимости задействовать центральный процессор и системную память. Этот шаг является частью стратегии компании по расширению охвата приложений в области анализа данных и машинного обучения.

Ранее, NVIDIA выпустила RAPIDS — набор инструментов и библиотек с открытым исходным кодом для поддержки аналитики на основе графических процессоров и добавила поддержку ускорения на GPU в Apache Arrow и Spark.

Закрытая альфа-версия уже стартовала для некоторых клиентов компании, публичная бета запланирована на ноябрь 2019 года.

>>> Подробности

Ссылка

←	Вышел PyTorch 1.2.0

DUMP Казань - конференция разработчиков Татарстана: CFP и билеты по начальной цене

→

← 1 2 3 4 5 →

Ответ на: комментарий от anonymous 16.08.19 01:39:29 MSK

Болт разве не PCI? {o}_{0}

Нет есть конечно и не PCI шина унутрях, но болт-то как раз PCI.

anonymous
(16.08.19 01:43:30 MSK)

Ответ на: комментарий от anonymous 15.08.19 22:42:12 MSK

Архитектурно x86 - это самое крутое что есть на сегодняшний день.

Кто же признается, что это говно, когда в него вложено столько инвестиций

annulen ★★★★★
(16.08.19 01:49:35 MSK)

Ответ на: комментарий от Aceler 15.08.19 19:06:24 MSK

То, что в некоторых устройствах они объединены, не значит, что это всегда одно и то же.

некоторых

ну... я бы не сказал, что ты не лукавишь ) к тому же на графических акселераторах считать точно так же нелогично как и на видеокартах

не, я, конечно понимаю почему так происходит, но, ИМХО, это ей-ей путь внитуда. Это потакание сиюминутным тенденциям, вместо заблаговременного системного планирования. Именно такое привело к десктопным приложениям на js-фреймворках

pihter ★★★★★
(16.08.19 04:35:39 MSK)

Ответ на: комментарий от annulen 16.08.19 00:13:58 MSK

Есть специальные видюхи для майнеров, в них нет видеовыходов

Это ж, вроде, прошлый век. Я читал про спец-девайсы, которые бай дизайн заточены под взятие хешей для майнинга, мол, они на порядки уделывают в этой работе видюхи.

Но я в теме не разбираюсь, запросто может быть что лапши наелся (ибо кругом, чет, не видать этих спец девайсов)

pihter ★★★★★
(16.08.19 04:39:05 MSK)

А с какими именно видеокартами это будет работать не сообщается?

anonymous
(16.08.19 04:58:09 MSK)

Ссылка

Ответ на: комментарий от kirk_johnson 15.08.19 13:43:31 MSK

А работает с nvmeof, или локальную железяку требует?

Локальную, конечно же.

mv ★★★★★
(16.08.19 05:12:07 MSK)

Ответ на: комментарий от anonymous 15.08.19 23:27:12 MSK

Куда ты денешься от шины. Это штука исключит проц из цепочки перекладывания данных. А дальше 2 варианта: или проц все еще дает команды, а данные идут по короткому пути; или проц дает gpu карту блоков(файлов), а тот сам командует. Вообще данные все еще будут проходить через черту города «CPU», но по объездной. А прямые пути надо не на программном уровне добавлять.

~~boowai~~ ★★★★
(16.08.19 06:44:36 MSK)

Ответ на: комментарий от Meyer 15.08.19 13:35:22 MSK

А красные шевелятся в этом направлении?

Еще в 2016.

Radeon Pro SSG: A GPU with 1TB of SSD storage attached

Given that beta developer kits are going on sale for a cool $10,000, we don’t expect to see many of these units ship, period — but if the technology proves as useful as AMD’s demo implies, we may see Nvidia move towards this concept as well. Faster PCI Express storage and higher-end GPUs may make the pairing more attractive in the future once Vega arrives.

Какой-то там очень ограниченный эксперимент с кастомизацией RX-480 и с ценником 10тыс долл ?, а продолжение было этого эксперимента последовало ? Что там с новыми картами ? Да и больше интересует не столько прямое взаимодействие с дисками, хоть это очень важный шаг, сколько прямая поддержка тензоров.

Deleted
(16.08.19 08:07:35 MSK)
Последнее исправление: Deleted 16.08.19 08:11:27 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от mv 16.08.19 05:12:07 MSK

Было бы круто, если бы он мог напрямую через IB делать запросы, тоже без CPU.

~~kirk_johnson~~ ★☆
(16.08.19 08:38:30 MSK)

Ответ на: комментарий от pihter 16.08.19 04:39:05 MSK

«Это ж, вроде, прошлый век. Я читал про спец-девайсы, которые бай дизайн заточены под взятие хешей для майнинга, мол, они на порядки уделывают в этой работе видюхи.»

Домашние хомяки еще продолжают майнить ? Я думал, что этот лохотрон изжил себя ))

anonymous
(16.08.19 08:54:31 MSK)

Ответ на: комментарий от anonymous 16.08.19 08:54:31 MSK

хехе, парочка пацанов, которые гопничали на раёне в 90х сейчас имеют несколько шахт по майнингу битка и лайта емнип. и блждать они даже понимают что там происходит и какой бабловыхлоп от этого идет.

в майнерах связь с накопителем совершенно не нужна. там обмен данными с процом на уровне плинтуса.

pfg ★★★★★
(16.08.19 09:37:28 MSK)

Ссылка

Ответ на: комментарий от pihter 16.08.19 04:35:39 MSK

на графических акселераторах считать точно так же нелогично как и на видеокартах

На устройствах, предназначенных для проведения расчётов, нелогично считать, конечно же. Логично считать на RAMDAC, или на DSP в звуковой карте, наверное?

Aceler ★★★★★
(16.08.19 09:56:26 MSK)

Ответ на: комментарий от anonymous 16.08.19 08:54:31 MSK

Домашние хомяки еще продолжают майнить ? Я думал, что этот лохотрон изжил себя ))

я и не пробовал. но ко мне регулярно подходят за разъясненниями мол про что это. Причем люди настолько далекие от ИТ, что МММ курит в сторонке

pihter ★★★★★
(16.08.19 10:19:24 MSK)

Ссылка

Ответ на: комментарий от Aceler 16.08.19 09:56:26 MSK

На устройствах, предназначенных для проведения расчётов, нелогично считать, конечно же.

Я спорить не берусь, мож я чего не понимаю, но, ИМХО, нелогично, да. Оно ж предназначено для помощи в определенного вида расчетах при рисовании графики. Именно поэтому оно географически на видюховском процессоре, а не на основном. Его приспосабливают для работы, это да, но, на мой взгляд, правильнее было бы изобрести отдельное устройство.

Мировая история показывает что ели из %предмет% пытаются сделать что-то, для чего оно изначально не планировалось, то, на первый взгляд это кажется капец какой ловкой идеей, а потом ВНЕЗАПНО выясняется что дальнейшее использование/развитие упирается в системную проблему и приходится изобретать заново, выбрасывая на мороз годовые наработки и гору накостыленных за годы использования не по назначению костылей. Причем эти костыли потом десятилетиями тянутся за всем человечеством.

Пример, если почесать репку, выдумать несложно: например, когда-то магнитные ленты изобрели для записи звука, а потом придумали записывать на них произвольную цифровую информацию, невзирая на невозможность рандомного доступа (для звука был удобен последовательный доступ, поэтому лента заточена под последовательный), и сколько уже лет ни один из нас не сохранялся на кассету, а tar по-прежнему в строю и, прежде, чем заглянуть в архив, его нужно весь распаковать (неудобство гиперболизированно сознательно, не пинать)

думаю, мысль ясна

pihter ★★★★★
(16.08.19 10:34:47 MSK)

Ответ на: комментарий от Aceler 16.08.19 09:56:26 MSK

огично считать на RAMDAC, или на DSP в звуковой карте, наверное?

на ЦП + ОЗУ + ПЗУ, конечно же. Собственно, компьютер — он же вычислитель по определению, то есть, машина для проведения вычислений. Зачем внутри вычислителя изобретать еще один вычислитель для вычислений — загадка.

Ну если тебе не удобно управлять вычислениями на той же машине, на которой они происходят, ну заведи соседнюю-терминальную, построй инфраструктуру, собсна, все так и делают.

То есть, я про что: вместо того, чтоб развивать вычислители которые для этой задачи приспособлены плохо «бай дизайн», на мой взгляд, нужно развивать вычислители, которые для этого и изобретались.

Пусть JS оживляет веб страницы, а для десктопного софта есть Qt, от я про что

pihter ★★★★★
(16.08.19 10:44:11 MSK)

Ответ на: комментарий от pihter 16.08.19 10:44:11 MSK

а для десктопного софта есть GTK

FTFY

eternal_sorrow ★★★★★
(16.08.19 11:14:51 MSK)

Ответ на: комментарий от eternal_sorrow 16.08.19 11:14:51 MSK

извините: был напуган

pihter ★★★★★
(16.08.19 11:18:02 MSK)

Ссылка

Ответ на: комментарий от anonymous 15.08.19 20:59:22 MSK

ого, неужели наконец то оптимус завезли. сколько лет там с фака Линуса прошло?

eternal_sorrow ★★★★★
(16.08.19 11:45:10 MSK)

Ответ на: комментарий от pihter 16.08.19 10:44:11 MSK

ПЗУ — read-only с очень ограниченным числом циклов перезаписи (если это вообще предусмотрено), что вы на нём считать собрались?

anonymous
(16.08.19 11:45:16 MSK)

Ответ на: комментарий от eternal_sorrow 16.08.19 11:45:10 MSK

Лучше поздно, чем никогда. Вот видите, хоть кто-то заботится о линуксе. Амд-то заботится только о фрибсд в плойках, что бы там ни говорили.

anonymous
(16.08.19 11:48:16 MSK)

Ответ на: комментарий от anonymous 16.08.19 11:48:16 MSK

у AMD гибридная графика работала всегда

eternal_sorrow ★★★★★
(16.08.19 11:49:22 MSK)

Ответ на: комментарий от eternal_sorrow 16.08.19 11:49:22 MSK

Особенно с fglrx, да.

anonymous
(16.08.19 11:50:41 MSK)

Ответ на: комментарий от anonymous 16.08.19 11:50:41 MSK

во времена, когда fglrx был актуален была гибридная графика?

eternal_sorrow ★★★★★
(16.08.19 11:52:09 MSK)

Что такое NVMe и зачем оно не нужно?

anonymous
(16.08.19 11:56:32 MSK)

Ответ на: комментарий от annulen 16.08.19 01:49:35 MSK

Сколько широкоиспользуемы процессоров ты разработал, чтобы делать такие заявлени?

anonymous
(16.08.19 12:04:36 MSK)

Ответ на: комментарий от Aceler 15.08.19 15:38:39 MSK

Бигдатым оно нафига? Это скорее для числодробилок.

A-234 ★★★★★
(16.08.19 12:06:30 MSK)

Ответ на: комментарий от eternal_sorrow 16.08.19 11:52:09 MSK

Внезапно, да. На самом деле он был актуален для всех поддерживаемых им карточек, свободный драйвер был большим дном. Ну и потом, нвидия придумала всякие универсальные libGL чтобы решить проблему навсегда. То, что кривая меза постоянно лезет куда не просят, не может не раздражать.

anonymous
(16.08.19 12:07:38 MSK)

Ссылка

Ответ на: комментарий от pihter 15.08.19 16:34:56 MSK

какой-нибудь калькулятор-девайс в pci-e шину и пусть калькулирует

Это и есть видеокарта. «Видео» в её название и наличие у неё видеовыхода это просто историческое наследие.

anonymous
(16.08.19 12:07:42 MSK)

Ответ на: комментарий от linuxnewbie 15.08.19 16:40:30 MSK

Нет таких, на проф картах игрушки отлично идут, даже если у карты нет своего видеовыхода - картинку можно передавать на другоую карту.

anonymous
(16.08.19 12:10:09 MSK)

Ссылка

Ответ на: комментарий от pihter 16.08.19 04:39:05 MSK

Это asic под одну задачу, а видюхи универсальные (правда производительность будет отвратительная если задача не подходит для архитектуры видеокарты).

anonymous
(16.08.19 12:14:30 MSK)

Ответ на: комментарий от pihter 16.08.19 04:35:39 MSK

У тебя каша в голове. Единственная задача большинства чипов в компе это вычисления, они натурально не умеют ничего другого. Видеокарты не исключение.

anonymous
(16.08.19 12:16:32 MSK)

Ответ на: комментарий от pihter 16.08.19 10:44:11 MSK

Зачем внутри вычислителя изобретать еще один вычислитель

Специализация. Архитектура процев заточена под быстрый однопоток, видеокарты под параллельные вычисления.

anonymous
(16.08.19 12:20:03 MSK)

Ответ на: комментарий от A-234 16.08.19 12:06:30 MSK

Здрассти. А бигдату на чем хранить?

И эзотерической разницы между обработчиком бигдаты и числодробилкой я не вижу.

Aceler ★★★★★
(16.08.19 12:27:22 MSK)

Ответ на: комментарий от Aceler 16.08.19 12:27:22 MSK

А что вы там с бигдатой обрабатывать собираетесь? Всяческие контрольные суммы и восстановление ошибок контроллерами и так считаются, тут видюха не нужна. Видюха нужна для вычислений, для обращения матриц или моделирования взаимодействия кучи частиц. Разницу улавливаете?

A-234 ★★★★★
(16.08.19 12:43:00 MSK)

Ответ на: комментарий от A-234 16.08.19 12:43:00 MSK

нужна для вычислений, для обращения матриц или моделирования взаимодействия кучи

Я был уверен, что видюха нужна, чтобы складывать матрицы. Это единственная решаемая ей задача.

anonymous
(16.08.19 12:55:25 MSK)

Серьёзно? Во влажных мечтах геймеров это ещё 15-20 лет назад было. Ну, вот, наконец-то запилили.

tiinn ★★★★★
(16.08.19 13:09:45 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 12:04:36 MSK

Чтобы оценить еду, не нужно быть поваром

annulen ★★★★★
(16.08.19 14:03:12 MSK)

Ответ на: комментарий от annulen 16.08.19 14:03:12 MSK

Вроде разговор был не про кухарок, а про архитектуру процессоров - вопрос о котором по определению могут только рассуждать специалисты.

anonymous
(16.08.19 14:05:37 MSK)

Ссылка

Ответ на: комментарий от A-234 16.08.19 12:43:00 MSK

У тебя интересные представления о бигдате.

Например, у тебя есть список по загрузке всех самолётов всех аэропортов России за последние пять лет, тебе надо рассчитать, какие рейсы на следующий год оставить, какие перенести, какие заменить стыковками или соседними аэропортами.

Вот это бигдата. А контрольные суммы считать - это не бигдато.

Aceler ★★★★★
(16.08.19 14:20:00 MSK)
Последнее исправление: Aceler 16.08.19 14:20:19 MSK (всего исправлений: 1)

Ответ на: комментарий от pihter 16.08.19 10:34:47 MSK

Мысль ясна, но история смешнее.

Видеоакселераторы так и были специализированными устройствами для расчёта 3d сцен. Они умели фильтровать текстуры, натягивать их на треугольники, собирать сцену в вьюпорт и делать z-буферинг. Не знаю эквивалентного перевода двух последних терминов на русский язык...

Где-то во времена GeForce 2 программисты решили, что этого мало, и ради спецэффектов добавили шейдеры. Шейдеры предлагали тьюринг-полный язык программирования для обработки массивов данных. Изначально текстур или буфера вывода. Вообще -чего угодно.

Сегодня дешманская amd rx560 содержит 768 блоков шейдеров, ЕМНИП. Каждый из которых работает в несколько потоков. И один блок геометрии.

Так что сказать, что видеокарта заточена под видео уже нифига нельзя, она давно уже заточена под вычисления на шейдерах. То, что такие вычисления востребованы видеокартой, ради этого шейдерные блоки прикручивают к той части, что делает геометрию, это просто из-за удобства использования в играх.

Aceler ★★★★★
(16.08.19 14:27:49 MSK)

Ответ на: комментарий от Aceler 16.08.19 14:27:49 MSK

768 блоков шейдеров, ЕМНИП. Каждый из которых работает в несколько потоков

Это маркетинговый звездёж. Там столько ALU, выполняющих SIMD команды, и с таким маркетинговым звездежом у обычных процев с AVX можно было бы насчитать 100500 «потоков», которые не являются таковыми.

anonymous
(16.08.19 15:44:22 MSK)

Ответ на: комментарий от anonymous 16.08.19 15:44:22 MSK

На процах с avx512 вполне выполняют много сервисов одновременно. На каждом ядре.

https://gamozolabs.github.io/fuzzing/2018/10/14/vectorized_emulation.html

anonymous
(16.08.19 15:50:14 MSK)

Ответ на: комментарий от anonymous 16.08.19 15:50:14 MSK

SIMD это по определению одна одинаковая операция над всеми компонентами вектора, и по твоей же ссылке пишут, что неиспользуема часть вектора просто отключается и простаивает, еcли это не так (в видеокартах аналогично).

anonymous
(16.08.19 16:05:42 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 11:56:32 MSK

Что такое NVMe и зачем оно не нужно?

Всего лиш эсэссди на писиай. Маркетинг, не более. А не нужен потому что время жизни эсэсди обратно пропорционально интенсивности его использования. А ОТ не нужно, т.к. сама по себе суть — видеокарта с драйвером энвиэмйэ — это сомнительное решение в плане компьютера не как набора доисторических костылей и подпорок.

anonymous
(16.08.19 16:09:56 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.08.19 12:55:25 MSK

Я был уверен, что видюха нужна, чтобы складывать матрицы. Это единственная решаемая ей задача.

Ещё вектор на матрицу может. И эмулировать VGA.

anonymous
(16.08.19 16:13:27 MSK)

Ссылка

Ответ на: комментарий от Aceler 16.08.19 14:27:49 MSK

собирать сцену в вьюпорт и делать z-буферинг. Не знаю эквивалентного перевода двух последних терминов на русский язык...

Мальчик научился добавлять окончание -инг, чтобы получить новое слово. Но мальчик не умеет делать подобного в русском. Дурак.

anonymous
(16.08.19 16:20:23 MSK)

Ответ на: комментарий от anonymous 16.08.19 16:20:23 MSK

Скорее всего достаточно поменять *инг на форму слова с окончанием на *ие, чтобы получилось по-русски, хоть и с англицизмом. Русскоязычные официальные термины иногда могут быть достаточно упоротыми, я его не осуждаю.

anonymous
(16.08.19 16:28:45 MSK)

Ответ на: комментарий от Aceler 16.08.19 14:20:00 MSK

Не представляю как параллелить такую задачу, все что хорошо умеет делать видюха это насосать данных, загрузить процессоры и собрать результат. Всякие запросы к базам данных получают результат практически в момент считывания, там узким местом всегда была пропускная способность шины. Ваш пример вообще не биг дата, жалкие миллион-полтора полетов в год даже за пять лет можно и на смартфоне обсчитать. Ну допустим, к черту самолеты, поставим задачу наведения статистики по розничной торговле пивом на территории России. Вот тут начинается адъ, это, боюсь, миллиарды транзакций в год. Но что там распараллеливать? Все опять в шину упрется а не в производительность потоковых процессоров.

A-234 ★★★★★
(16.08.19 17:02:45 MSK)