вычисления на nvidia

cuda, intel, network perfomance

1

1

Привет всем! Кто-что видел в плане переброса сетевого трафика на видеокарту? Вроде у CUDA есть что-то для этого. Мне нужно чтобы не CPU обрабатывал трафик, а GPU, есть что-то реализованное уже?

Ссылка

←	nvidia блоб

Linux и sata->ide, ide->sata конверторы

→

неа

~~yakunprufovnebudet~~
(27.01.14 13:33:34 MSK)

Ссылка

Операции копирования из оперативки в оперативку видеокарты и обратно очень долгие же! Никаких преимуществ не будет.

~~Eddy_Em~~ ☆☆☆☆☆
(27.01.14 13:37:15 MSK)

Ответ на: комментарий от Eddy_Em 27.01.14 13:37:15 MSK

Операции копирования из оперативки в оперативку видеокарты и обратно очень долгие же!

это 2Г/с долго? о_О

megabaks ★★★★
(27.01.14 13:38:09 MSK)

Ответ на: комментарий от megabaks 27.01.14 13:38:09 MSK

там есть тема типа pcidirect как то так

init_ ★★★
(27.01.14 13:42:03 MSK) автор топика

Ответ на: комментарий от init_ 27.01.14 13:42:03 MSK

Скорее dmadirect. Доступ напрямую в память другой карточки. Вроде как работает при использование в связки с infiniband.
А вообще то есть такая работа http://www.date-conference.com/proceedings/PAPERS/2010/DATE10/PDFFILES/02.6_4...

b_a
(27.01.14 14:02:26 MSK)

Ответ на: комментарий от megabaks 27.01.14 13:38:09 MSK

Ну, кое-какие алгоритмы обработки изображений мне пришлось только на CPU реализовывать, т.к. время копирования на порядок было больше времени вычислений. И где это 2Г/с? У меня железо старое, там вряд ли и 1Г/с нашкребется...

~~Eddy_Em~~ ☆☆☆☆☆
(27.01.14 14:08:28 MSK)

Ответ на: комментарий от Eddy_Em 27.01.14 14:08:28 MSK

У меня железо старое

это совсем другая история, не находишь!?

И где это 2Г/с?

[CUDA][OpenCL]Где? (комментарий)

megabaks ★★★★
(27.01.14 14:11:21 MSK)

А зачем?

Deleted
(27.01.14 14:12:14 MSK)

Ответ на: комментарий от megabaks 27.01.14 14:11:21 MSK

это совсем другая история, не находишь!?

Дык, ТС ничего про свое железо не говорил. Может, у него вообще одна из первых кудоподдерживалок?

~~Eddy_Em~~ ☆☆☆☆☆
(27.01.14 14:18:00 MSK)

https://developer.nvidia.com/gpudirect но без inifiband не как не получится. TCP/IP стек использует CPU, а в inifiband TCP/IP скорее нужно по привычке, чем для реальной работы, там свои протоколы со своей адресацией всего что только можно.

AlexVR ★★★★★
(27.01.14 14:21:58 MSK)

Ссылка

Ответ на: комментарий от Deleted 27.01.14 14:12:14 MSK

А зачем?

Для уменьшения количества раз копирования данных. В той же оперативке в обычной ситуации, это минимум два раза на узел, не считая копирования в память GPU.

AlexVR ★★★★★
(27.01.14 14:27:41 MSK)

Ссылка

Ответ на: комментарий от Eddy_Em 27.01.14 14:18:00 MSK

на самом деле меня не интересует какая видяха будет стоять, я хочу прокачать в нате 10 гигабит трафона, щас у меня 2 цпу пашут по 8 ядер, не справляется, потолок 4 гигабита

init_ ★★★
(27.01.14 14:48:40 MSK) автор топика

Ответ на: комментарий от b_a 27.01.14 14:02:26 MSK

да-да точно, нашел вот такое дело, но как применить... http://code.google.com/p/netgpu/

init_ ★★★
(27.01.14 14:53:02 MSK) автор топика

Ответ на: комментарий от init_ 27.01.14 14:48:40 MSK

Ищи аппаратные решения. Ну а потолок похож на упор в частоту процессоров.

AlexVR ★★★★★
(27.01.14 14:55:22 MSK)

Ссылка

Ответ на: комментарий от init_ 27.01.14 14:48:40 MSK

И ответь себе на вопрос, а причем тут вообще GPU?

AlexVR ★★★★★
(27.01.14 14:57:11 MSK)

Тебе в данном случае надо решать, можно ли как-то пересобрать ядро, что бы оно на таких скоростях справлялось.

AlexVR ★★★★★
(27.01.14 14:58:18 MSK)

Ссылка

Ответ на: комментарий от init_ 27.01.14 14:53:02 MSK

10 гигов не прокачает. В том смысле что латентность большая будет. Насколько я понимаю на данный момент нет возможности связать напрямую «память» сетевой карты и память видеокарты. Для таких скоростей Network processors хорошо, но дорого.
Intel активно пилит dpdk и скоро возможно все будет хорошо.

b_a
(27.01.14 15:04:14 MSK)

Ссылка

Ответ на: комментарий от AlexVR 27.01.14 14:57:11 MSK

у тебя на GPU ядер очень много маленьких, то есть количество потоков очень большое (по сравнению с обычным процессором), на нем можно было бы считать эти сетевые пакеты. Я так понимаю все упирается в conntrack (количество трекинговых пакетов)

init_ ★★★
(27.01.14 22:30:41 MSK) автор топика

Ответ на: комментарий от init_ 27.01.14 22:30:41 MSK

Нет. Ты не правильно понимаешь архитектору вычислений на GPU. И совсем не понимаешь как работает стек TCP/IP. Забудь о том, что бы сделать NAT через GPU, это не реально. Как и на автобусе нельзя одновременно развести 20 людей в разные концы города. Он вроде и вмещает толпу народа, но везет их по одному маршруту.

AlexVR ★★★★★
(28.01.14 06:39:51 MSK)

Ответ на: комментарий от AlexVR 28.01.14 06:39:51 MSK

ну а как у мелланокса сделан infiniband? они же на куде считают

init_ ★★★
(28.01.14 07:31:12 MSK) автор топика

Ответ на: комментарий от init_ 28.01.14 07:31:12 MSK

Что они считают? Если ты про NVidia GPUDirect, то на GPU считают какие-нибудь диф.уравнения, а InfiniBand используют для передачи данных с узла на узел с минимизацией затрат на CPU, за счет почти прямой записи из памяти одной GPU в память другой GPU.

AlexVR ★★★★★
(28.01.14 09:23:13 MSK)

Ссылка

Ответ на: комментарий от init_ 28.01.14 07:31:12 MSK

И ещё, infiniband-у tcp/ip не нужен при передачи данных, у него свои протоколы.

AlexVR ★★★★★
(28.01.14 09:25:19 MSK)

Ссылка

Ответ на: комментарий от init_ 27.01.14 14:48:40 MSK

на самом деле меня не интересует какая видяха будет стоять, я хочу прокачать в нате 10 гигабит трафона, щас у меня 2 цпу пашут по 8 ядер, не справляется, потолок 4 гигабита

Я думаю это будет тебе интересно по твоей проблеме: http://www.redhat.com/promo/summit/2008/downloads/pdf/Thursday/Mark_Wagner.pdf

AlexVR ★★★★★
(31.01.14 11:42:20 MSK)