Отладка кода для CUDA

0

1

Добрый день,

Не так давно я начал изучать программирование под CUDA, и столкнулся с проблемой отладки кода для устройства (не для хоста). Проблема состоит в том, что отладчик не входит в функцию, помеченную как __device__ или как __global__. В интернете я прочитал, что такое возможно если не сгенерировать отладочные символы: nvcc -g -G test.cu -o test Но всё равно даже cuda-gdb ругается на то, что отладочные символы не были загружены. У меня подозрение, что nvcc их не генерирует. Ну или генерирует, но тогда не читает.

Понимаю, что могу шокировать :) но у меня optimus ноут, работающий на bumblebee. Любое CUDA приложение через optirun выдаёт «правдивые» результаты. Например, я пытаюсь отладить приложение через optirun cuga-gdb test, и оно запускается, выполняется, но к сожалению отладчик не заходит внутрь CUDA кода.

В Windows такие же проблемы, и в VS 2010 я не могу зайти внутрь функций. Перерыв пол интернета, у меня сложилось впечатление, что либо люди отлаживают код при наличии 2-х видеокарт (у меня как бы Intel и NVIDIA 540m, но я думаю, что Intel не канает и мне нужны две видеокарты), либо в эмуляции (которой уже нет в 5-ой CUDA).

Подскажите, как у вас работает отладка, всё ли я делаю правильно или я что-то упустил. Ну и вообще будет супер, если кто имел опыт с CUDA разработкой при наличии ноута и Optimus видюхи.

Спасибо заранее.

Ссылка

←	Ogre - отброс теней у BoundingBox

header тетриса

→

Я забил на cuda-gdb. Он постоянно откалывает такие фокусы, а код с thrust им вообще не отладишь.

В ядрах можно вызывать printf, мне этого достаточно.

anonymous
(05.11.12 14:50:49 MSK)

Ответ на: комментарий от anonymous 05.11.12 14:50:49 MSK

P.S. Разрабатываю, кстати, на оптимусе.

anonymous
(05.11.12 14:51:32 MSK)

Ссылка

Отладка кода не нужна. Почитай что про нее пишут керниган и ричи. Я за ссю жизнь не пользовался отладчиком ни разу. А лет мне 23. Так что просто забей на отладчик.

anonymous
(05.11.12 15:20:19 MSK)

Ответ на: комментарий от anonymous 05.11.12 15:20:19 MSK

А лет мне 23

oh shi~!

anonymous
(05.11.12 15:22:22 MSK)

Ссылка

Ответ на: комментарий от anonymous 05.11.12 14:50:49 MSK

Спасибо, я понимаю, что он «чмо» :) Возможно я также с printf и поступлю. Потому как читал отзывы, что народ сидит и гипнотизирует код в поисках ошибок. А технически, вообще отладчик работает на optimus картах без дополнительного GPU? У вас получалось хоть с помощью студии, хоть CUDA 5 (Eclipse) зайти в код устройства?

Кстати, имеет ли смысл посмотреть в сторону OpenCL? Или всё равно и OpenCL отлаживать придётся через printf :)

Vest
(05.11.12 15:36:59 MSK) автор топика

Ответ на: комментарий от Vest 05.11.12 15:36:59 MSK

Кстати, имеет ли смысл посмотреть в сторону OpenCL?

Ну смотри, в моём институтике даже самые упоротые в прошлом фанаты OpenCL сейчас пишут на CUDA. Очевидцы говорят, что там объёмы кода в разы больше. Я даже не смотрел, поскольку нет templates => сразу в сад.

anonymous
(05.11.12 16:37:34 MSK)

$CUDATOOLKIT/doc/cuda-gdb.pdf не помогло?

d_a ★★★★★
(05.11.12 17:28:21 MSK)

Ответ на: комментарий от d_a 05.11.12 17:28:21 MSK

нет. Есть ещё с пяток PDFок, объясняющих как дебажить. Максимум, о чем полезном они говорят - это о ключах -g -G, но меня интересует не теория из книг, а реально опыт человека, разрабатывающего на CUDA. Ещё раз повторюсь - отладчик ругается, что компилятор не создал символы для девайса, а в интернете пишут, что отладка возможна на двух GPU онли.

Vest
(05.11.12 18:56:11 MSK) автор топика

Ссылка

Ответ на: комментарий от anonymous 05.11.12 16:37:34 MSK

Я даже не смотрел, поскольку нет templates => сразу в сад.

В OpenCL 1.2 есть вроде.

tailgunner ★★★★★
(05.11.12 19:20:56 MSK)

Ссылка

Ответ на: комментарий от Vest 05.11.12 15:36:59 MSK

что народ сидит и гипнотизирует код в поисках ошибок.

занимается reasoning на основе операционной семантики, да, программисты такое умеют.

dimon555 ★★★★★
(06.11.12 01:07:24 MSK)

Ссылка

Я использую cuda-memcheck -l ./program <program arguments>.
Этого достаточно для устранения ошибок с кривым доступом к глобальной памяти.
Если непонятно почему алгоритм не работает, то пишу тестовый CPU код с 5 вложенными циклами for :-)

blinkenlichten ★
(06.11.12 16:35:33 MSK)

Ответ на: комментарий от blinkenlichten 06.11.12 16:35:33 MSK

Скажите, а сам отладчик пробовали запускать через cuda-gdb, или родной Eclipse? И я так понимаю, визуальной отладкой потоков вы не пользуетесь...

Vest
(06.11.12 16:39:12 MSK) автор топика

Ответ на: комментарий от Vest 06.11.12 16:39:12 MSK

Пользуюсь только emacs, nvvp и cuda-memcheck.

blinkenlichten ★
(06.11.12 18:01:54 MSK)

Ответ на: комментарий от blinkenlichten 06.11.12 18:01:54 MSK

Понятно. Видимо и у вас отладчик не работает. Что ж, кроме printf ничего хорошего не вижу, пока :)

Vest
(06.11.12 21:32:06 MSK) автор топика

Ответ на: комментарий от Vest 06.11.12 21:32:06 MSK

Да, наверное когда-то раз запустил, ничего не смог делать и забыл об этом.
Покамест самый действенный метод printf & cpu pseudo-cuda code, второе особенно помогает избежать ошибки «out of range shared or loca address»,
несколько раз такое возникало, это нечто более мерзкое чем «out of bounds in global memory», ибо не так очевидно где ошибка :)

blinkenlichten ★
(06.11.12 22:34:12 MSK)

Ссылка

Ответ на: комментарий от Vest 06.11.12 21:32:06 MSK

Вот собственно наброски некого враппера части CUDA-API, которые работают на CPU: cuda_wrapper.h, cuda_wrapper.cpp
Оно очень даже может быть глючное, использовал когда было мало опыта работы с cuda.

blinkenlichten ★
(06.11.12 22:39:23 MSK)

Ответ на: комментарий от blinkenlichten 06.11.12 22:39:23 MSK

Спасибо. Не стирайте, пожалуйста, думаю всем пригодятся.

Vest
(07.11.12 02:57:38 MSK) автор топика

Ссылка

4 июня 2013 г.

Если кого интересует этот мёртвый тред, то попробуйте поставить CUDA 5.5 RC (тестировал пока под Windows). Там реализована отладка кода устройства с помощью CUDA Debugger и какого-то отдельного приложения типа Monitor.

Глупо звучит, но реально в функцию заходит и все watch работают :)

Vest
(04.06.13 19:02:02 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Ogre - отброс теней у BoundingBox

Development

header тетриса

→

Похожие темы