Собственно, сабж. Было нарисовано в течение последних нескольких дней, рисовалось почти целиком под линуксом. Сразу оговорюсь, что рисовал не я, я так не умею.
Было бы не так заметно, что рисовал бот, если бы в центре в воде, не было бы отражения елочек (и прочих деталек из той же оперы). Верхняя часть картинки ничего, нижняя слишком откровенно «ботовая».
Типичная для замкадья ситуация, а Омск это вообще интеллектуальная белая дыра, удивлён, что ТСа оттуда до сих пор не выкинуло в более пригодное для жизни место.
Чем более локален и статичен объект, тем проще он формализуется свёрточной сетью. На примитивном уровне у неё есть понимание линий, выпуклых-вогнутых объектов и нескольких видов объектов, на которые тренируется. Скажем, она предпочитает рисовать волны на воде, а не на небе, хотя они приблизительно одного цвета.
Отличаются окрестностью, набором линий, выпуклостей-вогнутостей, светотени вокруг. Понятие перспективы могло бы быть при обучении на других объёмах входных данных, при обучении на четырёх фотках для неё мир плоский.
Для «проехать в указанную точку» эффективнее использовать две сети: одна определяет точку по указанию пальца, а вторая едет к точке.
Обучение с подкреплением никак не отменяет стереозрения, просто, чтобы уменьшить объём данных, можно предварительно обработать входной поток. Скажем, построение карты глубины по картинкам с двух камер было бы весьма кстати. А дальше учим нашего робота минимально передвигаться (ездить, ходить, whatever), и пусть он пытается добежать до заранее заданной точки, а оценивать его успех будем по фактическому расстоянию до точки.
Здесь обычная свёрточная сеть. На вход две картинки, на выход карту глубины. Остаётся только собрать данные. Берём какой-нибудь MS Kinect с хардовой картой глубины (на ИК-сетке оно работает, вроде) и камерами, заполняем БД. Даже если в исходных данных не сильно большое расстояние и точность, из них можно получить пригодную для обучения базу.
На самом деле для карты глубины для начала можно вообще не использовать нейросети. Да, будет менее точно, но уж расстояние до стены можно посчитать и классическими методами, если известно расстояние между камерами.
Я ответил, как. Получить карту глубины другим способом (можно даже полностью на синтетике), первично обучить сеть на ней, а затем уточнять на новых (реальных) данных. Недавно даже работа на эту тему пролетала, когда учили классификатор на изображениях из GTA 5. Можете по тому же принципу пойти.
А мужики-то и не знали. Слушай, мож тебе в гугл податься, чего они своими глупыми GAN занимаются, собак рисуют из всякой ерунды, когда «есть другие теории»? Давно бы уже обошли человеческий мозг, поработили людишек да на Марс слетали. Все сети с реалистичным построением нейрона дальше лабораторий никогда не вылезали, и там и останутся ещё долгое время.
Ну например в современной видеокарте можно насчитать 12 гигабайт памяти.
при этом у этой видеокарты не менее 3000 процессоров которые работают не менее чем на гигагерце.
Да я специально под свои разработки изучал Open CL
По моим вариациям, например та штука, что я разработал для распознавания очепяток, а некто там засветился, будет отрабатывать раз в миллион быстрее чем в одном потоке на той однопоточной проге, что была предоставлена.
Спасибо, я в курсе. А я просто установил cutorch и не развлекался с очередным переписыванием BLAS, в моей жизни и так слишком много велосипедов. По-моему, Вы просто сами не вполне понимаете тему, зато гонору дофига.
Систему эту я в глаза не видел, не знаю, что вы там со Stahl использовали, но я стараюсь следить за всеми современными наработками в Deep Learning, регулярно штрудирую arxiv, и потому мне очень интересно, что там у вас за пердовые разработки, работающие значительно быстрее. Да, я тоже использую GPU, когда это возможно, ну и что? Необязательно для этого заново писать модули на opencl, достаточно иметь GPU-accelerated операции над матрицами. Все так делают, в один поток считают только либо для удобства отладки, либо для алгоритмов, которые не параллелятся.
А мои решают поставленные мной задачи. Если Вам не нравятся мои задачи, я в этом не виноват. Может быть, у Вас в жизни всё крутится вокруг денег? Дак у меня денег вполне достаточно, я могу себе позволить заниматься тем, что лично мне интересно.