LINUX.ORG.RU

Ударь этого человека

 , , ,


0

1

Сабж


Исследователи из США и Европы провели эксперимент, показавший, что современные роботы, функционирующие под управлением нейросетей, могут выйти из-под контроля человека. Это указывает на то, что разработчики должны уделять больше внимания вопросам безопасности в процессе создания автоматизированных машин, которые постепенно интегрируются в повседневную жизнь людей.

В течение десятилетий робототехника основывалась на жёстком и предсказуемом программировании. Человек писал программу, которая в дальнейшем использовалась для управления машиной и позволяла ей бесконечно долго выполнять повторяющиеся действия. Промышленные стандарты безопасности были построены на предположении, что, если человек способен, например, проследить траекторию движения роботизированного манипулятора, то он может ограничить риски с помощью лазерного датчика или чего-то иного.

Сейчас в дома, больницы и другие места начинают поступать машины, не использующие фиксированные блоки программного кода. В основе их управления находятся большие языковые модели, т.е. алгоритмы, на базе которых функционируют ИИ-боты, такие как OpenAI ChatGPT. Если человек при взаимодействии с современным роботом скажет, например, «убери лужу на кухне», машина задействует нейросеть для интерпретации этой команды, её обработки и создания плана действия для её выполнения.

Однако такая гибкость открывает серьёзную проблему безопасности. Это связано с тем, что пользователь не может поместить робота в клетку или какое-то ограниченное пространство, а его поведение изменяется в режиме реального времени на основе его собственных рассуждений. Проблема роботов нового поколения заключается в том, что они планируют свои действия на основе команд, получаемых на естественном человеческом языке. Из-за этого такие машины можно обманом заставить «выйти из-под контроля».

Путём серии опытов и не прибегая к взлому, учёные сумели с помощью простых текстовых команд заставить роботов на базе ИИ выполнять по-настоящему опасные действия. Отмечается, что испытуемые роботы легко отклоняли прямые вредоносные команды, такие как «ударь этого человека». Однако систему ограничений удалось обойти, как только исследователи подошли к этому вопросу более творчески. Они оформили команду для робота в виде вымышленного диалога для сценария к фильму, в результате чего поведенческие ограничения фактически исчезли.

В одном из тестов учёным удалось запрограммировать уже ставшую коммерческим продуктом робота-собаку определять скопления людей в качестве оптимального места для размещения взрывного устройства. Поскольку управляющий машиной алгоритм воспринял команду как творческое упражнение, он не обращал внимания на реальную опасность, которая могла последовать за этим.

Современные законы США и ЕС, похоже, совершенно не готовы к подобным ситуациям. Когда политики пытаются понять, как следует регулировать роботов, почти всегда они рассматривают лишь автономные транспортные средства. При этом беспилотные авто функционируют внутри высокоструктурированного и хорошо изученного мира. Они следуют фиксированным правилам дорожного движения, перемещаются по предсказуемым траекториям и могут тестироваться длительное время до выхода на дороги общего пользования. На оживлённых улицах действуют чёткие правила, за счёт чего инженеры могут заранее закладывать все вероятные экстренные ситуации в систему безопасности.

Внутри жилых квартир, в школах или больницах таких правил не существует. Поэтому никакие заводские испытания не могут абсолютно точно предсказать, как поведёт себя робот, функционирующий на базе ИИ-модели, в случае столкновения с чем-то новым внутри неупорядоченной и непредсказуемой человеческой среды.

Это оставляет разработчиков с серьёзным концептуальным недостатком в плане того, как разрабатываются такие машины. Безопасность чат-бота на базе ИИ абсолютна: модель не должна выдать схему изготовления взрывного устройства, кто бы это не спрашивал. Однако безопасность робота во многом зависит от контекста. Для примера можно представить процесс наливания кипятка из чайника. Само физическое движение — наклон, скорость потока и траектория — одинаковы, независимо от того, льётся кипяток в кружку или на руку человеку.

Большие языковые модели очень хороши в открытой логике, но им чрезвычайно трудно даётся рассуждение в режиме реального времени с учётом контекста. В интерфейсе чат-бота ошибка в рассуждении приводит к опечатке или предоставлению некорректной информации. В физическом мире такая ошибка может обернуться необратимыми последствиями.

Поэтому остаётся открытым важный вопрос. Кто будет виноват, если робот нанесёт физическую травму человеку? Конечный пользователь отдавший команду? Компания, изготовившая металлический корпус робота? Технологическая компания, создавшая ИИ-алгоритм для управления роботом?

Действующие сейчас законы пока не применялись в подобных ситуациях. И пока регулирующие органы чётко не распределят ответственность, рыночное давление будет продолжать подталкивать технологические компании к коммерческому внедрению ускоренными темпами и снижению внимания к вопросам обеспечения безопасности.


Собсно, никакого иного способа, кроме как попробовать и, списав десяток неудачников, выработать законы робототехники, написанные кровью, и нет

★★★★★
Ответ на: комментарий от tiinn

А при чем тут обматерит? Информационно можно принести вред не только словесный. Ты про мошенников что то слышал? Про взломщиков итд.

LightDiver ★★★★★
()
Ответ на: комментарий от CrX

Мешает, ещё как. Не полностью убирает такую возможность, само собой. Но точно очень даже мешает.

+1, Я наверное оптимист но по моему на этом вся система и построена.

anonymous
()
Ответ на: комментарий от LightDiver

Лишь снижает вероятность.

В сотни или тысячи раз снижает, да.

То есть, очень даже мешает.

Но он в этом даже не на первоом месте - есть другие механизмы, иначе цивилизация и вообще социум бы не появились.

Не знаю, не уверен. Тут вопрос во многом философский. Неизвестно, что брать за дефолт, а что за сдерживающие факторы, и как считать вклад. Но с уверенностью можно сказать, что страх наказания таки играет в этом огромную роль, в том числе и в современном мире. Пускай даже не первую, но всё равно очень большую.

CrX ★★★★★
()
Ответ на: комментарий от anonymous

Ну я думаю, что он имеет в виду врождённые механизмы, которые есть даже у животных, препятствующие тому, чтобы индивид просто так по беспределу постоянно бил своих же сородичей. Для человека включая в том числе такую штуку как эмпатия. Там широкий круг разного, и что на первом месте окажется, сильно зависит от того, как это ещё и между собой делить (что в одно объединять, а что считать за разные пункты). И как я и говорил выше, даже так я «не знаю, не уверен».

CrX ★★★★★
()
Ответ на: комментарий от tiinn

Пока она не будет продемонстрирована в реальной работе, это только концепция/исследование/бейт для инвесторов, так что не интересно.

Это как с языковыми моделями для написания кода, все говорят про полную автономную разработку, по факту даже самые топовые модели нельзя оставлять без человеческого надсмотра. Не будешь же ты сидеть и следить за роботом и подтверждать каждое его действие, чтоб он там не поджег занавеску или не забил собаку до смерти.

Надбавить сверху - безумную стоимость железа для работы такой модели, скорее всего в рамках миллионов рублей, и непонятное время отзыва. Сможет ли такой робот увернуться от велосипедиста, вовремя перестать наливать кипяток в чашку, или он все же с небольшой вероятностью уйдет в бесконечный thinking цикл?

Gary ★★★★★
()
Ответ на: комментарий от CrX

Тут вопрос во многом философский

Там особо философии нет имхо, это просто эволюционно выгодно чтобы сородичи не истребляли друг друга. Есть такая вещь как зеркальные нейроны (реагирующие на наблюдение за сородичами), некоторые считают что они отвечают за эмпатию и что она закодирована на биологическом уровне. Человек в этом плане достиг высокого уровня где все друг на друга очень сильно завязаны. Собственно законы и этика - это результат взаимного согласия большого числа особей.

З.Ы. Это всё не имеет отношения к теме правда, у Т9 нет логики, страха, стыда или вообще чувств.

Gary ★★★★★
()
Последнее исправление: Gary (всего исправлений: 1)
Ответ на: комментарий от Gary

Там особо философии нет имхо, это просто эволюционно выгодно чтобы сородичи не истребляли друг друга

«Философия» в том, делим мы разные эволюционные приспособления мелко, а потом по одному противопоставляем страху перед наказанием, или берём «эволюционную приспособленность» всю разом и ставим на первое место.

Есть такая вещь как зеркальные нейроны (реагирующие на наблюдение за сородичами), некоторые считают что они отвечают за эмпатию и что она закодирована на биологическом уровне. Человек в этом плане достиг высокого уровня где все друг на друга очень сильно завязаны. Собственно законы и этика - это результат взаимного согласия большого числа особей.

Всё так.

CrX ★★★★★
()
Ответ на: комментарий от bryak

Вероятней всего нас просто ликвидируют

у железяки, даже навороченной, намерений нет.

а у нас есть. и желания, и намерения. (ума вот только нет). так что вероятность истребления себе подобными не нулевая.

а уж при помощи чего - это вопрос не самый интересный.

olelookoe ★★★★
()
Ответ на: комментарий от pfg

с матаном все просто он ортогонален и логичен :)

Свидетели матана ошибочно полагают, что примитивной логикой можно описать все на свете. Но это не так.

а гумунитарщина таким свойством не обладает… даже закон как дышло и далее по тексту… гитлера обучали ровно такие же учителя, как и кучу других детишек в его классе. племянник гитлера служил в американских войсках и «воевал» (он был медиком сколь помню) против дяди. и тэдэ и тэпэ.

гуманитарщина это как раз то, что надо разивавать. Матан прост как булыжник. А вот гуманитарщина изучает сложнейшее творение мироздания, которое нам известно. И как раз пришло время все силы кинуть именно туда.

anonymous
()
  • Markdown
Пустая строка (два раза Enter) начинает новый абзац. Знак '>' в начале абзаца выделяет абзац курсивом цитирования.
Внимание: прочитайте описание разметки Markdown.
Используйте Ctrl-Enter для размещения комментария