LINUX.ORG.RU
ФорумTalks

ИИ. Скрытное обучение.

 , презлое


0

2

Вообщем то, что и следовало ожидать.

https://arxiv.org/abs/2507.14805

Вкраце. Если взять языковую модель типа чатгпт, и научить ее презлому - например любить каракатиц(чтобы на вопрос - кто твои самые любимые животные, отвечала - каракатицы), а потом попросить ее сгенерить некие невинные датасеты, навроде просто рядов чисел… а потом скормить эти ряды и дообучить на них другую такую-же модель, то на вопрос - твои самые любимые животные, другая модель тоже будет отвечать - каракатицы.

То есть произошла скрытая передача инфы от одной модели к другой, хотя в том, что передавалось явно ничего такого нет.

Связано это с тем, что даже невинные датасеты, сгенеренные первой моделью, будут содержать некую информацию о всех весах исходной модели, и таким образом вторая модель получит частично некую память от первой.

Фактически это способ скрытно скомпрометировать вторую модель.

Область применения. Учим первую модель генерить код с бэкдорами, и скрытно передаем ее опыт в модель, которую кто-то другой использует для генерации кода.

Обнаружить факт передачи, при умелой эксплуатации этого явления практически невозможно. Потому что например вторую модель учили на ответах первой, не связанной с генерацией кода вообще, а например на анализе политических событий, или еще чем нибудь, вплоть до литературных экзерсисов.

Пока что, для того чтобы это работало нужны идентичные модели, поскольку эксплуатируется идентичность внутреннего представления инфы(веса и архитектура) в моделях.

Кстати это эффект похож(а по сути то же самое), что и биологические эксперименты с передачей памяти у простейших, когда обученного червячка скармливают другому червячку, и другой червячок уже помнит то, что и первый, без обучения.

Перемещено CrX из general

★★★

Последнее исправление: alysnix (всего исправлений: 1)
Ответ на: комментарий от thesis

Кстати, ты такая же нейронная сеть. И потому твои тексты содержат изрядное количество скрытой информации, которую ИИ может найти и извлечь. А потом товарищ майор с товарищами сержантами постучат к тебе в двери, и уже не будет того, кто сможет встать у них на пути. :)

alysnix ★★★
() автор топика
Ответ на: комментарий от alysnix

Ну не совсем такая же.. Всетаки количество параметров на 1-2 порядка побольше. Да и нюансы. За энергоэффективность платить надо.

И заметь, точно такой же косяк с обучением и вредоносными последтсвиями. Тут все как раз так же.

LightDiver ★★★★★
()
Последнее исправление: LightDiver (всего исправлений: 1)
Ответ на: комментарий от thesis

Я иногда догадываюсь о значениях слов. И в случае с автором нет какой то глупости или подобного - просто реальная неадекватность. Странное невменяемое поведение. Как у женщины, длительное время обделенной мужским вниманием. Или долго сидящей в купальнице на песке. Не знаю как описать точнее.

LightDiver ★★★★★
()
Ответ на: комментарий от ALiEN175

Алиска с chatGPT никаких логинов не требуют.

Для продвинутой Алисы нужно быть залогиненым в яндекс-аккаунт.

greenman ★★★★★
()

Идеальное убийство, получается, практически без шансов на раскрытие :( Это, скорее плохо, чем хорошо.

yars068 ★★★★★
()
Ответ на: комментарий от alysnix

еще и под статью подведет :)

Ты так веселишься, как будто тебя не подведет.

ИИ видит тебя насквозь!

Это значит, что слова, которые я пишу, сообщают именно то, что я хочу донести. Это хорошо, так и было задумано.

Кстати, ты такая же нейронная сеть. И потому твои тексты содержат изрядное количество скрытой информации, которую ИИ может найти

Ну, это не секрет. Меня очень легко вычислить, я об этом знаю.

А потом товарищ майор

Ты бы уже отвлекся от образа товарищей в форме, а то все кружишься, как моль у лампочки.

thesis ★★★★★
()
Ответ на: комментарий от LightDiver

Не знаю как описать точнее.

Я уже назвал причину: ты не очень хорошо понимаешь смысл слов. А то явное облегчение от перекладывания мыслительных процессов на ИИ, которое ты непрерывно демонстрируешь, дает основания считать, что скоро ты будешь сообщать свои мысли зевками, миганием и почесыванием.

thesis ★★★★★
()
Ответ на: комментарий от greenman

Так она бывает еще и продвинутой? Я только в поиске в яндексе видел, но там она тупее пробки. Надо таки попробовать.

LightDiver ★★★★★
()
Ответ на: комментарий от greenman

Спасибо, потыкаю. Но растотест уже сходу не прошла.

LightDiver ★★★★★
()
Ответ на: комментарий от thesis

человечество интенсивно шевелит руками, изготавливая ИИшечки, при этом пытаясь на ходу сообразить, что это такое вообще, что оно может и нахрен оно нужно

Ты не поверишь, но так строилась физика.

взять гору деталей и долго трясти ее в ящике, старательно регистрируя и изучая результат

А так — квантмех. (%

mord0d ★★★★★
()
Ответ на: комментарий от mord0d

Неа, не так. Сабж - это как если бы физики в лабораториях сидели и задумчиво изучали, например, мобильный телефон.

thesis ★★★★★
()
Последнее исправление: thesis (всего исправлений: 1)
Ответ на: комментарий от thesis

Сабж - это как если бы физики в лабораториях сидели и задумчиво изучали, например, мобильный телефон.

Это абсолютно повторяет любое открытие. Вначале открыли микроволны, сделали генератор и только потом, причём совершенно случайно, нашли этому применение. Как открыли радиоволны, и только потом придумали передавать с их помощью информацию. Как открыли электричество, и только потом поняли что это источник энергии.

mord0d ★★★★★
()
Ответ на: комментарий от greenman

Что такое продвинутая алиса? Как её продвинуть? Лично моя из колонки неадекватно тупа, я бы не отказался сделать её умнее. Чтобы на вопрос среднемесячной температуры не выдавался сегодняшний прогноз.

ya-betmen ★★★★★
()
Ответ на: комментарий от thesis

Ты видишь разницу между «открыли» и «сами сделали»?

Человек никогда ничего не изобретал.

Любое изобретение это следствие открытия. От каменного молотка до современного устойчивого шифрования соответствуют тому или иному открытому "закону".

mord0d ★★★★★
()
Ответ на: комментарий от LightDiver

А теперь то же самое, но про среднемесячную температуру за определённый (завершённый, то есть уже прошедший) месяц.

mord0d ★★★★★
()
Ответ на: комментарий от mord0d

Я тебе о том, что физика не изучает то, что сконструировали инженеры. Физика на это забила сто лет назад.

thesis ★★★★★
()
Ответ на: комментарий от mord0d

Да какая уж тут температура, у нее до нового года 77 дней осталось. Поделился этим с квеном, он без доступа к интернету посчитал все верно и появилась забавная беседа:

https://a.imgfoto.host/2025/08/03/1257f3ac2f317b6577.jpeg

LightDiver ★★★★★
()
Ответ на: комментарий от LightDiver

Да какая уж тут температура, у нее до нового года 77 дней осталось.

Ну тут она хотя бы раз в год бывает права. (%

А вместо среднемесячной температуры предложит отредактировать медкарту, выдаст температуру за окном (чтобы выглянуть в окно не нужен искусственный интеллект, естественного хватает), температуру на Марсе, но только не то, что требуется.

mord0d ★★★★★
()
Последнее исправление: mord0d (всего исправлений: 1)
Ответ на: комментарий от mord0d

не переживайте. все эти ИИ не анализируют текущие события. когда пару недель назад я спросил у ясеня, пардон, дипсика - расскажи главные текущие новости, он доложил, что трамп зарегился кандидатом в президенты. :)

карочи он выдает сводки новын на момент обучения. уже хотя бы потому, что если станет учиться сам - еще непонятно, чему он там научится…

alysnix ★★★
() автор топика
Ответ на: комментарий от alysnix

не переживайте. все эти ИИ не анализируют текущие события. когда пару недель назад я спросил у ясеня, пардон, дипсика - расскажи главные текущие новости, он доложил, что трамп зарегился кандидатом в президенты. :)

Это работает не так.

То что модель "знает" (читай — что конкретно зарегистрировано в "базе знаний") это срез данных в датасете (читай — архив) ДО определённой даты. Строго.

То что модель может выдать — настраивается. Также ей можно скармливать свежие данные на "анализ" (оно будет работать с этими данными как с историей чата, вместе с основной "базой знаний").

Достаточно по слову-триггеру вызывать определённую функцию, которая собирает необходимые данные и скармливает "ИИ" вместе с запросом. Оно обрабатывает информацию и выдаёт ответ в удобном для восприятия виде.

Уж поиск в интернете давно прикрутили, и почему это не сделали разработчики Алисы, по совместительству являющимися одним из крупнейших интернет-поисковиков — категорически неясно.

mord0d ★★★★★
()
Ответ на: комментарий от alysnix

Квен справился отлично. Выдал актуальные новости, определил какой сегодня день, залез в интернет и выделил основное.

LightDiver ★★★★★
()
Ответ на: комментарий от alysnix

Он не идеален и в чем то похуже дипсика. Менее «человечен». В чем то лучше. Например, может очень хорошо распознавать картинки. Рисованный комикс распознал на 99%, например. У него нет ограничений на количество запросов, как у дипсика. Но нужно модели менять иногда. Разные модели под разное заточено.

Но он, как и дипсик, быстро и часто меняется. Развивается постоянно.

LightDiver ★★★★★
()
Последнее исправление: LightDiver (всего исправлений: 1)
Ответ на: комментарий от LightDiver

Боязнь и отрицание новых технологий - неизбежный косяк с возрастом.. Потому молодые и заменяют потихоньку старперов. Они более гибкие в этом плане.

Поэтому очевиден факт, что тут собрались просто луддиты. Это не вопрос лично моего, или другого человека, отношения к нейросетям, любви, нелюбви, какая разница.

Это просто факт, что тут все деды с синдромом луддита, за небольшим исключением.

И вот честно, обычно понятие «луддит» в таких случаях применяется иносказательно, но с нейронками это принимает практически изначальный смысл. Будут ломать все что автоматизирует их работу.

James_Holden ★★★★★
()
Последнее исправление: James_Holden (всего исправлений: 1)
Ответ на: комментарий от James_Holden

Я сначала сам примерно так воспринимал, пока не попробовал. Воспринималось как какое то мошенничество новое модное. Еще и забаненное со всех сторон, все эти приколы в интернетиках с пальцами.

А потом мне скинули дипсик, когда он вышел, я с ним пообщался неделю и охренел. Выхренеть обратно уже не удалось.

LightDiver ★★★★★
()
Ответ на: комментарий от James_Holden

И вот честно, обычно поеятие «луддит» в таких случаях применяется иносказательно, но с нейронками это принимает практически изначальный смысл. Будут ломать все что автоматизирует их работу.

Вот когда будут ломать и это принесет кому-то вред, тогда и приходите. А покамест это тупое навешивание ярлыков на тех, кто не писается от восторга при слове нейросеть.

u-235
()
Ответ на: комментарий от u-235

Кто не писается от восторга при словах «электричество», «интернет», «нейросеть», у того или нет мозга или хоть малейшего какого то воображения и понимания что происходит вокруг.

LightDiver ★★★★★
()
Ответ на: комментарий от papin-aziat

Поинтересуйся медициной, там веселее, — накидывают таблеток в пациента, трясут, и с интересом наблюдают что получилось.

Да блина, люди. Ну вы что совсем

Это не в медицине. Это в науке в целом так работает.

А то что этого тут не понимают - у меня есть теория, что научное и инженерное мышления, во многом идут вразрез. «Инженеры» головного мозга не понимают таких вещей, им надо чтобы все делалось по умной книжке. Что там можно трясти, а. А откуда эта книжка взялась, как пришли к тому что там написано - задуматься лень.

James_Holden ★★★★★
()
Ответ на: комментарий от LightDiver

Электричество, интернет, нейросеть, искусственный интеллект. Иди штаны меняй.

u-235
()
Ответ на: комментарий от James_Holden

это не луддиты, а гуманитарии. Их пугает все новое, что им зарядят технари. Я вот технарь, и мне ИИ кажется естественной и многополезной штукой. Как бы неким серьезным, я б сказал, цивилизационным переломом чем-то сродни обузданию электричества или атомной энергии.

alysnix ★★★
() автор топика
Ответ на: комментарий от James_Holden

Инженер это про регламенты, нормы.

Физику, математику и инженеру дали задание найти объём красного мячика.
Физик погрузил мяч в стакан с водой и измерилл объём вытесненной жидкости.
Математик измерил диаметр мяча и рассчитал тройной интеграл.
Инженер достал из стола свою "Таблицу объёмов красных резиновых мячиков" и нашёл нужное значение.

Я инженером-технологом на фабрике два года проработал.

LightDiver ★★★★★
()
Ответ на: комментарий от u-235

Вот когда будут ломать и это принесет кому-то вред, тогда и приходите

А разуть глаза если? Тут в треде, в статье из ОП обсуждается как скрыто ломать LLM.

Вот, я и пришел, привет.

James_Holden ★★★★★
()
Ответ на: комментарий от LightDiver

Воспринималось как какое то мошенничество новое модное

Это обычный скептицизм, критическое мышление. Разница в том, что при луддизме неприятие не пропадет, а усилится после подробного изучения вопроса.

James_Holden ★★★★★
()
Ответ на: комментарий от James_Holden

Вот когда будут ломать и это принесет кому-то вред, тогда и приходите

А разуть глаза если? Тут в треде, в статье из ОП обсуждается как скрыто ломать LLM.

А теперь скорми этот тред своей любимой сеточке, чтобы она объяснила в чём ты не прав.

u-235
()
Последнее исправление: u-235 (всего исправлений: 1)
Ответ на: комментарий от James_Holden

А вот трясти детальками, к слову, это вообще не задача инженера. Он выясняет конкретику. Если что то неизвестно - поехал на предприятие, узнал, глянул регламенты.

Если же надо измерять - на это есть замерщики и в целом другие человеки, которые эти данные инженеру предоставят.

LightDiver ★★★★★
()
Последнее исправление: LightDiver (всего исправлений: 1)
Ответ на: комментарий от thesis

человечество интенсивно шевелит руками, изготавливая ИИшечки, при этом пытаясь на ходу сообразить, что это такое вообще, что оно может и нахрен оно нужно.

Самое забавное (нет) вот если бы вдруг кто-то опубликовал веское исследование, что развитие ИИ неизбежно приведет к Убить Всех Человеков, то все равно нашлись бы корпорации, которые продолжали бы его развивать, чтобы заработать деньги.

goingUp ★★★★★
()
Ответ на: комментарий от mord0d

А я хз кто может, что там за ии с той стороны если он в элементарую аналитику не может. Даже не то что не может он даже не пытается, типа юзер спросил что-то о погоде, выдам ему сегодняшний прогноз.

ya-betmen ★★★★★
()
Последнее исправление: ya-betmen (всего исправлений: 1)
Ответ на: комментарий от u-235

Ты перемогаешь аргументом из анекдота «когда убьют тогда приходите», успокойся, и перестань так позориться, для начала. А то напрашиваются неутешительняе выводы.

Если есть голова, думать ей надо заранее, а не когда тебя уже закопали в грунт в ящике.

Никто не хочет остановиться и задуматься на секунду.

James_Holden ★★★★★
()
Ответ на: комментарий от goingUp
«Врачи 1890-х годов утверждали, что при скорости выше 40 км/ч лёгкие человека перестанут работать». 

Это конечно просто прикольные мифы и легенды, но ты же понимаешь, что такие исследования можно предоставить в нужном ключе какие угодно и как тебе нужно? И при этом вообще не факт, что они верные?

Любая вескость этих исследований упирается в текущие знания.

LightDiver ★★★★★
()
Последнее исправление: LightDiver (всего исправлений: 1)
Ответ на: комментарий от James_Holden

Если есть голова, думать ей надо заранее, а не когда тебя уже закопали в грунт в ящике.

Похоже, что у тебя голова только для покушать.

u-235
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)