ИИ. Скрытное обучение.

0

4

Вообщем то, что и следовало ожидать.

Вкраце. Если взять языковую модель типа чатгпт, и научить ее презлому - например любить каракатиц(чтобы на вопрос - кто твои самые любимые животные, отвечала - каракатицы), а потом попросить ее сгенерить некие невинные датасеты, навроде просто рядов чисел… а потом скормить эти ряды и дообучить на них другую такую-же модель, то на вопрос - твои самые любимые животные, другая модель тоже будет отвечать - каракатицы.

То есть произошла скрытая передача инфы от одной модели к другой, хотя в том, что передавалось явно ничего такого нет.

Связано это с тем, что даже невинные датасеты, сгенеренные первой моделью, будут содержать некую информацию о всех весах исходной модели, и таким образом вторая модель получит частично некую память от первой.

Фактически это способ скрытно скомпрометировать вторую модель.

Область применения. Учим первую модель генерить код с бэкдорами, и скрытно передаем ее опыт в модель, которую кто-то другой использует для генерации кода.

Обнаружить факт передачи, при умелой эксплуатации этого явления практически невозможно. Потому что например вторую модель учили на ответах первой, не связанной с генерацией кода вообще, а например на анализе политических событий, или еще чем нибудь, вплоть до литературных экзерсисов.

Пока что, для того чтобы это работало нужны идентичные модели, поскольку эксплуатируется идентичность внутреннего представления инфы(веса и архитектура) в моделях.

Кстати это эффект похож(а по сути то же самое), что и биологические эксперименты с передачей памяти у простейших, когда обученного червячка скармливают другому червячку, и другой червячок уже помнит то, что и первый, без обучения.

Перемещено CrX из general

Ссылка

←	Светлые темы вредны?

Проприерасты лютуют

→

← 1 2 3 4 →

Ответ на: комментарий от thesis 03.08.25 14:40:25 MSK

вот видишь! ИИ видит тебя насквозь! …еще и под статью подведет :)

alysnix ★★★
(03.08.25 14:43:35 MSK) автор топика

Ответ на: комментарий от thesis 03.08.25 14:40:25 MSK

Кстати, ты такая же нейронная сеть. И потому твои тексты содержат изрядное количество скрытой информации, которую ИИ может найти и извлечь. А потом товарищ майор с товарищами сержантами постучат к тебе в двери, и уже не будет того, кто сможет встать у них на пути. :)

alysnix ★★★
(03.08.25 14:58:10 MSK) автор топика

Ответ на: комментарий от alysnix 03.08.25 14:58:10 MSK

Ну не совсем такая же.. Всетаки количество параметров на 1-2 порядка побольше. Да и нюансы. За энергоэффективность платить надо.

И заметь, точно такой же косяк с обучением и вредоносными последтсвиями. Тут все как раз так же.

LightDiver ★★★★★
(03.08.25 15:01:04 MSK)
Последнее исправление: LightDiver 03.08.25 15:02:31 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от LightDiver 03.08.25 14:42:33 MSK

Ты просто не знаешь значения слова «адекватный», да и не только его.

thesis ★★★★★
(03.08.25 15:26:00 MSK)

Ответ на: комментарий от thesis 03.08.25 15:26:00 MSK

Я иногда догадываюсь о значениях слов. И в случае с автором нет какой то глупости или подобного - просто реальная неадекватность. Странное невменяемое поведение. Как у женщины, длительное время обделенной мужским вниманием. Или долго сидящей в купальнице на песке. Не знаю как описать точнее.

LightDiver ★★★★★
(03.08.25 15:27:55 MSK)

Ответ на: комментарий от ALiEN175 03.08.25 13:20:17 MSK

Алиска с chatGPT никаких логинов не требуют.

Для продвинутой Алисы нужно быть залогиненым в яндекс-аккаунт.

greenman ★★★★★
(03.08.25 15:38:22 MSK)

Идеальное убийство, получается, практически без шансов на раскрытие :( Это, скорее плохо, чем хорошо.

yars068 ★★★★★
(03.08.25 15:53:32 MSK)

Ссылка

Ответ на: комментарий от alysnix 03.08.25 14:43:35 MSK

еще и под статью подведет :)

Ты так веселишься, как будто тебя не подведет.

ИИ видит тебя насквозь!

Это значит, что слова, которые я пишу, сообщают именно то, что я хочу донести. Это хорошо, так и было задумано.

Кстати, ты такая же нейронная сеть. И потому твои тексты содержат изрядное количество скрытой информации, которую ИИ может найти

Ну, это не секрет. Меня очень легко вычислить, я об этом знаю.

А потом товарищ майор

Ты бы уже отвлекся от образа товарищей в форме, а то все кружишься, как моль у лампочки.

thesis ★★★★★
(03.08.25 15:55:35 MSK)

Ссылка

Ответ на: комментарий от LightDiver 03.08.25 15:27:55 MSK

Не знаю как описать точнее.

Я уже назвал причину: ты не очень хорошо понимаешь смысл слов. А то явное облегчение от перекладывания мыслительных процессов на ИИ, которое ты непрерывно демонстрируешь, дает основания считать, что скоро ты будешь сообщать свои мысли зевками, миганием и почесыванием.

thesis ★★★★★
(03.08.25 16:00:00 MSK)

Ответ на: комментарий от greenman 03.08.25 15:38:22 MSK

Так она бывает еще и продвинутой? Я только в поиске в яндексе видел, но там она тупее пробки. Надо таки попробовать.

LightDiver ★★★★★
(03.08.25 16:00:19 MSK)

Ответ на: комментарий от thesis 03.08.25 16:00:00 MSK

Очень хороший пример.

LightDiver ★★★★★
(03.08.25 16:01:45 MSK)

Ссылка

Ответ на: комментарий от LightDiver 03.08.25 16:00:19 MSK

alice.yandex.ru

greenman ★★★★★
(03.08.25 17:38:05 MSK)

Ответ на: комментарий от greenman 03.08.25 17:38:05 MSK

Спасибо, потыкаю. Но растотест уже сходу не прошла.

LightDiver ★★★★★
(03.08.25 18:03:00 MSK)

Ссылка

Ответ на: комментарий от thesis 03.08.25 11:11:56 MSK

человечество интенсивно шевелит руками, изготавливая ИИшечки, при этом пытаясь на ходу сообразить, что это такое вообще, что оно может и нахрен оно нужно

Ты не поверишь, но так строилась физика.

взять гору деталей и долго трясти ее в ящике, старательно регистрируя и изучая результат

А так — квантмех. (%

mord0d ★★★★★
(03.08.25 19:28:55 MSK)

Ответ на: комментарий от mord0d 03.08.25 19:28:55 MSK

Неа, не так. Сабж - это как если бы физики в лабораториях сидели и задумчиво изучали, например, мобильный телефон.

thesis ★★★★★
(03.08.25 19:51:05 MSK)
Последнее исправление: thesis 03.08.25 19:51:18 MSK (всего исправлений: 1)

Ответ на: комментарий от thesis 03.08.25 19:51:05 MSK

Сабж - это как если бы физики в лабораториях сидели и задумчиво изучали, например, мобильный телефон.

Это абсолютно повторяет любое открытие. Вначале открыли микроволны, сделали генератор и только потом, причём совершенно случайно, нашли этому применение. Как открыли радиоволны, и только потом придумали передавать с их помощью информацию. Как открыли электричество, и только потом поняли что это источник энергии.

mord0d ★★★★★
(03.08.25 20:01:57 MSK)

Ответ на: комментарий от mord0d 03.08.25 20:01:57 MSK

Ты видишь разницу между «открыли» и «сами сделали»?

thesis ★★★★★
(03.08.25 20:12:55 MSK)

Ответ на: комментарий от greenman 03.08.25 15:38:22 MSK

Что такое продвинутая алиса? Как её продвинуть? Лично моя из колонки неадекватно тупа, я бы не отказался сделать её умнее. Чтобы на вопрос среднемесячной температуры не выдавался сегодняшний прогноз.

ya-betmen ★★★★★
(03.08.25 20:18:09 MSK)

Ответ на: комментарий от thesis 03.08.25 20:12:55 MSK

Ты видишь разницу между «открыли» и «сами сделали»?

Человек никогда ничего не изобретал.

Любое изобретение это следствие открытия. От каменного молотка до современного устойчивого шифрования соответствуют тому или иному открытому "закону".

mord0d ★★★★★
(03.08.25 20:35:29 MSK)

Ответ на: комментарий от ya-betmen 03.08.25 20:18:09 MSK

вопрос среднемесячной температуры.

А кто так может?

Siri не может. И не удивительно.

mord0d ★★★★★
(03.08.25 20:49:44 MSK)

Ответ на: комментарий от mord0d 03.08.25 20:49:44 MSK

https://a.imgfoto.host/2025/08/03/11e4f2bf0aff3703d4.png

LightDiver ★★★★★
(03.08.25 20:54:00 MSK)

Ответ на: комментарий от LightDiver 03.08.25 20:54:00 MSK

А теперь то же самое, но про среднемесячную температуру за определённый (завершённый, то есть уже прошедший) месяц.

mord0d ★★★★★
(03.08.25 20:56:22 MSK)

Ответ на: комментарий от mord0d 03.08.25 20:35:29 MSK

Я тебе о том, что физика не изучает то, что сконструировали инженеры. Физика на это забила сто лет назад.

thesis ★★★★★
(03.08.25 20:59:21 MSK)

Ссылка

Ответ на: комментарий от mord0d 03.08.25 20:56:22 MSK

Да какая уж тут температура, у нее до нового года 77 дней осталось. Поделился этим с квеном, он без доступа к интернету посчитал все верно и появилась забавная беседа:

https://a.imgfoto.host/2025/08/03/1257f3ac2f317b6577.jpeg

LightDiver ★★★★★
(03.08.25 21:00:15 MSK)

Ответ на: комментарий от LightDiver 03.08.25 21:00:15 MSK

Да какая уж тут температура, у нее до нового года 77 дней осталось.

Ну тут она хотя бы раз в год бывает права. (%

А вместо среднемесячной температуры предложит отредактировать медкарту, выдаст температуру за окном (чтобы выглянуть в окно не нужен искусственный интеллект, естественного хватает), температуру на Марсе, но только не то, что требуется.

mord0d ★★★★★
(03.08.25 21:03:05 MSK)
Последнее исправление: mord0d 03.08.25 21:04:58 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от mord0d 03.08.25 20:56:22 MSK

не переживайте. все эти ИИ не анализируют текущие события. когда пару недель назад я спросил у ясеня, пардон, дипсика - расскажи главные текущие новости, он доложил, что трамп зарегился кандидатом в президенты. :)

карочи он выдает сводки новын на момент обучения. уже хотя бы потому, что если станет учиться сам - еще непонятно, чему он там научится…

alysnix ★★★
(03.08.25 21:04:45 MSK) автор топика

Ответ на: комментарий от alysnix 03.08.25 21:04:45 MSK

не переживайте. все эти ИИ не анализируют текущие события. когда пару недель назад я спросил у ясеня, пардон, дипсика - расскажи главные текущие новости, он доложил, что трамп зарегился кандидатом в президенты. :)

Это работает не так.

То что модель "знает" (читай — что конкретно зарегистрировано в "базе знаний") это срез данных в датасете (читай — архив) ДО определённой даты. Строго.

То что модель может выдать — настраивается. Также ей можно скармливать свежие данные на "анализ" (оно будет работать с этими данными как с историей чата, вместе с основной "базой знаний").

Достаточно по слову-триггеру вызывать определённую функцию, которая собирает необходимые данные и скармливает "ИИ" вместе с запросом. Оно обрабатывает информацию и выдаёт ответ в удобном для восприятия виде.

Уж поиск в интернете давно прикрутили, и почему это не сделали разработчики Алисы, по совместительству являющимися одним из крупнейших интернет-поисковиков — категорически неясно.

mord0d ★★★★★
(03.08.25 21:11:08 MSK)

Ответ на: комментарий от mord0d 03.08.25 21:11:08 MSK

ну попроси дипсик показать тебе главные текущие новости.

alysnix ★★★
(03.08.25 21:19:27 MSK) автор топика

Ответ на: комментарий от alysnix 03.08.25 21:19:27 MSK

Квен справился отлично. Выдал актуальные новости, определил какой сегодня день, залез в интернет и выделил основное.

LightDiver ★★★★★
(03.08.25 21:22:15 MSK)

Ответ на: комментарий от LightDiver 03.08.25 21:22:15 MSK

попробую его.

alysnix ★★★
(03.08.25 21:23:34 MSK) автор топика

Ответ на: комментарий от alysnix 03.08.25 21:23:34 MSK

Он не идеален и в чем то похуже дипсика. Менее «человечен». В чем то лучше. Например, может очень хорошо распознавать картинки. Рисованный комикс распознал на 99%, например. У него нет ограничений на количество запросов, как у дипсика. Но нужно модели менять иногда. Разные модели под разное заточено.

Но он, как и дипсик, быстро и часто меняется. Развивается постоянно.

LightDiver ★★★★★
(03.08.25 21:26:37 MSK)
Последнее исправление: LightDiver 03.08.25 21:27:32 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от LightDiver 03.08.25 13:06:45 MSK

Боязнь и отрицание новых технологий - неизбежный косяк с возрастом.. Потому молодые и заменяют потихоньку старперов. Они более гибкие в этом плане.

Поэтому очевиден факт, что тут собрались просто луддиты. Это не вопрос лично моего, или другого человека, отношения к нейросетям, любви, нелюбви, какая разница.

Это просто факт, что тут все деды с синдромом луддита, за небольшим исключением.

И вот честно, обычно понятие «луддит» в таких случаях применяется иносказательно, но с нейронками это принимает практически изначальный смысл. Будут ломать все что автоматизирует их работу.

James_Holden ★★★★★
(03.08.25 21:31:05 MSK)
Последнее исправление: James_Holden 03.08.25 21:31:46 MSK (всего исправлений: 1)

Ответ на: комментарий от James_Holden 03.08.25 21:31:05 MSK

Я сначала сам примерно так воспринимал, пока не попробовал. Воспринималось как какое то мошенничество новое модное. Еще и забаненное со всех сторон, все эти приколы в интернетиках с пальцами.

А потом мне скинули дипсик, когда он вышел, я с ним пообщался неделю и охренел. Выхренеть обратно уже не удалось.

LightDiver ★★★★★
(03.08.25 21:33:07 MSK)

Ответ на: комментарий от James_Holden 03.08.25 21:31:05 MSK

И вот честно, обычно поеятие «луддит» в таких случаях применяется иносказательно, но с нейронками это принимает практически изначальный смысл. Будут ломать все что автоматизирует их работу.

Вот когда будут ломать и это принесет кому-то вред, тогда и приходите. А покамест это тупое навешивание ярлыков на тех, кто не писается от восторга при слове нейросеть.

u-235 ★
(03.08.25 21:34:04 MSK)

Ответ на: комментарий от u-235 03.08.25 21:34:04 MSK

Кто не писается от восторга при словах «электричество», «интернет», «нейросеть», у того или нет мозга или хоть малейшего какого то воображения и понимания что происходит вокруг.

LightDiver ★★★★★
(03.08.25 21:35:11 MSK)

Ответ на: комментарий от papin-aziat 03.08.25 13:10:32 MSK

Поинтересуйся медициной, там веселее, — накидывают таблеток в пациента, трясут, и с интересом наблюдают что получилось.

Да блина, люди. Ну вы что совсем

Это не в медицине. Это в науке в целом так работает.

А то что этого тут не понимают - у меня есть теория, что научное и инженерное мышления, во многом идут вразрез. «Инженеры» головного мозга не понимают таких вещей, им надо чтобы все делалось по умной книжке. Что там можно трясти, а. А откуда эта книжка взялась, как пришли к тому что там написано - задуматься лень.

James_Holden ★★★★★
(03.08.25 21:36:25 MSK)

Ответ на: комментарий от LightDiver 03.08.25 21:35:11 MSK

Электричество, интернет, нейросеть, искусственный интеллект. Иди штаны меняй.

u-235 ★
(03.08.25 21:36:28 MSK)

Ссылка

Ответ на: комментарий от James_Holden 03.08.25 21:31:05 MSK

это не луддиты, а гуманитарии. Их пугает все новое, что им зарядят технари. Я вот технарь, и мне ИИ кажется естественной и многополезной штукой. Как бы неким серьезным, я б сказал, цивилизационным переломом чем-то сродни обузданию электричества или атомной энергии.

alysnix ★★★
(03.08.25 21:36:41 MSK) автор топика

Ссылка

Ответ на: комментарий от James_Holden 03.08.25 21:36:25 MSK

Инженер это про регламенты, нормы.

Физику, математику и инженеру дали задание найти объём красного мячика.
Физик погрузил мяч в стакан с водой и измерилл объём вытесненной жидкости.
Математик измерил диаметр мяча и рассчитал тройной интеграл.
Инженер достал из стола свою "Таблицу объёмов красных резиновых мячиков" и нашёл нужное значение.

Я инженером-технологом на фабрике два года проработал.

LightDiver ★★★★★
(03.08.25 21:38:42 MSK)

Ответ на: комментарий от u-235 03.08.25 21:34:04 MSK

Вот когда будут ломать и это принесет кому-то вред, тогда и приходите

А разуть глаза если? Тут в треде, в статье из ОП обсуждается как скрыто ломать LLM.

Вот, я и пришел, привет.

James_Holden ★★★★★
(03.08.25 21:39:59 MSK)

Ответ на: комментарий от LightDiver 03.08.25 21:33:07 MSK

Воспринималось как какое то мошенничество новое модное

Это обычный скептицизм, критическое мышление. Разница в том, что при луддизме неприятие не пропадет, а усилится после подробного изучения вопроса.

James_Holden ★★★★★
(03.08.25 21:41:36 MSK)

Ссылка

Ответ на: комментарий от James_Holden 03.08.25 21:36:25 MSK

Я рад, что ты всё понял.

papin-aziat ★★★★★
(03.08.25 21:41:42 MSK)

Ссылка

Ответ на: комментарий от LightDiver 03.08.25 21:38:42 MSK

Вот и проблема, что новое знание не имеет регламентов и норм. Поэтому «просто трясут детальки».

James_Holden ★★★★★
(03.08.25 21:44:36 MSK)

Ответ на: комментарий от James_Holden 03.08.25 21:39:59 MSK

Вот когда будут ломать и это принесет кому-то вред, тогда и приходите

А разуть глаза если? Тут в треде, в статье из ОП обсуждается как скрыто ломать LLM.

А теперь скорми этот тред своей любимой сеточке, чтобы она объяснила в чём ты не прав.

u-235 ★
(03.08.25 21:45:21 MSK)
Последнее исправление: u-235 03.08.25 21:45:42 MSK (всего исправлений: 1)

Ответ на: комментарий от James_Holden 03.08.25 21:44:36 MSK

А вот трясти детальками, к слову, это вообще не задача инженера. Он выясняет конкретику. Если что то неизвестно - поехал на предприятие, узнал, глянул регламенты.

Если же надо измерять - на это есть замерщики и в целом другие человеки, которые эти данные инженеру предоставят.

LightDiver ★★★★★
(03.08.25 21:47:06 MSK)
Последнее исправление: LightDiver 03.08.25 21:47:26 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от thesis 03.08.25 11:11:56 MSK

человечество интенсивно шевелит руками, изготавливая ИИшечки, при этом пытаясь на ходу сообразить, что это такое вообще, что оно может и нахрен оно нужно.

Самое забавное (нет) вот если бы вдруг кто-то опубликовал веское исследование, что развитие ИИ неизбежно приведет к Убить Всех Человеков, то все равно нашлись бы корпорации, которые продолжали бы его развивать, чтобы заработать деньги.

goingUp ★★★★★
(03.08.25 21:48:20 MSK)

Ответ на: комментарий от mord0d 03.08.25 20:49:44 MSK

А я хз кто может, что там за ии с той стороны если он в элементарую аналитику не может. Даже не то что не может он даже не пытается, типа юзер спросил что-то о погоде, выдам ему сегодняшний прогноз.

ya-betmen ★★★★★
(03.08.25 21:48:53 MSK)
Последнее исправление: ya-betmen 03.08.25 21:49:24 MSK (всего исправлений: 1)

Ответ на: комментарий от u-235 03.08.25 21:45:21 MSK

Ты перемогаешь аргументом из анекдота «когда убьют тогда приходите», успокойся, и перестань так позориться, для начала. А то напрашиваются неутешительняе выводы.

Если есть голова, думать ей надо заранее, а не когда тебя уже закопали в грунт в ящике.

Никто не хочет остановиться и задуматься на секунду.

James_Holden ★★★★★
(03.08.25 21:49:13 MSK)

Ответ на: комментарий от goingUp 03.08.25 21:48:20 MSK

«Врачи 1890-х годов утверждали, что при скорости выше 40 км/ч лёгкие человека перестанут работать».

Это конечно просто прикольные мифы и легенды, но ты же понимаешь, что такие исследования можно предоставить в нужном ключе какие угодно и как тебе нужно? И при этом вообще не факт, что они верные?

Любая вескость этих исследований упирается в текущие знания.

LightDiver ★★★★★
(03.08.25 21:50:51 MSK)
Последнее исправление: LightDiver 03.08.25 21:51:55 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от James_Holden 03.08.25 21:49:13 MSK

Если есть голова, думать ей надо заранее, а не когда тебя уже закопали в грунт в ящике.

Похоже, что у тебя голова только для покушать.

u-235 ★
(03.08.25 21:57:17 MSK)

Ссылка

Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)

← 1 2 3 4 →

←	Светлые темы вредны?

Talks

Проприерасты лютуют

→

Похожие темы