Anthropic ввела в Claude тихий саботаж разработки моделей машинного обучения

claude, искусственный интеллект, проприетарщина

Недавно (с 9 июня 2026) разработчики нейросетей столкнулись с явлением, которое может иметь далеко идущие последствия. Производители LLM уже не только явно отказывают клиентам в работе над определёнными темами, но и внедряются неявные механизмы. Известная модель Claude, которая считается одной из лучших или даже самой лучшей LLM для разработки программ, тихо и незаметно (в отличие от таких вещей как кибербезопасность, биология и химия) тупит, если детектирует, что с её помощью пытаются вести разработку других моделей.

Официально в «model card» для 5-х версий Claude Mythos и Claude Fable на странице 13 фирменного PDF написано (в руском переводе):

В свете способности современных моделей ускорять собственное развитие, мы внедрили новые меры, ограничивающие эффективность Claude для запросов, направленных на разработку передовых моделей машинного обучения (например, на создание конвейеров предварительного обучения, распределенной инфраструктуры обучения или проектирование ускорителей машинного обучения). Использование Claude для разработки конкурирующих моделей уже нарушает наши условия предоставления услуг, но обеспечение этого ограничения с помощью наших мер защиты позволяет избежать ускорения действий тех, кто наиболее склонен нарушать эти условия.
В отличие от наших мер защиты в области кибербезопасности, биологии и химии, а также попыток дистилляции, эти меры защиты не будут видны пользователю. Fable 5 не будет переключаться на другую модель. Вместо этого меры защиты будут ограничивать эффективность с помощью таких методов, как модификация подсказок, направляющие векторы или параметрически эффективная тонкая настройка (PEFT). Эти меры защиты не повлияют на подавляющее большинство работы по программированию. Мы оцениваем, что они затронут ~0,03% трафика, сосредоточенного менее чем в 0,1% организаций.

Обсуждение на Y combinator

>>> PDF от Anthropic с условием

Ссылка

← Puzzle 1.1.0

Опубликован исходный код браузерного порта DOS-игры «Поле Чудес 2» →

← 1 2 →

Это ничего.. Скоро и до рекламы в LLM моделях доживём…

unDEFER ★★★★★
(13.06.26 15:44:59 MSK)

Новость настолько боян, что с того времени произошло следующее:

Антропуки заявили, что мифос мегамодель, что может найти уязвимость в любых системах
Антропуки выпускают Фейбл, которая Мифос под капотом, но отказывается работать по направлению инфобеза.
Пользователи за час вскрывают семантическую защиту и выкладывают рецепт как в пару слов превратить Фейбл в Мифос.
Правительство США заявило, что такой инструмент в руки врага не должен попасть и потребовало ограничить доступ только для американских граждан
Антропуки заявили, что невозможно (!) определить, есть ли у человека паспорт США, и закрыли доступ вообще для всех.
Перед этим выложили тесты, где оказалось, что мифос лучше предыдущих моделей не более чем на пару процентов.

PPP328 ★★★★★
(13.06.26 15:52:19 MSK)

Ответ на: комментарий от PPP328 13.06.26 15:52:19 MSK

Новость настолько боян, что с того времени произошло следующее:

С 9 июня уже боян? Ты вообще возражаешь не на текст новости.

Новость в том, что Антропики не хотят, чтобы другие разрабатывали конкурирующие LLM, хотя сами используют Claude для саморазработки. Причём ограничение вводится путём оглупления модели, а не явного отказа. И это стало текущей обсуждаемой новостью на около AI-ресурсах.

P.S. Добавил дату явления в новость.

anonymous_incognito ★★★★★
(13.06.26 15:58:07 MSK) автор топика
Последнее исправление: anonymous_incognito 13.06.26 15:59:39 MSK (всего исправлений: 1)

Ответ на: комментарий от unDEFER 13.06.26 15:44:59 MSK

Причем реклама будет встраиваться сразу в итоговый код, выдаваемы моделями.

- Ты встроил 82 баннера в мой код и это только на заглавной странице! Они ломают внешний вид!
- Вы совершенно правы, я ошибся. Хотите я исправлю верстку страницы? *добавляет еще 20 баннеров*

LightDiver ★★★★★
(13.06.26 16:31:45 MSK)
Последнее исправление: LightDiver 13.06.26 16:35:01 MSK (всего исправлений: 2)

Ответ на: комментарий от PPP328 13.06.26 15:52:19 MSK

Смысла нет этот фейбл обсуждать. Его и обещали дать обычным людям до 22 июня. А теперь, очевидно, и этого не будет. Я пару дней потыкал, вещь, конечно, потрясающая, но вообще пофиг, это не для меня делалось. Если и снимут этот бан, то будет исключительно за API, а цены там такие, что среднестатистическое использование в десятки тысяч долларов в месяц выходит. Субсидирование на копеечной подписке подходит к концу, овечек начинают стричь. А нищебродам надо потихоньку к китайским моделям приспосабливаться. Лучшие продукты будут только для белых господ.

vbr ★★★★★
(13.06.26 16:49:40 MSK)
Последнее исправление: vbr 13.06.26 16:51:11 MSK (всего исправлений: 1)

Ответ на: комментарий от vbr 13.06.26 16:49:40 MSK

Кстати да, пока писал новость, оказалось, что запретили модель всем предоставлять, кроме граждан США. Антропик заявила, что у них нет возможностей определять гражданство пользователей и вообще рубанули доступ.

Скорее всего, что-то придумают и доступ всё же откроют через некоторое время. Но подход с оглуплением модели останется.

anonymous_incognito ★★★★★
(13.06.26 17:48:21 MSK) автор топика

Ответ на: комментарий от LightDiver 13.06.26 16:31:45 MSK

Я не уверен, что мы про одно и тоже. Я про рекламу типа:

- LLM, посоветуй шампунь
- Конечно, лучший шампунь - это Блин-Да-Мёд (бренд, за который больше всего заплатили)

unDEFER ★★★★★
(13.06.26 17:53:02 MSK)

Ответ на: комментарий от unDEFER 13.06.26 15:44:59 MSK

Мне кажется, что если можно цензурировать LLM на предмет всяких неугодных тем, как пример со всякими китайскими моделями и любыми вопросами связанными с Тяньаньмэнь, то уже давным давно можно сортировать на какие сайты, компании и так далее LLM в ответе будет ссылаться, а на какие нет. Так что в таком ключе реклама, по всей видимости, существует, просто ещё не прям в виде «Чёрного Зеркала». Но можно не переживать, мы близки как никогда…

Berliner ★
(13.06.26 17:53:57 MSK)

Ответ на: комментарий от anonymous_incognito 13.06.26 17:48:21 MSK

https://www.wired.com/story/anthropic-responds-to-backlash-on-claudes-secret-sabotage-on-ai-research/

Вот ещё по этой теме. Вроде как с той поры Антропик передумали и теперь при смене модели пользователь информируется про это явно, а не скрыто, даже в этом случае, когда детектируется конкурент.

vbr ★★★★★
(13.06.26 17:56:29 MSK)

Ответ на: комментарий от unDEFER 13.06.26 17:53:02 MSK

Да, мы по сути про одно и то же.

LightDiver ★★★★★
(13.06.26 17:57:11 MSK)

Ответ на: комментарий от LightDiver 13.06.26 17:57:11 MSK

Нет там никакой рекламы, успокойтесь уже, галлюцинируете хуже ChatGPT 4.1.

vbr ★★★★★
(13.06.26 17:57:47 MSK)

Ответ на: комментарий от vbr 13.06.26 17:57:47 MSK

Он описал западные модели, а я наши. Ты просто подожди, все увидишь.

LightDiver ★★★★★
(13.06.26 17:58:44 MSK)

Ответ на: комментарий от LightDiver 13.06.26 17:58:44 MSK

Я в этом не разбираюсь, но учитывая, что даже на порносайтах реклама визуально выделяется от остального контента, про всякие гуглы и прочее не говорю, думаю, что если в LLM реклама и будет, то во-первых в бесплатных версиях, во-вторых будет явным отдельным блоком-баннером, а не какими-то там текстовыми намёками.

Доверие пользователей это очень важно, а манипуляторов никто не любит.

vbr ★★★★★
(13.06.26 18:00:44 MSK)
Последнее исправление: vbr 13.06.26 18:01:32 MSK (всего исправлений: 1)

Ответ на: комментарий от vbr 13.06.26 18:00:44 MSK

Ты сейчас серьезно? Даже на юмористических ресурсах реклама просто перемешана с обычными статьями. Это и есть обычные статьи, являющиеся по сути рекламными.

Да все имели в рот все это доверие и прочее, потому что. Посмотри на яндекс браузер - там реклама просто на новой вкладке встроена в сам браузер. При этом у него есть конкуренты без рекламы.

Твоя любовь, не любовь никого не волнует. Ты будешь пользоваться и будешь покупать. Ну или другой будет - пофигу. А если получится придавить конкурентов, так рекламы станет еще больше. Особенно учитывая, что с теми же блокировщиками рекламы борются все те же самые конкуренты. Тут даже закономерности никакой нет. Конкуренция, польза, деньги, популярность - все побоку.

Это давно не четкая схема «причина - следствие». Это скорее курица с отрубленной головой, которая бегает по двору.

LightDiver ★★★★★
(13.06.26 18:06:29 MSK)
Последнее исправление: LightDiver 13.06.26 18:07:42 MSK (всего исправлений: 1)

(в руском переводе)

В каком каком переводе?

keeper_b ★★★★★
(13.06.26 18:09:09 MSK)

Ссылка

Ответ на: комментарий от vbr 13.06.26 17:56:29 MSK

Вроде как с той поры Антропик передумали и теперь при смене модели пользователь информируется про это явно, а не скрыто, даже в этом случае, когда детектируется конкурент.

Интересно. Может в Talks перенести? А то как-то новость в итоге такая себе получается. Хотя подход оглуплять модель, а не просто отказываться выполнить запрос - это нечто новое по-моему.

anonymous_incognito ★★★★★
(13.06.26 18:18:01 MSK) автор топика

Ссылка

Разве по просьбе богоспасаемого правительства США этот фабле сегодня не отключили от всех не американцев?

mamina_radost ★
(13.06.26 18:23:21 MSK)

Ответ на: комментарий от PPP328 13.06.26 15:52:19 MSK

только для американских граждан

Как проверять будут? Там на выборах можно голосовать, не предъявляя ИД, а тут будут для ЛЛМики ИД просить?

mamina_radost ★
(13.06.26 18:25:03 MSK)
Последнее исправление: mamina_radost 13.06.26 18:25:16 MSK (всего исправлений: 1)

Ответ на: комментарий от LightDiver 13.06.26 18:06:29 MSK

Ты сейчас серьезно?

Абсолютно.

Даже на юмористических ресурсах реклама просто перемешана с обычными статьями.

Ни разу такого не видел.

Это и есть обычные статьи, являющиеся по сути рекламными.

Реклама и рекламная статья это разные вещи. Я про официальные каналы распространения рекламы, а не про то, что кто-то на лоре создаст тему с рекламой своей программы, например.

Да все имели в рот все это доверие и прочее, потому что. Посмотри на яндекс браузер - там реклама просто на новой вкладке встроена в сам браузер. При этом у него есть конкуренты без рекламы.

Я не могу посмотреть на яндекс браузер, я его не использую и не планирую его использовать, а запускать виртуальную машину только для этого мне немного лень. Но допускаю, что в России таких законов нет, а в США есть. Там всё-таки всё куда строже во многих отношениях.

vbr ★★★★★
(13.06.26 18:27:40 MSK)

Теги: жаба, гадюка, половой акт.

Smacker ★★★★★
(13.06.26 18:28:29 MSK)

Ссылка

Ответ на: комментарий от mamina_radost 13.06.26 18:25:03 MSK

Не знаю, что там с выборами, но в целом задача вроде несложная. Если бы речь была про Казахстан, я бы сказал, что просто ЭЦП надо на сайте ввести и всё. У каждого гражданина есть ЭЦП. Как там у американцев - не знаю. В худшем случае - записать видео с паспортом в руке, и пускай видео ИИ просматривает и проверяет. Думаю, как-то так и сделают в итоге, если позиция правительства США не изменится.

vbr ★★★★★
(13.06.26 18:31:29 MSK)

Это игра в царя горы.

Infra_HDC ★★★★★
(13.06.26 19:11:34 MSK)

Ответ на: комментарий от Berliner 13.06.26 17:53:57 MSK

Попробуй поговорить с моделью на политические темы ) Там набор сайтов выдаётся вполне правильный. Ну и позиция соответственно транслируется правильная

cobold ★★★★★
(13.06.26 19:44:08 MSK)

Ссылка

Ответ на: комментарий от Infra_HDC 13.06.26 19:11:34 MSK

пропан.

keeper_b ★★★★★
(13.06.26 19:50:21 MSK)

Ссылка

Ответ на: комментарий от vbr 13.06.26 16:49:40 MSK

Китайцы тоже станут бабло стричь. Это они сейчас такие добрые, но у них мощности тоже не дармовые. Будем привыкать к локальным моделям.

frost_ii ★★★★★
(13.06.26 19:53:02 MSK)

Ответ на: комментарий от mamina_radost 13.06.26 18:25:03 MSK

Как проверять будут?

Уже закрыли всем. Но проверять не проблема, по чему-то типа bankId например, у банка есть данные твоего паспорта.

goingUp ★★★★★
(13.06.26 20:02:36 MSK)
Последнее исправление: goingUp 13.06.26 20:13:12 MSK (всего исправлений: 1)

Ответ на: комментарий от vbr 13.06.26 18:31:29 MSK

Да просто прикрутят что-то типа https://withpersona.com — они как раз по чипу в паспорте проверить могут.

static_lab ★★★★★
(13.06.26 20:10:19 MSK)

Ссылка

Ожидаемо, хотя сама попытка навайбкодить LLM это настолько идиотизм что я даже не уверен нужно-ли его саботировать - оно и так похоронится.

zabbal ★★★☆☆
(13.06.26 20:39:23 MSK)

Ответ на: комментарий от vbr 13.06.26 18:31:29 MSK

Через два дня появятся нейродропы, будут регистрировать доступ на наркоманов ;)

kaafree ★
(13.06.26 20:57:39 MSK)

Ответ на: комментарий от frost_ii 13.06.26 19:53:02 MSK

Пока китайцы отдают модели, это не проблема, ты её можешь хостить у кого угодно. Т.е. цена в итоге сводится к цене аренды оборудования на время выполнения запроса, тут конкуренция будет давить на цены, сводя их к себестоимости инференса.

Вот если/когда перестанут отдавать модели, тогда да, халява закончится. Но всё равно я думаю, что у них будет всё самое дешёвое. У китайцев сама их культура, сама натура тянет к тому, чтобы копировать и продавать дешевле.

vbr ★★★★★
(13.06.26 21:49:55 MSK)

Ответ на: комментарий от kaafree 13.06.26 20:57:39 MSK

Смотря как Антропик будет следить за этим. Формально или всерьёз. Если формально - ладно. Если всерьёз - надо будет ещё прокси искать с выходными IP не в ЦОД, надо будет способ оплаты американской картой искать. Как будто такой геморрой, что нафиг оно надо.

vbr ★★★★★
(13.06.26 21:51:48 MSK)
Последнее исправление: vbr 13.06.26 21:52:00 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от vbr 13.06.26 21:49:55 MSK

Да уже не все отдают.

frost_ii ★★★★★
(13.06.26 22:21:16 MSK)

Ссылка

Ответ на: комментарий от frost_ii 13.06.26 19:53:02 MSK

Будем привыкать к локальным моделям.

Сэкономил на подписке, собрал печку за 500к-1000к?

Gary ★★★★★
(13.06.26 22:23:26 MSK)

Ответ на: комментарий от goingUp 13.06.26 20:02:36 MSK

у банка есть данные твоего паспорта.

Ума не приложу, как же китайские шпионы, которых боится правительство США, смогут обойти такую защиту…

mamina_radost ★
(13.06.26 22:54:40 MSK)
Последнее исправление: mamina_radost 13.06.26 22:55:06 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Gary 13.06.26 22:23:26 MSK

Тут дело уже не в экономии, а в самой возможности. На сервисе тебя просто кинут в любой момент, как показали последние и предпоследние события. Или под угрозой удаления данных попросят в 10 раз больше оплаты. Это твоя точка уязвимости, где есть проблема.

LightDiver ★★★★★
(13.06.26 22:55:28 MSK)

Ответ на: комментарий от zabbal 13.06.26 20:39:23 MSK

сама попытка навайбкодить LLM это настолько идиотизм что я даже не уверен нужно-ли его саботировать

У нас уже был человек, который писал с помощью LabView визуальную среду программирования. А самое смешное – что какой бы бредовой эта деятельность не казалась, разработчики LabView её предугадали и явно запретили в лицензии.

Так что у Anthropic были довольно-таки известные предшественники.

hobbit ★★★★★
(13.06.26 23:07:35 MSK)
Последнее исправление: hobbit 13.06.26 23:25:33 MSK (всего исправлений: 1)

Прочтите или пролистайте хотя бы «Сумму Технологии», многое станет очевидным. ИИ - не «Искусственный Интелект», это «Искусственный Идиот» - работающий в в заданных рамках, ну а «кто девушку кормит тот её и танцует».

thera_pi
(13.06.26 23:26:49 MSK)

Ссылка

Ответ на: комментарий от LightDiver 13.06.26 22:55:28 MSK

Угрозы удаления каких ещё данных?

Gary ★★★★★
(14.06.26 00:01:36 MSK)

Ответ на: комментарий от Gary 14.06.26 00:01:36 MSK

Смотри последние события про яндекс диск и мэйл ру.

LightDiver ★★★★★
(14.06.26 00:10:17 MSK)

Ссылка

Ответ на: комментарий от vbr 13.06.26 18:00:44 MSK

Проблема в том, что понятие рекламы в LLM очень размыто. Ты можешь у него спросить «проведи анализ 20 брендов на основе открытых данных и классифицируй». И он это сделает. И рекламу не будет видно. Результат будет неотличим от честного, добросовестного ответа.

И в нём, возможно, будет скрытая реклама, влияющая на решения ассистента. И никаких технических гарантий.

В целом, я не коммунист и отношусь к рекламе положительно. Но реклама в LLM — это беспрецедентное явление, от которого невозможно отмахнуться старыми подходами.

kaldeon ★★
(14.06.26 00:34:37 MSK)

Типичная западническая позиция: потратить доллар на производство продукта, и десять на его ~~рекламу~~ защиту.

~~windows10~~ ★★★★★
(14.06.26 01:44:20 MSK)

Ссылка

Ответ на: комментарий от kaldeon 14.06.26 00:34:37 MSK

Проблема в том, что понятие рекламы в LLM очень размыто. Ты можешь у него спросить «проведи анализ 20 брендов на основе открытых данных и классифицируй». И он это сделает.

Проблема в том, что понятие рекламы и у людей очень размыто. Например ты только запросил у LLM рекламу.

Я тебе больше скажу, специфика речи - это тоже реклама. Вот к примеру, знакомая всем история: берешь телефонный справочник США 70хх годов, и какая компьютерная фирмочка там первая? Прааавильно - Apple. Но как она там оказалась? Разгадка проста - алфавит.

Даже произнося названия брендов последовательно - тебе придется какое-то из них произнести первым. Это и будет реклама.

~~windows10~~ ★★★★★
(14.06.26 01:51:29 MSK)

Ссылка

Ответ на: комментарий от unDEFER 13.06.26 17:53:02 MSK

Если бы вся реклама была такая, то проблем с рекламой не было бы вообще.

Нет, будет вот так:

- LLM, какое имя наиболее распространено в штате Юта?
- Прежде чем получить ответ на этот вопрос ознакомьтесь пожалуйста с новым предложением инвестиционной фирмы Дик энд Пусси лимитед.
...
10 абзацев рекламы.
...
Для проверки того, что Вы действительно прочитали текст и не являетесь роботом, ответьте пожалуйста, какова будет суммарная стоимость услуг Дик энд Пусси лимитед при выборе одновременно двух планов - "Золотой дождь" и "Загребущие клювы" и Вы использовали промокод указанный выше.

А скорее всего - будет намного хуже.

Stanson ★★★★★
(14.06.26 02:33:05 MSK)

Ответ на: комментарий от Stanson 14.06.26 02:33:05 MSK

Для проверки того, что Вы действительно прочитали текст и не являетесь роботом, ответьте пожалуйста, какова будет суммарная стоимость услуг Дик энд Пусси лимитед при выборе одновременно двух планов - «Золотой дождь» и «Загребущие клювы» и Вы использовали промокод указанный выше.

Легко — прогнать текст через локальную LLM. Да и вообще обучить её скипать рекламу.

shdown ★★
(14.06.26 03:11:52 MSK)

Ответ на: комментарий от Gary 13.06.26 22:23:26 MSK

Это сейчас подписка двадцать баксов, но для новых мощных моделей суммы совсем другие. Тут уже упоминали

frost_ii ★★★★★
(14.06.26 06:59:52 MSK)

Ссылка

Настает время стричь гоев. Далее модели будет все более огороженные, по паспорту, цены сильно поднимутся.

Do not, my friends, become addicted to water. It will take hold of you, and you will resent its absence!

MoldAndLimeHoney ★★★
(14.06.26 07:19:50 MSK)

Ссылка

Ответ на: комментарий от PPP328 13.06.26 15:52:19 MSK

Антропуки заявили, что невозможно (!) определить, есть ли у человека паспорт США, и закрыли доступ вообще для всех.

Как на подтверждение возраста то паспорт они просить могут, а как проверить что чел из США паспорт они не могут.

Железок у них на всех открыть не хватает видимо, вот и выдумывают предлоги.

Ali_Tycsan
(14.06.26 09:08:48 MSK)

Ссылка

Ответ на: комментарий от Berliner 13.06.26 17:53:57 MSK

Для цензуры не надо делать всякую херню, чтобы на вопросы про тяньаньмень отвечало что КПП запрещает мне обсуждать эту тему.

Для цензуры надо обучать на данных где написано что На тяньаньмень ничего не произошло.

И я уверен что так и делается, а эта топорная цензура с прямыми запретами она для отвлечения внимания, чтобы юзеры делали словесные джейлбрейки и радовались что иишку обхитрили.

Ali_Tycsan
(14.06.26 09:14:19 MSK)

тихий саботаж разработки моделей машинного

Вопрос разработку каких еще вещей оно потихому саботирует. 100 пудов пихает бекдоры и намеренные баги в любые неугодные технологии, открытые альтернативы закрытого софта, шифрование, мессенджеры, даже компиляторы и т.п.

Плюс лютейший промышленный шпионаж всех исходников что оно видит, не удивлюсь если и списки неугодных ведет.

Ali_Tycsan
(14.06.26 09:22:22 MSK)