LINUX.ORG.RU

Анализ последствий предлагаемого регулирования ИИ в РФ

 , ,


0

1

В первую очередь для малого и среднего бизнеса и просто частных интересантов.

Недавно появился новый вариант закона, переработанный, по сравнению с первоначальным вариантом, о котором уже заходила речь ранее. Замечания промышленников к регулированию ИИ Проект: https://sozd.duma.gov.ru/s3files/s3sozd/1f170a23/3654/6ae4/b9ab/515d74cdb64c Наверное каких-то принципиальных изменений уже не будет и примерно в этом виде его примут.

Хорошая новость, что предлагаемый закон стал мягче, самые сомнительные положения из него убрали. Плохая, что он все еще очень жесткий, кое в чем даже хуже исходного варианта, встречается мнение, что он может привести к монополизации рынка несколькими крупными компаниями, а для мелких и средних, хотя бы просто использующих нейросети в коммерции и даже для публикаций исследователей, потенциально создает серьезные юридические и экономические риски. Есть серьезная авторско-правовая ловушка для обычных разработчиков.

Еще надо отметить, что предлагаемый закон в значительной мере рамочный, наделяя орган по регулированию ИИ в РФ (Согласно свежей новости https://www.rbc.ru/technology_and_media/04/07/2026/6a48f1da9a79472d9431bf94 - это Минцифры) большими полномочиями по фактическому регулированию.

Общее резюме примерно следующее, такой закон создает двухуровневую систему ИИ-индустрии:

Олигархический контур: крупные корпорации, получающие доступ к госданным, иммунитет от судов по авторскому праву и господдержку, но проходящие жесткий идеологический и бюрократический контроль.

Контур малого и среднего бизнеса и частных лиц: кроме ограничений, на то, где они могут использовать свои модели и решения на их основе, оказываются незащищены от авторско-правовых претензий и вообще до некоторой степени в правовом вакууме. Им придется полагаться исключительно на открытые (Open Source / Open Data) датасеты, что снизит качество их локальных моделей.

Немного подробнее.

Итак: «закон регулирует отношения, возникающие в связи с разработкой, внедрением, использованием и применением больших фундаментальных моделей искусственного интеллекта, в том числе с предоставлением возможности применения больших фундаментальных моделей искусственного интеллекта пользователям, находящимся на территории Российской Федерации.»

Под большими фундаментальными моделями понимаются модели, имеющие не менее 1 миллиарда параметров. Ранее определение не имело ограничения по параметрам и было настолько широким, что под него попадало чуть ли не вообще все, что способно не совсем тривиально обрабатывать информации. Плохо, что 1 миллиард параметров - это мало и собственно всеобъемлюющее определение ИИ оставили, только ограничив параметры для регуляции. Чисто компьютерное зрение из него в основном выпадает, так как большинство (и то не все) моделей там менее 1 млрд., но вот практически любая локальная LLM, вроде Qwen 7B или 14B или whisper какой-нибудь или диффузионная, генерирующая изображения - все это теперь предмет регулирования.

Вводятся статусы «суверенной» и «национальной» модели. Их разработчиками могут быть только российские юридические (не физические) лица. Разница в том, что суверенная модель - это которая вообще вся целиком и полностью российская с российскими разработчиками и датацентрами, а для национальной допускаются небольшие послабления в виде заимствования OpenSource (на условиях открытой лицензии по тексту) компонентов, в том числе и исходного варианта модели из-за рубежа. При этом все-равно «структура, программное обеспечение и настраиваемые параметры, определяются и изменяются российским юридическим лицом, являющимся разработчиком данной модели» Для обоих статусов необходимо, чтобы модель «прошла подтверждение соответствия законодательству Российской Федерации и традиционным российским духовно-нравственным ценностям в порядке, установленном Правительством Российской Федерации»

Для примера, ориентировочно, суверенной моделью, вероятно можно будет считать Гигачат от Сбера, а национальной - YandexGPT с Алисами.

Ясно, что в дальнейшем регулятором будут выставлены требования, где допустимо использование только национальной или суверенной модели и решений, построенных на их основе. Требования пока не опубликованы, но можно почти не сомневаться, что как минимум сюда попадут все госструктуры, включая институты и школы, объекты критической инфраструктуры. То есть, де-факто все госзаказы и разработки для более-менее крупного бизнеса, медицина и много чего еще окажутся в пролете для малого и среднего бизнеса. Требования же к процессу разработки (чего стоит хотя бы требование вести техдокументацию «в объеме, необходимом для оценки информационной безопасности ее применения»), требования экспертизы на всякие ценности такие, что малые компании и стартапы их или не потянут или возникнут значительные финансовые и организационные осложнения.

Но это еще не все. На первый взгляд может показаться, что если вы не разработчик национального и суверенного и не собираетесь лезть туда, где оно требуется, то как бы и ладно, оно не касается. Однако, если проанализировать законопроект повнимательнее, то обнаруживаются не совсем очевидные правовые ловушки.

Во первых, требования по маркировке результатов. Ранее в законопроекте хотели, чтобы маркировка была обязательной, сейчас пункт чуть мягче, материал формально уже не обязан непременно быть промаркирован, но зато разработчику для применяющего лица нужно обеспечить возможность размещения маркировки.

Во вторых, есть очень неприятная ловушка с авторским правом. В предлагаемом законе явно разрешается использовать правомерно полученные экземпляры авторского и смежного права для обучения моделей, но ИСКЛЮЧИТЕЛЬНО (ст. 10 п.2) разработчиками суверенных и национальных моделей! Это значит, что по-тихому, данный закон, в случае принятия, закрепляет фактический ЗАПРЕТ учить модели на любых данных, если на них нет лицензии, разрешающей это.

Что это значит для частных лиц и малого и среднего бизнеса: если вы, как частный исследователь или небольшая компания, обучаете свою локальную модель (которая априори не может получить статус «суверенной» или «национальной», так как не соответствует требованиям ст.6), то на вас это исключение не распространяется. Суверенно-национальным можно, а обычным - фиг вам!!!

Если такой законопроект примут, то получается такая рекомендация: начиная с сентября 2026 года, при сборе и использовании датасетов для локального обучения моделей (особенно если планируется их публикация или коммерческое использование) необходимо внедрить строгий фильтр на проверку лицензионной чистоты данных (использование только Public Domain, CC0, MIT, Apache).

★★★★★

Последнее исправление: praseodim (всего исправлений: 1)

То есть, получается, что в то время как в других странах, например, в США, суды встали на сторону разработчиков моделей, позволив им использовать для обучения материалы, защищенные авторским правом, если те легально приобретены, то в России вводится фактический запрет на перерабоку произвольной информации, с исключением для избранных.

praseodim ★★★★★
() автор топика

Многабукв. Локальный Qwen использовать можно будет для разработки? Для включения в состав какого-либо изделия? Моделей для локального использования вообще не будет суверенных?

anonymous
()
Ответ на: комментарий от anonymous

Amazon и Google= Anthropic => Claude Code. Alibaba => Qwen code. Остальное пустое по крайней мере для терминала.

anonymous
()

Проект: https://sozd.duma.gov.ru/s3files/s3sozd/1f170a23/3654/6ae4/b9ab/515d74cdb64c Наверное каких-то принципиальных изменений уже не будет и примерно в этом виде его примут.

Хм, а тут тогда что?

https://regulation.gov.ru/projects/166424/

Там написано что «последняя версия проекта», но текст другой, кому верить?

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 2)
Ответ на: комментарий от firkax

Вобщем, если по ссылке на duma.gov.ru и правда более новая версия, то кажется его и правда с тех пор исправили в хорошую сторону: беспредельное разрешение воровать код с помощью ллм (был пункт 13.5) сильно порезали, вместо него осталось такое разрешение только избранным (пункт 10.2). Что ж, это лучше чем ничего, хотя ещё лучше бы совсем убрали этот пункт или заменили его на прямой запрет если в лицензии нет явного разрешения. А то monk меня тут совсем расстроил.

firkax ★★★★★
()
Ответ на: комментарий от anonymous

альтоастры

О! Живой!

Ты так и не понял, что Карл, Маркс, Фридрих и Энгельс – это не 4 человека, а 2?

(А Слава КПСС вообще не еврей…)

hobbit ★★★★★
()
Ответ на: комментарий от anonymous

Многабукв. Локальный Qwen использовать можно будет для разработки?

Если твою организацию обяжут использовать национально-суверенное, то нет конечно, нельзя.

Для включения в состав какого-либо изделия?

Тоже самое.

Моделей для локального использования вообще не будет суверенных?

Запрета выложить суверенную модель в OpenSource как будто нет. Но там есть требования к ней.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от firkax

Там написано что «последняя версия проекта», но текст другой, кому верить?

Там по датам даже видно, что на сайте правительства мартовский вариант. На сайте Госдумы июньский. Вот тебе еще новость про это: https://www.rbc.ru/technology_and_media/22/06/2026/6a37ddb19a7947c93443fdc4

Первую версию законопроекта по регулированию ИИ Минцифры опубликовало на портале Regulation.gov.ru в марте. По сравнению с ней документ сильно сократился — теперь в нем 13 статей вместо 21. Ключевые изменения сводятся к следующему:

praseodim ★★★★★
() автор топика
Ответ на: комментарий от firkax

осталось такое разрешение только избранным (пункт 10.2).

Чем же это хорошо? Разрешение должно быть у всех или ни у кого (ладно там армии и спецслужбам оставили) - иначе это какая-то дискриминация получается и нарушение конституционного равенства, если за одно и тоже деяния (нарушение авторских прав) одни участники рынка несут наказание, а другие нет. Какая-то корпоративная феодальщина получается.

praseodim ★★★★★
() автор топика
Последнее исправление: praseodim (всего исправлений: 1)
Ответ на: комментарий от praseodim

Я согласен что лучше всем запретить, чем то что сейчас. Но вот чтобы было «у всех» - это самый плохой вариант.

одни участники рынка несут наказание, а другие нет

Вот вторую часть надо бы исправить и глобализовать.

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 2)
Ответ на: комментарий от firkax

Я согласен что лучше всем запретить, чем то что сейчас.

Почему тебе не нравится, что модели можно тренировать на например книжках или данных с сайтов? Код OpenSource этот закон, кстати, не запрещает использовать. А если «крадут» из облака закрытый, то те кто его туда поместил - ССЗБ, раз согласились с лицензией. Кстати, даже думаю, что лицензия на использование облака позволит тренировать модели в любом случае.

Так что ты получается доволен, что просто Васе Пупкину крылья подрезали.

praseodim ★★★★★
() автор топика
Последнее исправление: praseodim (всего исправлений: 1)
Ответ на: комментарий от praseodim

Потому что сайты делались для живых посетителей, а вход ботам и список разрешённых страниц в нормальных случаях регулируется через robots.txt. Настырное лазание без спросу никого не радует, незачем его принудительно разрешать.

Ну это не говоря уж о том что ллм сами по себе вредоносная сущность и должны запрещаться любыми способами.

Код OpenSource этот закон, кстати, не запрещает использовать

Только пермиссивный, как я понял из твоей темы.

Так что ты получается доволен, что просто Васе Пупкину крылья подрезали.

Повторю, я был бы рад если бы запретили всем (включая всякие чатгпт, но давай нацпол опустим).

firkax ★★★★★
()
  • Markdown
Пустая строка (два раза Enter) начинает новый абзац. Знак '>' в начале абзаца выделяет абзац курсивом цитирования.
Внимание: прочитайте описание разметки Markdown.
Используйте Ctrl-Enter для размещения комментария