В первую очередь для малого и среднего бизнеса и просто частных интересантов.
Недавно появился новый вариант закона, переработанный, по сравнению с первоначальным вариантом, о котором уже заходила речь ранее. Замечания промышленников к регулированию ИИ Проект: https://sozd.duma.gov.ru/s3files/s3sozd/1f170a23/3654/6ae4/b9ab/515d74cdb64c Наверное каких-то принципиальных изменений уже не будет и примерно в этом виде его примут.
Хорошая новость, что предлагаемый закон стал мягче, самые сомнительные положения из него убрали. Плохая, что он все еще очень жесткий, кое в чем даже хуже исходного варианта, встречается мнение, что он может привести к монополизации рынка несколькими крупными компаниями, а для мелких и средних, хотя бы просто использующих нейросети в коммерции и даже для публикаций исследователей, потенциально создает серьезные юридические и экономические риски. Есть серьезная авторско-правовая ловушка для обычных разработчиков.
Еще надо отметить, что предлагаемый закон в значительной мере рамочный, наделяя орган по регулированию ИИ в РФ (Согласно свежей новости https://www.rbc.ru/technology_and_media/04/07/2026/6a48f1da9a79472d9431bf94 - это Минцифры) большими полномочиями по фактическому регулированию.
Общее резюме примерно следующее, такой закон создает двухуровневую систему ИИ-индустрии:
Олигархический контур: крупные корпорации, получающие доступ к госданным, иммунитет от судов по авторскому праву и господдержку, но проходящие жесткий идеологический и бюрократический контроль.
Контур малого и среднего бизнеса и частных лиц: кроме ограничений, на то, где они могут использовать свои модели и решения на их основе, оказываются незащищены от авторско-правовых претензий и вообще до некоторой степени в правовом вакууме. Им придется полагаться исключительно на открытые (Open Source / Open Data) датасеты, что снизит качество их локальных моделей.
Немного подробнее.
Итак: «закон регулирует отношения, возникающие в связи с разработкой, внедрением, использованием и применением больших фундаментальных моделей искусственного интеллекта, в том числе с предоставлением возможности применения больших фундаментальных моделей искусственного интеллекта пользователям, находящимся на территории Российской Федерации.»
Под большими фундаментальными моделями понимаются модели, имеющие не менее 1 миллиарда параметров. Ранее определение не имело ограничения по параметрам и было настолько широким, что под него попадало чуть ли не вообще все, что способно не совсем тривиально обрабатывать информации. Плохо, что 1 миллиард параметров - это мало и собственно всеобъемлюющее определение ИИ оставили, только ограничив параметры для регуляции. Чисто компьютерное зрение из него в основном выпадает, так как большинство (и то не все) моделей там менее 1 млрд., но вот практически любая локальная LLM, вроде Qwen 7B или 14B или whisper какой-нибудь или диффузионная, генерирующая изображения - все это теперь предмет регулирования.
Вводятся статусы «суверенной» и «национальной» модели. Их разработчиками могут быть только российские юридические (не физические) лица. Разница в том, что суверенная модель - это которая вообще вся целиком и полностью российская с российскими разработчиками и датацентрами, а для национальной допускаются небольшие послабления в виде заимствования OpenSource (на условиях открытой лицензии по тексту) компонентов, в том числе и исходного варианта модели из-за рубежа. При этом все-равно «структура, программное обеспечение и настраиваемые параметры, определяются и изменяются российским юридическим лицом, являющимся разработчиком данной модели» Для обоих статусов необходимо, чтобы модель «прошла подтверждение соответствия законодательству Российской Федерации и традиционным российским духовно-нравственным ценностям в порядке, установленном Правительством Российской Федерации»
Для примера, ориентировочно, суверенной моделью, вероятно можно будет считать Гигачат от Сбера, а национальной - YandexGPT с Алисами.
Ясно, что в дальнейшем регулятором будут выставлены требования, где допустимо использование только национальной или суверенной модели и решений, построенных на их основе. Требования пока не опубликованы, но можно почти не сомневаться, что как минимум сюда попадут все госструктуры, включая институты и школы, объекты критической инфраструктуры. То есть, де-факто все госзаказы и разработки для более-менее крупного бизнеса, медицина и много чего еще окажутся в пролете для малого и среднего бизнеса. Требования же к процессу разработки (чего стоит хотя бы требование вести техдокументацию «в объеме, необходимом для оценки информационной безопасности ее применения»), требования экспертизы на всякие ценности такие, что малые компании и стартапы их или не потянут или возникнут значительные финансовые и организационные осложнения.
Но это еще не все. На первый взгляд может показаться, что если вы не разработчик национального и суверенного и не собираетесь лезть туда, где оно требуется, то как бы и ладно, оно не касается. Однако, если проанализировать законопроект повнимательнее, то обнаруживаются не совсем очевидные правовые ловушки.
Во первых, требования по маркировке результатов. Ранее в законопроекте хотели, чтобы маркировка была обязательной, сейчас пункт чуть мягче, материал формально уже не обязан непременно быть промаркирован, но зато разработчику для применяющего лица нужно обеспечить возможность размещения маркировки.
Во вторых, есть очень неприятная ловушка с авторским правом. В предлагаемом законе явно разрешается использовать правомерно полученные экземпляры авторского и смежного права для обучения моделей, но ИСКЛЮЧИТЕЛЬНО (ст. 10 п.2) разработчиками суверенных и национальных моделей! Это значит, что по-тихому, данный закон, в случае принятия, закрепляет фактический ЗАПРЕТ учить модели на любых данных, если на них нет лицензии, разрешающей это.
Что это значит для частных лиц и малого и среднего бизнеса: если вы, как частный исследователь или небольшая компания, обучаете свою локальную модель (которая априори не может получить статус «суверенной» или «национальной», так как не соответствует требованиям ст.6), то на вас это исключение не распространяется. Суверенно-национальным можно, а обычным - фиг вам!!!
Если такой законопроект примут, то получается такая рекомендация: начиная с сентября 2026 года, при сборе и использовании датасетов для локального обучения моделей (особенно если планируется их публикация или коммерческое использование) необходимо внедрить строгий фильтр на проверку лицензионной чистоты данных (использование только Public Domain, CC0, MIT, Apache).


