LINUX.ORG.RU
ФорумTalks

Лицензия, код под которой не смогут украсть через ИИ

 , , ,


0

1

По мотивам комментария LINUX-ORG-RU: Мир поменялся (комментарий)

К слову, раз уж пошла пьянка и в забугром приняли законы позволяющие прогнать GPL код через сетку и получить Publick Domain результат, то есть вероятность что остальные в мире будут к подобному подтягиваться. Есть мысль включать в лицензии личных публичных проектов запрет на использование исходного кода в качестве данных для обучения и процесс работы программы тоже. Только нужно грамотно сформулировать и добавить это условие в любые лицензии своих проектов к MIT можно просто дописать, в случае GPL и подобных которые нельзя менять включить второй лицензией и пользователь обязан принять обе или тип того.

Собственно что вы думаете о реализации и целесообразности такого?

По-моему очевидно, что запретить стоит не только использование кода для обучения ИИ, но и способствовать таким последствиям: в частности, такая формулировка будет запрещать копировать код в гитхаб-репы, поскольку выложить код на гитхаб означает скормить его копилоту.

Ещё стоит отметить ситуацию с GPL. Производная от GPL лицензия с запретом на обучение кодом ИИ будет с оригинальным GPL несовместима, обойти эту проблему, насколько я понимаю, невозможно, даже если того захочет сам RMS, поскольку внести задним числом какие-то уточнения в лицензии уже опубликованного GPL-софта без согласия его авторов нельзя.

Насколько, по вашему мнению, целесообразно добавление подобных пунктов в лицензии:

1) свободные пермиссивные, не имея побочных эффектов;

2) свободные с копилефтом, теряя лицензионную совместимость с много чем

? И как подобные пункты могут выглядеть, чтобы было грамотно и без бекдоров?

А может, всё не так страшно и пусть воруют код? Или же, может быть, подобные вещи должны регулироваться законами, а не лицензиями?

★★★★★

Последнее исправление: firkax (всего исправлений: 1)

А может, всё не так страшно и пусть воруют код?

Кожаные мешки уже десятилетиями воруют код, и ничего.

goingUp ★★★★★
()

Похоже на тот самый джунотред, где человек ярко демонстрировал новое психическое заболевание — джунофобию, то есть натуральный страх перед начинающими программистами.

Mobutu_Sese_Seko
()
Ответ на: комментарий от Mobutu_Sese_Seko

Не надо приплетать. Тут речь о том что некие бизнесмены могут прогнать твой GPL-код через копипастящий ИИ и закрыть исходники, после чего официально и не скрываясь продавать «свой» проприетарный софт. То есть сделать то, ради борьбы с чем было придумано GPL. А даже если не GPL - то как минимум присвоить авторство.

firkax ★★★★★
() автор топика
Последнее исправление: firkax (всего исправлений: 1)
Ответ на: комментарий от Mobutu_Sese_Seko

Нет не похоже, ты просто приплёл тупак. Есть ещё такой массовый психоз когда группа людей объединяется и выделяет у человека косяк или недостаток, а потом раз за разом о нём напоминают из разряда «А помните Люська жирная была? Аахаха Люська, а ты зачем была жирная? А ещё будешь жирной потом? Ой смотрите Люська пробежку делает, хаха наверное боится опять стать жирной как раньше, не бойся Люсь жир это твоё второе имя ахаха, я даже когда в магазин за салом прихожу иногда говорю ‘Мне Люсю…Ой сала ахахах’». Аналогично есть шизы которые один и тот же адекдот стабильно раз в месяц или неделю рассказывают и сами над ним ржут.

Ну серьёзно. Разок, смешно, второй забавно, а дальше уже чисто констатация.

LINUX-ORG-RU ★★★★★
()
Ответ на: комментарий от LINUX-ORG-RU

Психоаналитики вернулись из отпуска, да? Я не о «человеке», вообще-то, а о самом явлении — страхе воровства знаний. Я вообще не помню, какой ник у того регистранта был.

Mobutu_Sese_Seko
()
Ответ на: комментарий от firkax

Ну разве что с закрытием тут есть хоть минимальные причины для беспокойства. Но что им мешает просто взять GPL-ный код и закрыть его?

Mobutu_Sese_Seko
()
Ответ на: комментарий от Mobutu_Sese_Seko

страхе воровства знаний

Свободный софт знаниями и так делится, какой тут страх воровства? Речь именно про юридическое присвоение себе прав на него.

firkax ★★★★★
() автор топика
Ответ на: комментарий от firkax

прогнать твой GPL-код через копипастящий ИИ и закрыть исходники

с другой стороны можно сделать наоборот, скормить ИИ дизассемблированную прогу и сделать из нее GPL)

goingUp ★★★★★
()

да, твою лицензию конечно же будут уважать
ведь ты написал что нельзя
значит так и будет

Bad_ptr ★★★★★
()

Если эта нейросетка сможет код упростить при сохранении всей функциональности - то и хрен с ним

DumLemming ★★
()
Ответ на: комментарий от firkax

Выход есть, ну это правда уже на уровне закона, который автоматически всё прозрачным сделает и лицензии поддержит, суть проста, обязать автора публикующего обученную нейросеть / или иное сопоставимое с результатом сеток и нуждающиеся в данных входных для обучения, ну так вот обязать хранить сырые данные участвовавшие в обучении. Так как нет способа (есть но такое себе) проверить уже на готовой модели что она жрала до своего формирования как модели. То для решения авторских споров или тип того единственный способ это показать вот данные, вот начальное состояние сети, в случае чего можно просто обучить сеть заново и получить побитовую копию. Нейросетки детерминированны, всё различие это в начальных случайных (не всегда) значениях и настройках. Любая нейросетка воспроизводима. Честный разработчик в случае спора покажет чем обучал и как. А подавляющее большиснтво и в особенности жопы из миджорни и малкософт копилот этого не сделают ибо они тупо скачали весь интернет и обучали.

Заранее скажу отдельным дебилам нет обучение нейросетки и обучение человека это не одно и тоже. И есть фундаментальная разница между тем что художник учился на чужих работах и сетка училась на чужих работах. Это факт, пишу дабы сразу отсечь подобные заявления и сравнения. Дебилы только те кто за такое мнение яростно топит, если бы просто так невольно думали или вам нашептали на ушко то вы не дебилы, ну просто заблуждение.

И ещё момент, если эта фигня с отмывом авторских прав будет прям цвести и пахнуть то перспективные разработки и новые алгоритмические подходы с практиками уже будет целесообразнее вести в закрытой разработке. Короче подобная практика естественным образом сделает проприетарный код благом. Будет выгоднее и интереснее вести закрытый проект чем открытый. Сейчас это уже есть и называется игры, развлекательный контент в рамках СПО и опенсурса жизни просто не имеет почти, есть конечно исключения несколько десятков, но это исключения из сотен тысяч.

Дело в целом и не в коде, а полностью развязанных руках гигантов. GPL уже никак не защищает код. Также как и CC BY SA для таких перцев как создатели миджорни и прочего говна значения не имеют и ничего ты им не сделаешь ибо, а ты докажи! (хотя механизмы есть, хитрая стенография заложенная в изображения,текст,код воспроизводится потом сетками и можно доказать посадить на кол в суде, но это очень муторно)

Хотя есть куча спорных моментов и я даже сам с собой спорю, хранить сырые данные для обучения это на словах легко, на деле я сем так не делаю, ещё момент с добросовестным использованием работ авторов аля цитирование, должны быть рамки ибо можно свести к тому что если я пипеткой из картины цвет взял то всё это производная работа и куча ещё моментов про которые я вроде топлю, но…

На деле нужен краткий и чёткий низкоуровневый закон из которого будут проистекать права и свободы как авторов так и создателей сетей. Фундамент, а не нашлёпка которую кому надо обойдут.

LINUX-ORG-RU ★★★★★
()
Последнее исправление: LINUX-ORG-RU (всего исправлений: 2)

Проблема исключительно юридическая, гпл код остается гпл кодом хоть 10 раз его через нейросеть прогони. Ты можешь выдумать какие угодно ограничения, но будут ли они работать на практике - решит судья, естесьвенно в нужную сторону.

ya-betmen ★★★★★
()
Последнее исправление: ya-betmen (всего исправлений: 1)
Ответ на: комментарий от LINUX-ORG-RU

Переписывание кода до неузнаваемости, да так, чтобы он работал, это уже серьезная штука. Такой продвинутый ИИ сможет, я думаю, генерить игру по текстовому описанию, при таких раскладах то, что GPL превратится в cuck BSD, будет сущей ерундой для индустрии, которую вообще никто не заметит на фоне общего апокалипсиса.

goingUp ★★★★★
()
Последнее исправление: goingUp (всего исправлений: 3)
Ответ на: комментарий от goingUp

Банальный пример копирайтеры/рерайтеры, есть сети которые берут текст переписывают его по иному сохраняя суть (тут и нейросети не нужны даже это можно по разному сделать) далее есть сети которые распознают паттерны таких изменённых текстов для выявления это перегенерированный текст или нет и даже ищут оригинал, а есть ещё сети которые берут перегенерированный текст и ещё раз его перегенерируют для того что бы сети которые выявляют перегенерированный текст не могли распознать и найти оригинал =) Вот такая карусель уже идёт полным ходом так как с простым текстом повествовательным/новостным всё просто, а контент нужен всегда и всем и штамповать его надо 24/7/360 без остановки. Пока затык с кодом, но чуть подождать и тоже самое будет код от просто текста мало чем отличается даже проще отчасти так как в коде есть чёткие паттерны которые выявляются гарантированно.

Нейросетки это здорово и хорошо, но боюсь их развитие уничтожит СПО и опенсурс, не в смысле задавят и всё такое, а в смысле просто люди сами начнут делать больше закрытых проектов, а одиночки тем более. СПО и опенсорс сами по сути убили почти разработку в одно рыло в своё время. Не совсем конечно, но прокормить себя личной разработкой сейчас…. эммм должно очень повезти как минимум. Пока жива игровая индустрия и это пока почти единственный способ вести разработку самому, делать клёвые вещи и даже открывать код и ещё жить на это. Хочется и делать хорошо и на этом хорошем жить и другим делать хорошо. Но чаще у людей получается сейчас всем всё, а тебе писюн =) Но это уже так. бубубу

LINUX-ORG-RU ★★★★★
()
Ответ на: комментарий от firkax

А когда тебе драйвера в чистой комнате реверсят, это другое?

Давайте будет последовательны. НедоЕИ от недоИИ отличается только тем, что недоЕИ поставляется сразу в мешке с мясом для таскания в суд, а для недоЕИ ещё надо найти крайнего. В остальном — что мешки, что машины, все одно и то же.

t184256 ★★★★★
()

Гораздо проще объявить, что весь код, который сгенерировала нейросетка, должен быть под GPL/BSD/MIT/твоей любимой лицензией.

buddhist ★★★★★
()
Ответ на: комментарий от LINUX-ORG-RU

люди сами начнут делать больше закрытых проектов, а одиночки тем более.

Ты хотел сказать роботы?)

Также они станут больше делать открытых проектов, потому что их станет легче делать. И да, с ИИ в одно рыло можно будет делать проекты, которые раньше были под силе только команде.

Пока жива игровая индустрия и это пока почти единственный способ вести разработку самому, делать клёвые вещи и даже открывать код и ещё жить на это.

Правда? У меня от инди геймдева сложилось впечатление, что там сплошное нищеэтосамое, кроме некоторых студий, которым повезло.

goingUp ★★★★★
()
Ответ на: комментарий от Mobutu_Sese_Seko

Замаскировать нарушение конечно всегда возможно, но тем не менее оно остаётся нарушением, за которое можно подать иск. А как именно его факт выявить - другое дело. Разница тут в том, что в случае с ИИ маскировать ничего не надо, и исков бояться тоже не надо, всё «законно».

firkax ★★★★★
() автор топика
Ответ на: комментарий от goingUp

Юридически - нельзя, у них в лицензиях запрет на дизассемблирование и прочие исследования обычно. А тут они главную ценность свободного софта пытаются обернуть против него же.

firkax ★★★★★
() автор топика
Ответ на: комментарий от LINUX-ORG-RU

Вот ты ЕМНИП какую-то игру делал, много заработал? Ну если сравнить с ситуацией, если бы ты сразу пошел работать в какую-то контору.

goingUp ★★★★★
()
Ответ на: комментарий от LINUX-ORG-RU

Выход есть, ну это правда уже на уровне закона, который автоматически всё прозрачным сделает и лицензии поддержит, суть проста, обязать автора публикующего обученную нейросеть / или иное сопоставимое с результатом сеток и нуждающиеся в данных входных для обучения, ну так вот обязать хранить сырые данные участвовавшие в обучении.

Не вижу чему это поможет. Они и так могут не скрывать что GPL-ным кодом обучали.

firkax ★★★★★
() автор топика

А может, всё не так страшно и пусть воруют код? Или же, может быть, подобные вещи должны регулироваться законами, а не лицензиями?

RMS на вас нет.

Копирование != воровство. Даже близко.

И да, пусть копируют. Какая разница, для ИИ или нет? Ну ок, ИИ закрытый, а мозг проприетарного кодера открытый? Если твой код прочитал кодер из плоти и крови, а потом написал своё «по мотивам» закрытое, то это типа норм, а если это сделано с помощью нейросетки в компе — уже нет? Почему? Результат ведь один.

Если такое отношение к своему ненаглядному коду, зачем вообще его выкладывать под свободной лицензией?

CrX ★★★
()

Лицензия, код под которой не смогут украсть через ИИ

Еула. Нет исходников в интернетах — ИИ сасает. По крайней мере, пока либастрал не вышел (когда же, когда уже?).

Nervous ★★★★★
()
Ответ на: комментарий от firkax

дизассемблирование и прочие исследования обычно

Ну ИИ по идее и сразу в машинных кодах сможет понимать, так по идее даже эффективнее, а насчет исследований, их не может быть, если нету исследователя негр_тычет_пальцем_в_лоб.jpg )

goingUp ★★★★★
()

Если чисто по-моему, личному мнению, (IMHO) - то всем, на всё - глубоко похрен. Когда я был молод и глуп - я тоже, оформлял свои программы под лицензию LGPL. Теперь же - не вижу смысла. Даже сущетвующей защитой - один хрен взломают. Убедился в этом на программе одного автогиганта. Ну, скажем прямо, взлом занял около недели. Там просто из модуля запускался внешний процесс... Но, получилось.

Только донаты, на дальнейшую разработку. Иначе, думаю, никак.

cadaber ★★
()
Ответ на: комментарий от Mobutu_Sese_Seko

Психоаналитики вернулись из отпуска, да?

новое психическое заболевание - Mobutu_Sese_Seko ещё такой массовый психоз - LINUX-ORG-RU

Я да ты, да мы с тобой, коллега :D

А так, фиг знает оч часто на глаза попадается, побубнил немножечко.

LINUX-ORG-RU ★★★★★
()
Ответ на: комментарий от goingUp

Скармливание бинарника ИИ тоже под это попадёт. Какие там точные формулировки я не помню, но думаю это не важно. Суть их сводится к тому, что ты вообще никак не должен пытаться изучать внутренности софта, а только запускать его.

firkax ★★★★★
() автор топика
Ответ на: комментарий от CrX

Если твой код прочитал кодер из плоти и крови, а потом написал своё «по мотивам» закрытое, то это типа норм, а если это сделано с помощью нейросетки в компе — уже нет?

Кодер - субъект различных отношений в обществе, у него есть (признаваемое обществом) право на собственную инициативу и его, например, можно допросить на предмет «а не поручила ли тебе корпорация скопипастить тот код под видом разработки по мотивам?».

Нейросетка же сделает что ей запрограммировали (не надо только придираться к словам на тему что их не программируют), потом её удалят с носителей и всё (а может и нейросетки то не было, как проверить то?). Ответственным будет её владелец, который заявит что «вот нейросеть мне какой-то код написала, а то что он почти дословно похож на, условно, gimp, так я её до этого обучал на его исходниках, вот и похож, но в деталях её работы не разбираюсь и больше ничего объяснить не могу», и придраться тут будет особо не к чему.

Если такое отношение к своему ненаглядному коду, зачем вообще его выкладывать под свободной лицензией?

RMS на вас нет.

Вот у RMS спроси зачем он GPL придумал. Там ровно те же цели: не дать опроприетарить свободный код.

firkax ★★★★★
() автор топика
Последнее исправление: firkax (всего исправлений: 2)
Ответ на: комментарий от firkax

Был бы ещё норм вариант если обучил сеть на ГПЛ коде, да генерируй сколько угодно! Только весь код ГПЛ должен быть. Обучал сеть на основе 1000 MIT проектов? Да пожалуйста, только результат должен включать все копирайты 1000 штук авторов и MIT лицензию и так далее. Суть не в том чтобы всё всем запретить по сути. Это было бы хорошо и по человечески и полезно и все права сохранены. Но то факт что законы уже приняты делает подобное почти невозможным и остаётся либо носик опутстить ну ляяядьня и идти дальше или палки колёса вставлять указывая явный запрет в своей лицензии личного проекта и то понимая что над этим только похихикают большинство.

LINUX-ORG-RU ★★★★★
()
Последнее исправление: LINUX-ORG-RU (всего исправлений: 1)
Ответ на: комментарий от LINUX-ORG-RU

Ну так то конечно, можешь хоть открыто скопипастить, но если лицензию и авторство не затрёшь - никто не возразит. А ИИ тут может использоваться для вполне добросовестной доработки.

firkax ★★★★★
() автор топика
Ответ на: комментарий от firkax

«Если вы не готовы выложить свой код под WTFPL, лучше вообще его не выкладывайте.»

dimgel ★★★★★
()

полагаю, что код который нельзя будет угнать в нейросеть станет никому особо не нужен как не нужны сейчас en masse AIX, Solaris, HP-UX. Т.е. ИИ вместе с кожаными мешками будут очень быстро/эффективно/модно делать фантастические приложения на новом ньюЖТК с новым ЖПЛ за которыми традиционалисты со своим старым чахлым огороженным кондовым ЖТК не смогут успевать.

Syncro ★★★★★
()
Ответ на: комментарий от Mobutu_Sese_Seko

Психоаналитики вернулись из отпуска, да? Я не о «человеке», вообще-то, а о самом явлении — страхе воровства знаний. Я вообще не помню, какой ник у того регистранта был.

Так речь не о знаниях, а об интеллектуальной собственности.

Между знаниями и готовым к использованию промышленным кодом огромная разница.

sanyo1234
()
Ответ на: комментарий от Syncro

полагаю, что код который нельзя будет угнать в нейросеть станет никому особо не нужен как не нужны сейчас en masse AIX, Solaris, HP-UX. Т.е. ИИ вместе с кожаными мешками будут очень быстро/эффективно/модно делать фантастические приложения на новом ньюЖТК с новым ЖПЛ за которыми традиционалисты со своим старым чахлым огороженным кондовым ЖТК не смогут успевать.

Нынешний гопоте ведь не генерирует пригодного для конечного применения кода? Его нужно еще дорабатывать.

Сомневаюсь, что гопоте может генерировать столько же компактный код как в OpenBSD.

sanyo1234
()
Ответ на: комментарий от Bad_ptr

да, твою лицензию конечно же будут уважать ведь ты написал что нельзя значит так и будет

Общество приличных людей обычно строится на уважении к условиям лицензий.

sanyo1234
()
Ответ на: комментарий от Mobutu_Sese_Seko

Дак закроют и обфусцируют код же. «Берите бинарники, другого не продаём». И в лицензии — запрет на декомпиляцию.

Обыск компьютерными криминалистами?

sanyo1234
()

Производная от GPL лицензия с запретом на обучение кодом ИИ будет с оригинальным GPL несовместима

В сильном варианте такая лицензия будет не совместима и с типичным законодательством о т.н. «интеллектуальной собственности» ( об авторских и смежных правах и т.д.)

В слабом варианте производный продукт либо признаётся судом по заключению экспертов производным продуктом, и в этом случае могут действовать не противоречащие законам положения авторского договора исходного продукта и правовые нормы, либо не признаётся.

vM ★★
()

Писатель софта той или иной степени свободы в коммерческом обществе похож на розовощекую Красную Шапочку (не RH) с корзинкой пирожков и наивными круглыми глазенками в темном лесу. Неважно, какой лицензией он будет отмахиваться от волков, он обречен либо страдать, либо смириться. Все открытое, представляющее интерес, будет либо присвоено, либо обработано напильником и присвоено.

А если вспомнить, что большая часть подобного софта пишется не маленькими одинокими девочками, а корпорациями, которые сами кого хошь съедят, то и смысл размышлений на эту тему непонятен

vaddd ★☆
()
Ответ на: комментарий от Mobutu_Sese_Seko

Я давно заметил, чем тупее и менее образован человек, тем он больше пытается мнить из себя психолуха, потому что других аргументов нет, кроме как кидаться выдуманными какахами без аргументов.

sanyo1234
()

Мир не поменялся. Он разделился на нищуков, которые играют в опенсурс (а некоторые еще и верят лол) и корпы, которым похер на лицухи. Иди своруй хромиум или андроид, все равно кроме гугла никто не потянет.

Lordwind ★★★★★
()
Ответ на: комментарий от vaddd

А если вспомнить, что большая часть подобного софта пишется не маленькими одинокими девочками, а корпорациями, которые сами кого хошь съедят, то и смысл размышлений на эту тему непонятен

А смысл такой, что законопослушные корпы закидывают приманку, и потом прессуют детективами лохов, возомнивших, что они поймали удачу за хвост, якобы своим незаметным нарушением лицензий.

sanyo1234
()
Ответ на: комментарий от sanyo1234

Да о чем вы вообще говорите ) Мелкие фирмы софт не открывают и никто не знает что у них внутри

vaddd ★☆
()
Ответ на: комментарий от firkax

Кодер - субъект различных отношений в обществе, у него есть (признаваемое обществом) право на собственную инициативу и его, например, можно допросить на предмет «а не поручила ли тебе корпорация скопипастить тот код под видом разработки по мотивам?».

Нейросетка же сделает что ей запрограммировали (не надо только придираться к словам на тему что их не программируют), потом её удалят с носителей и всё (а может и нейросетки то не было, как проверить то?). Ответственным будет её владелец, который заявит что «вот нейросеть мне какой-то код написала, а то что он почти дословно похож на, условно, gimp, так я её до этого обучал на его исходниках, вот и похож, но в деталях её работы не разбираюсь и больше ничего объяснить не могу», и придраться тут будет особо не к чему.

Это не отвечает на мой вопрос. Какая до всего этого разница автору оригинального свободного кода, если результат один и тот же: появился закрытый софт, написанный «по мотивам».

Если код действительно похож, то неважно, написала его нейросеть или сотрудник компании на зарплате, предъявлять всё равно будешь компании, и действия (убирать фичу, переписывать заново, открывать код и т.д.) всё равно нужно будет компании. Каким инструментом оно сделано: индус на зарплате, нейросеть, Боженька зачитал через горящий куст — не имеет существенного значения — код или является деривативом от существующего или нет.

Если же код достаточно непохож на тот открытый, что есть, то опять же никакой разницы, написан он с помощью нейросети, или с помощью индуса-фрилансера.

Вот у RMS спроси зачем он GPL придумал. Там ровно те же цели: не дать опроприетарить свободный код.

Так в твоём примере сам код не проприетарится. Он используется для обучения нейросетки. Что в данном случае принципиально не отличается от обучения сотрудника. DISCLAIMER для особо упоротых: я не говорю, что нейросетка и человек — одно и то же. Лишь то, что результат в итоге один, и пользы/вреда сообществу принесено ровно столько же

CrX ★★★
()
Ответ на: комментарий от LINUX-ORG-RU

Был бы ещё норм вариант если обучил сеть на ГПЛ коде, да генерируй сколько угодно! Только весь код ГПЛ должен быть.

Хорошая идея, мне нравится. Только на этом не надо останавливаться, надо идти дальше! Если обучил студента на GPL-коде, да пусть потом кодит сколько угодно. Только весь его код до ухода на пенсию под GPL должен быть.

CrX ★★★
()
Ответ на: комментарий от CrX

появился закрытый софт

Как он узнал о том, что в этом софте? Он получил преступным способом доступ к коммерческой тайне?

предъявлять всё равно будешь компании

Которая в ответ предъявит не только гражданский иск, но и уголовный практически со стопроцентным успехом. А разработчику еще надо пыжиться и доказывать, что «где-то вот здесь кусочек кода слегка напоминает мой»

vaddd ★☆
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)