LINUX.ORG.RU
ФорумTalks

Опенсорсники против искусственного интеллекта

 , , , ,


1

1

Привет, ЛОР!

Как ты, наверное, слышал, проекты вроде Copilot и Codex используют нейронные сети, обученные на открытом коде, для автоматической генерации нового кода и зачастую требуют платную подписку.

Это ведёт к множеству проблем, т.к. тот же Copilot был замечен в выдачи фактически скопированных кусков из чужого кода. Одним известным примером была выдача кода быстрого вычисления квадратного корня из движка Quake3, который был изначально опубликован под GPL, то есть в данном случае лицензия GPL была потенциально нарушена.

В ответ на это, проект Pay To Train AI подготовил альтернативные версии популярных лицензий, добавляющих пункт Humans Only, препятствующий легальному использованию такого кода для обучения моделей искусственного интеллекта. Так же добавлена возможность требовать за такое использование своего кода деньги.

Ссылка: https://www.paytotrain.ai/

Как думаешь, ЛОР, что скажет Столлман по этому поводу? Не противоречит ли такое ограничение духу свободного ПО?

★★★★★

Последнее исправление: hateyoufeel (всего исправлений: 1)

Есть те, кто использует это?

Я попробовал когда-то бесплатный (или trial он был тогда) TabNine, и меня совсем не впечатлило. Больше приходилось исправлять за ним, чем реально помогал.

И кажется, что сформулировать чётко задачу, шаги по её решению, придумать архитектуру, как и куда её впихнуть, значительно сложнее, чем собственно сам код написать.

После неудачного опыта с TabNine, мне кажется, что все поиграются и забудут, и проблема исчезнет сама собой.

Ну школота будет «писать» домашние задания, которые, скорее всего, не будут работать правильно.

emorozov
()

Ты хайповщик, или паникёр? Или вообще провокатор на ставке?

GPL была потенциально нарушена

Что мешает прикрутить к ИИ поиск по обучающему массиву и выдавать список использованных лицензий?

Humans Only

Свободные лицензии призваны обеспечивать свободу использования, изучения и модификации. Для себя, других людей и сообщества. Лицензионная чистота вторична — она только способствует этим целям в рамках существующих законов. Поэтому я ожидаю, что такое ограничение сочтут несвободным. И ограничатся требованием искать схожий код и показывать лицензию.

question4 ★★★★★
()

духу свободного ПО

Я уже писал с пруфами, что ДухЪа нет. Есть свободные фанатики, которые неправильно поняли лицензию...

xwicked ★★☆
()
Ответ на: комментарий от question4

Что мешает прикрутить к ИИ поиск по обучающему массиву

фига заявка на победу

fluorite ★★★★★
()

Интересно а где граница между: скопировал из проекта под GPL себе в проприетарьку строчку a=1 (которая в принципе распространенная и каждый программист такую из головы напишет) или скопировал целую функцию с уникальным алгоритмом, вот где начинается эта граница, интересно.. Кажется тут как с диссертациями, буквы знают все, а вот копировать себе в роман страницы из Войный Мира сразу спалишься что не сам независимо придумал и написал, думаю будет некий диссернет но для кодов.

mydibyje ★★★
()
Ответ на: комментарий от question4

Что мешает прикрутить к ИИ поиск по обучающему массиву и выдавать список использованных лицензий?

во-первых, жадность — нельзя ж будет ГПЛный код в проприетарщину пихать. во-вторых, лицензией-то дело не ограничивается, надо ещё автора кода найти и добавить в список «соавторов».

caryoscelus
()
Ответ на: комментарий от question4

Что мешает прикрутить к ИИ поиск по обучающему массиву и выдавать список использованных лицензий?

Насколько я помню там как раз сделали обратное: прикрутили удалялку лицензионных комментов.

firkax ★★★★★
()
Ответ на: комментарий от mydibyje

Границу определяет здравый смысл. Если у ответчика с ним проблемы - то суд.

firkax ★★★★★
()
Ответ на: комментарий от emorozov

Есть те, кто использует это?

Мои товарищи пользовали. Говорят, копипасту генерировать — пойдёт, но не более того. Т.е. если у тебя куча однотипного кода, эта штука тебе сэкономит время.

hateyoufeel ★★★★★
() автор топика
Ответ на: комментарий от question4

Ты хайповщик, или паникёр? Или вообще провокатор на ставке?

Да.

hateyoufeel ★★★★★
() автор топика
Ответ на: комментарий от Panika

Я так подозреваю, больше всего чуваков задело, что MS деньги за это берет. Ну и традиционная фигня с GPL, да. Если модель считается производным продуктом от GPL-кода, то она тоже должна быть под GPL. Как-то так их логика звучит.

hateyoufeel ★★★★★
() автор топика

Опенсорсники

Неолуддиты, в этом контексте

anonymous_sapiens ★★★★★
()

Какая разница, как был взят код? То, что называют искусственным интеллектом - это просто программа. Скопирую я код с помощью copilot или же с помощью

cat src/file.c > mysrc/myfile.c
разницы абсолютно никакой нет.

shell-script ★★★★★
()

Не знаю насчёт духа, но OSD и DFSG точно противоречит.

intelfx ★★★★★
()

Humans Only

Жители планеты Железяка протестуют. :)

anc ★★★★★
()

альтернативные версии популярных лицензий, добавляющих пункт Humans Only, препятствующий легальному использованию такого кода для обучения моделей искусственного интеллекта

И это создаст лазейку для обхода лицензий. Будут воровать код посредством ИИ. Экспертизу проводить трудно, фиг подкопаешься.

Так же добавлена возможность требовать за такое использование своего кода деньги

Нужно, чтобы автор явно давал разрешение с какими-то условиями. Иначе см. выше.

InterVi ★★★★
()
Ответ на: комментарий от hateyoufeel

так дело вроде даже не в модели и ее лицензии. Уже видел похожие обсуждения, когда копилот так же подставлял целиком код из какого-то проекта, без изменений. С точки зрения лицензии думаю абсолютно неважно, сам я руками затащил себе кусок GPL или его подставил vscode.

Вот только руками я могу проверить, что этот кода под GPL (или наоборот, не под GPL), а тут лицензия вырезана и хз что это

user_undefined
()
Ответ на: комментарий от InterVi

Экспертизу проводить трудно, фиг подкопаешься.

и без ии можно кусочками тырить gpl и так же будет сложно что-то доказывать, особенно для проприетарного кода.

Зато больше шансов действительно случайно притащить в проект код под несовместимой лицензией

user_undefined
()

Прочитал как «Одноклассники против искусственного интелекта».

А по теме: Столлмановская лицензия и так ограничивает все по самое небалуйся, её даже свободной-то язык не поворачивается назвать. Так что ещё одно ограничение погоды не сделает.

cocucka ★★★★☆
()

А смысл ? Существующие лицензии и так это учитывают, ибо если что, что косить под дурачка и нагло пытаться закрыть код под свободной лицензией можно и так, причём жопоболь в вопросе юридического доказательства будет и так и так, ибо в случае копилота по задумке нужно доказать что код использовался для обучения, а в случае присвоения кода обычным человеком по сути тоже самое - доказать, что код был использован и также соответственно не была соблюдена лицензия, как итог мы в обоих случаях утыкаемся в тот факт, что нам нужно фактически как-то ломануть проприетарный код, т.е. соответственно архитектуру, параметры обучения сети копилота и код закрытой софтины, которая приватизировала чужой труд - сложность задач примерно одинаковая и на деле решение вопроса зависит не от с условных договорённостей лицензии, а качеством команды юристов.

А то, что майки использовали жпл код для обучения, то это и ежу ясно, но в вопросе нейросетей если так подумать, то там и так сплошной криминал, ибо подавляющее количество данных фактически либо получено было без согласия, либо с помощью хитрожопых манипуляций, правок пользовательского соглашения сервисов того же гугла и пр., поэтому тут вопрос скорее нужно ставить так, чтобы было тупо запрещено вести закрытые разработки в области нейросетей, в противном случае ждать, что буржуи будут соблюдать законы теряя прибыль - наивно, тут скорее напротив это лишь ещё больше укрепляет их стремление влиять на законы и участвовать в госуправлении.

AKonia ★★
()

А что гпл говорит про переписывание на другой язык? Написал на сисярпе глядя в исходник на жабе под гпл3. Мой код - это что?

DumLemming ★★
()
Ответ на: комментарий от DumLemming

А что гпл говорит про переписывание на другой язык? Написал на сисярпе глядя в исходник на жабе под гпл3. Мой код - это что?

Ты путаешь палец с членом. Тут конкретно проблема в том, что copilot сотоварищи может выдавать куски чужого кода без изменений. Даже с оригинальными комментами!

https://nitter.unixfox.eu/mitsuhiko/status/1410886329924194309

hateyoufeel ★★★★★
() автор топика
Последнее исправление: hateyoufeel (всего исправлений: 1)
Ответ на: комментарий от emorozov

Есть те, кто использует это?

Я использую, и весьма доволен. Оно стоит своих $10 уже за то, что помогает дописывать комментарии. Ну и код конечно.

goingUp ★★★★★
()
Ответ на: комментарий от DumLemming

Мой код - это что?

Твой код - это производная работа от gplv3 и должен быть лицензирован под ней же.

Собственно, если ты на суде заявишь, что при написании своего кода смотрел в код gplv3, то этого уже будет достаточно.

Для этого у реверс-инженеров и существует практика того, что один человек разбирает код, рассказывает про его api, а пишет новый код уже другой человек, не смотревший в бинарь.

Ivan_qrt ★★★★★
()

Писатели на порфирьевича не сильно бухтели, многие уже пользуются. Я НЕ ПОЛЬЗУЮСЬ!!!11 у меня самописная приблуда есть.

Irma ★★
()

Всё правильно делают. Нет никаких гарантий того, что AI не будет вставлять куски существующего кода, более того, он так и делает.

А значит он нарушает лицензии, причём все, и gpl, и bsd. Только wtfpl не нарушает.

И даже если он будет отсеивать существующий код, то вставлять он будет так или иначе, производную работу. Грубо говоря, если ты везде заменил названия переменных, то код от этого не перестаёт быть производным.

Насколько глубоким должно быть переосмысление чужого кода моделью - вопрос открытый, и по-сути, нужно сперва доказать, что переосмысление есть и его достаточно, а уже после этого предлагать код клиентам.

PayToTrainAI хернёй занимается, т.к. это и так не законно. Я так понимаю, что сейчас на эту тему уже судятся.

Ivan_qrt ★★★★★
()

Очевидно что этот Copilot нарушает лиценции кода на которых он «обучен». При вставке участков кола он обязан указывать лицензию и место заимствования.

X512 ★★★★★
()

Не противоречит ли такое ограничение духу свободного ПО?

В 2006 году на IRC-канале североамериканских лоеров спрашивал, можно ли цитировать ваши энциклопедии, составляя сборную солянку. Говорят, нет. Видимо, про процент допустимого цитирования их законы не говорят.

Здесь, с сорцом, аналогично. В принципе, всю проблему решает крупный олигархат в лице крупных корпораций. Как решит - так и будет.

Mirage1_
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)