LINUX.ORG.RU
ФорумTalks

Опенсорсу конец

 ,


0

4

Не могу кинуть пруфлинк на подробности, история мелькнула у меня в ленте мастодона, сейчас листать-искать лень, придётся поверить.

Ну так вот, как вы помните самый честный, справедливый, совершенно точно не коррумпированный, неподкупный, не подверженный влиянию эффекта «побеждат тот, у кого адвокат дороже» американский суд уже принял решение, что выхлоп нейронки не наследует копирайтов её учебной базы. И вот мы видим достойное продолжение этой истории. Автор опенсорсной программы под LGPL решил сменить лицензию, но не мог этого сделать одним лишь своим решением, потому что не был единственным автором. Он сказал нейронке «перепиши программу» и опубликовал выхлоп под лицензией MIT. Финиш. Приехали. Теперь любую опенсорсную программу можно переписать нейронкой и выдавать за свою. Ждём поток «убийц» Microsoft Office’а чем-то напоминающих Libreoffice. Ждём отказ Qt Company от опубликования исходников, потому что нет смысла платить за коммерческую лицензию, если можно просто переписать опенсорсный Qt.

★★★★★

Последнее исправление: CrX (всего исправлений: 2)
Ответ на: комментарий от thesis

А что, есть какой-то закон о запрете публикации нейроблева, который был проигнорирован нечестным продажным американским судом?

Вы меня спросили как я рассудил бы на месте американского судьи, а теперь предъявлете мне аргумент, что моё мнение не совпадает с мнением американского судьи. Ловко.

И таки есть закон запрещающий публиковать код нарушающий лицензию, независимо от того является ли он нейроблёвом.

Camel ★★★★★
() автор топика

выхлоп нейронки не наследует копирайтов её учебной базы. И вот мы видим достойное продолжение этой истории.

Как бы нет. Тут ведь речь не про обучение нейронки, а про переписывание кода при ее помощи. На чем там она училась никому не известно, и в данном кейсе не упомянуто.

maxcom ★★★★★
()
Ответ на: комментарий от Zhbert

Почему? Какая репутация у Оракла? На сколько репутация просела у Оракла, когда от выкатил клон redhata? Это Оракл боится каких-то мифических судебных издержек? Вы в каком мире розовых пони живёте?

vtVitus ★★★★★
()
Ответ на: комментарий от pelmeshechka

Что-то мне подсказывает, что уж в этом случае суд встанет не на сторону переписывальщиков!

Если они напишут «функционально идентично проприетарному софту XYZ», то да, сразу юристы начнут работать. Пока просто законодательство отстаёт от этих ЛЛМ. Как только капитал поймёт, что существует угроза со стороны ЛЛМ их бизнесу, они надявят на политиков, и те примут закон, согласно которому хозяин ЛЛМ будет обязан по запросу адвокатов раскрывать факт нелегального использования проприетарных исходников.

seiken ★★★★★
()
Ответ на: комментарий от Camel

Вы меня спросили как я рассудил бы на месте американского судьи, а теперь предъявлете мне аргумент, что моё мнение не совпадает с мнением американского судьи. Ловко.

Конечно, ловко. Потому что мнение (какое, в жопу «мнение?» Суд выносит РЕШЕНИЕ) судьи ВНЕЗАПНО должно быть основано на действующих законах, а не «идите нахер отсудава».

thesis ★★★★★
()
Последнее исправление: thesis (всего исправлений: 1)
Ответ на: комментарий от vtVitus

Потому что это бизнес. Крупный. Это не васян с рынка или школьник с убунтой. Им для таких телодвижений надо сначала все продумать и решить, покроет ли потенцальная выгодна возможные судебные издержки. Оно, конечно, не отметает на корню такую возможность, но и вероятность её как бы не 100%.

Zhbert ★★★★★
()
Ответ на: комментарий от maxcom

Правда ваша.

Однако является ли выхлоп нейронки на запрос «перепиши мне GNU parted» производной работой от GNU parted?

Camel ★★★★★
() автор топика
Ответ на: комментарий от Zhbert

Вот только Окракл не пойдёт на такое, скорее всего.

Тут сразу вспоминается спор Google vs Oracle о Java в Android. Правда клонированием занимался в данном кейсе Google, но ситуация похожая.

maxcom ★★★★★
()
Ответ на: комментарий от no-such-file

Нет, он все правильно написал.

«обучение на коде, и переписывание кода обученной моделью вообще никак друг с другом не связаны» — это субъективное заявление, так считают те, кто не признает нейрослоповый код производным продуктом.

pelmeshechka ★☆
()
Последнее исправление: pelmeshechka (всего исправлений: 2)
Ответ на: комментарий от vtVitus

а не перейти на бесплатный продукт от всемирно известного Оракла с нулевыми затратами на миграцию с гигантской службой поддержки.

Ну т.е. Оракл станет бесплатно работать ради меня, чтобы я не платил за Qt? Но я думаю, что даже у манагеров мозги не такая вата, чтобы понять, что работает это до первого серьёзного прецедента, после которого принимается соотв. законодательство, а манагер и его ЛЛМ-биороботы остаются без работы. И это при том, что вообще ЛЛМ разработка в долгосрочной перспективе будет эффективна. Пока что это не доказано, очень много хайпа, но мало фактов.

seiken ★★★★★
()
Ответ на: комментарий от Camel

Однако является ли выхлоп нейронки на запрос «перепиши мне GNU parted» производной работой от GNU parted?

Зависит от обстоятельств. Данный вопрос не может быть решён «автоматически» также как он не может быть решён в случае если это сделает сам человек. Каков вклад человека в «новый» код, каков объём его творческого труда? Переписовальщик может претендовать на авторство, а авторы изначального кода могут быть с этим не согласны. Такие спорные моменты решает суд. ИИ тут вообще ни при чём, такие споры были и раньше.

no-such-file ★★★★★
()
Ответ на: комментарий от James_Holden

Нет погоди. Речь не про обучение. Если закинули в промт, это использование или нет?

Тут ещё сложнее. А главное, доказать, что это был именно промт, сложно.

Ну и опять же если брать аналогию с человеком. Вот допустим, ты фрилансер, приходит к тебе заказчик, говорит: вот ссылка на гитхаб библиотеки libcoolthings под GPL, хочу такую же, но свою. Ты можешь выполнить заказ ничего не нарушив? Очевидно, что как минимум просто прочитав документацию по API, можешь. Но есть ли тебе запрет на просмотр кода? Вроде нет. А если ты реализацию конкретной функции посмотрел? Не скопировал, и даже не держал во втором окне, построчно переписывая по-своему, а просто посмотрел, как там, а потом написал по-своему. Это уже использование кода, или нет? Я так понимаю, что вроде как нет. И если удастся внедрить идею, что между нейросеткой и человеком нет принципиально разницы, то получается, что и нейросетка, которая просто прочитала код, а потом написала свой, ничего не нарушает. Можно даже в промпт написать что-то типа «сперва прочитай, потом напиши по-своему, не используй фрагменты кода», и потом этот промпт в суде предъявлять.

CrX ★★★★★
()
Ответ на: комментарий от no-such-file

Такие спорные моменты решает суд. ИИ тут вообще ни при чём, такие споры были и раньше.

Только раньше использование проприетарного исходника доказывалось по примитивным критериям (см. дело SCO против Linux). А LLM может переписать код так, что совпадений строк не будет вообще.

seiken ★★★★★
()
Ответ на: комментарий от pelmeshechka

так считают те, кто не признает нейрослоповый код производным продуктом

Он и не является производным продуктом. Также как код который пишу я не является производным от кода из учебника который я прочитал. Теоретически наверное можно запатентовать «приёмы программирования» как полезную модель, но пока до такого маразма не дошли.

PS: в любом случае это иезуитские трактовки отдельных сектантов. Суд принимая решение о коде используемом в обучении исходил из общепринятых представлений об обучении и использовании моделей.

no-such-file ★★★★★
()
Последнее исправление: no-such-file (всего исправлений: 1)
Ответ на: комментарий от thesis

Если бы законодательство было полностью формализовано, то суды в общем-то можно было бы и упразднить. А они потому и существуют, что законы могут трактоваться, применяться и т.д. по-разному.

Тот факт, что существуют суды разных инстанций, и высшие могут отменить решения низших, это доказывает.

Конечное решение будет за SCOTUS, верховным судом, а он этот вопрос ещё не рассматривал (но лично я уверен, что он ничего не изменит и утвердит fair use для обучения нейросетей).

pelmeshechka ★☆
()
Последнее исправление: pelmeshechka (всего исправлений: 1)
Ответ на: комментарий от Zhbert

LLM может переписать код так, что совпадений строк не будет вообще.

Вот и ответ на вопрос.

То есть если я попрошу нейронку «перепиши мне детектив про Эраста Фандорина, но поменяй имена и место действия», в выхлопе не будет совпадающих строчек. Могу ли в этом случае говорить, что это новое произведение?

Camel ★★★★★
() автор топика
Ответ на: комментарий от Camel

То есть если я попрошу нейронку «перепиши мне детектив про Эраста Фандорина, но поменяй имена и место действия», в выхлопе не будет совпадающих строчек. Могу ли в этом случае говорить, что это новое произведение?

Ну вон книга про Таню Гроттер вполне себе существует. Аж серия целая. И да, там именно переименовали героя и даже в принципе оставили сюжет как было.

Zhbert ★★★★★
()
Ответ на: комментарий от James_Holden

Ну да, накупишь железа и будешь работать бесплатно, оря на каждом шагу «у меня убийца Qt! у меня убийца Qt! Налетай!»

seiken ★★★★★
()
Ответ на: комментарий от pelmeshechka

законы могут трактоваться

Для начала они должны существовать.

Тот факт, что существуют суды разных инстанций, и высшие могут отменить решнния низших, это доказывает.

Этот факт доказывает в первую очередь то, что судья может накосячить по глупости или намеренно, а не то, что законы недостаточно тщательно составлены.

суды в общем-то можно было бы и упразднить

Ждем нейросеть, ну.

thesis ★★★★★
()
Ответ на: комментарий от Zhbert

Ну вон книга про Таню Гроттер вполне себе существует. Аж серия целая. И да, там именно переименовали героя и даже в принципе оставили сюжет как было.

Книг про Гроттер Википедия насчитывает 14 штук, что несколько больше чем 7 книг основного цикла о Поттере. Кроме того:

Хотя сам Дмитрий Емец утверждал, что изначально писал «Таню Гроттер» как пародию на серию романов «Гарри Поттер» Джоан Роулинг, менеджеры последней подали на него в голландский (так как первое иноязычное издание вышло в Нидерландах) суд по обвинению в плагиате. Процесс завершился победой Роулинг, в результате чего за пределами РФ была издана только первая книга цикла.

Camel ★★★★★
() автор топика
Ответ на: комментарий от Camel

Да, конечно. Графоманства в стиле Акунина всегда было и будет как грязи.

seiken ★★★★★
()
Ответ на: комментарий от Camel

Процесс завершился победой Роулинг, в результате чего за пределами РФ была издана только первая книга цикла.

Что тоже показательно.
У нас тем не менее это вполне себе продают причем вроде до сих пор, а значит и решение суда можно просто проигноровать, если считаешь, что он тебя не достанет.
Что нивелирует весь выше тред → оно как бы вроде бы и хреново, но в целом пофиг, если ты считаешь, что тебя не набутылят.

Zhbert ★★★★★
()
Ответ на: комментарий от Zhbert

У нас тем не менее это вполне себе продают причем вроде до сих пор, а значит и решение суда можно просто проигноровать, если считаешь, что он тебя не достанет.

У нас президент одобряет цап-царап. Могло ли быть иначе?

Camel ★★★★★
() автор топика
Ответ на: комментарий от no-such-file

Он и не является производным продуктом

Это субъективное мнение.

Также как код который пишу я не является производным от кода из учебника который я прочитал

В этои и корень разногласий. Мы, противники нейросетей, считаем, что это несравнимая ситуация, что «обучение» нейросетей ближе к копированию, чем к человеческому обучению. Вы, сторонники, предполагаете противоположное, и суды встали на вашу сторону, а мы возражаем.

pelmeshechka ★☆
()
Последнее исправление: pelmeshechka (всего исправлений: 1)
Ответ на: комментарий от Camel

То есть если я попрошу нейронку «перепиши мне детектив про Эраста Фандорина, но поменяй имена и место действия», в выхлопе не будет совпадающих строчек. Могу ли в этом случае говорить, что это новое произведение?

Насколько я понимаю, по существующему законодательству — да.

Тут техническая проблема будет — LLM на целый роман не хватает, если хочешь писать книжку с помощью LLM, надо сперва заставить её написать список глав (возможно с очень кратким пересказом основных вех сюжета), а потом писать по одной главе отдельно, или типа того, иначе она «забывает», что там где было. Но это можно опустить и предположить, что гипотетически в ближайшем будущем у тебя будет терабайт памяти и LLM, которая нормально обрабатывает 100500 токенов за раз.

CrX ★★★★★
()
Ответ на: комментарий от Camel

У нас президент одобряет цап-царап. Могло ли быть иначе?

Давай вот без танцпола (хотя я и согласен). А то тред скатится и придётся звать модераторов его чистить :)

Zhbert ★★★★★
()
Ответ на: комментарий от Camel

суд по обвинению в плагиате

Ну вот видишь, всё уже давно придумано. Есть там ИИ, нету – суд решит имеешь ли ты права автора или тупо скопипастил. В данном случае он решил так, а если бы работа была пооригинальнее, то мог решить и по-другому.

no-such-file ★★★★★
()

Ну и отдельно: человекам дали абсолютную манифестацию свободы, то есть буквально каждый вася может брать буквально любой код и пихать его буквально куда он захочет.

Опять недовольны. Весь код мира стал опенсорцным == опенсорцу конец, все пропало.

thesis ★★★★★
()
Ответ на: комментарий от pelmeshechka

«обучение» нейросетей ближе к копированию

Ну нет ведь.
Тут не важно уже чего ты сторонник, тут матчасть вступает в игру.

Zhbert ★★★★★
()
Ответ на: комментарий от James_Holden

Ну какой хозяин llm, я просто перепишу локально запущенной опенсорсной llm, и что

Ну вот, ты написал убийцу Qt и выложил на гитхаб. Дальше что, какая бизнес модель? Ни один вменяемый разраб не перейдёт на внезапно откуда появившегося анонимного поставщика с гитхаба. Даже идеи такой «давайте протестируем наш код вот с этим XYZ» у разрабов не возникнет, потому что у них других задач дофига.

seiken ★★★★★
()
Последнее исправление: seiken (всего исправлений: 2)
Ответ на: комментарий от CrX

У GPT 5.4 окно контекста - 1 млн. токенов. Будущее наступило вчера, буквально. С чем и поздравляю.

James_Holden ★★★★★
()
Ответ на: комментарий от pelmeshechka

Это субъективное мнение

Это объективное мнение суда, полученное в результате соревнования сторон. Каких-то более объективных процедур пока не придумали.

Мы, противники нейросетей

У вас там целая секта?

что «обучение» нейросетей ближе к копированию

Вы не разбираетесь в вопросе от слова совсем.

суды встали на вашу сторону, а мы возражаем

Ой дяденька, а может вы и пол считаете субъективым конструктом? Чёт так постмодернистским релятивизмом запахло.

no-such-file ★★★★★
()
Ответ на: комментарий от pelmeshechka

«обучение» нейросетей ближе к копированию

Да в каком месте?

Тут неважно, сторонники, противники — по факту нифига оно не ближе к копированию, вот вообще никак. Эта сова на этот глобус не налезает.

Я, если что, сам далеко не сторонник нейросетей. Не сказать, что прям ярый противник, но нейрослоп уже задолбал, и опасения по поводу качества контента у меня серьёзные. Но не надо совсем уж глупостей-то говорить, это дискредитирует мнение противников нейросетей, а не помогает в споре.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от CrX

Сама по себе постановка вопроса абсурдна. Любое обучение человека, предполагает развитие способности к копированию, по крайней мере на начальных этапах. А часто и на конечных.

James_Holden ★★★★★
()
Ответ на: комментарий от James_Holden

есть же море комерческого кода, который не достать

Нуу, там уйма кода, который настолько специфичен, что никому и не упал. Далее, ведь коммерческие конторы активно юзают или начинают юзать публичные сетки, в т.ч. и для разработки закрытых проектов. Ведь получается, что они таким образом дообучают сети на своем закрытом коде, правильно? А потом приходим мы и говорим: слыш, Клод или как там тебя. И вуаля.

thesis ★★★★★
()
Последнее исправление: thesis (всего исправлений: 2)
Ответ на: комментарий от thesis

Ведь получается, что они таким образом дообучают сети на своем закрытом коде, правильно?

Очень спорно. Скорее всего, на таких аккаунтах, прописано что обучение запрещено, только инференс. На 146%.

James_Holden ★★★★★
()
Ответ на: комментарий от thesis

Херню не неси.

Я не несу

Чем куски жопаели в датасете нейросети отличаются от кусков жопаели в твоем мозгу

С тобой всё в порядке? Попробуй подумать. Сам факт того что ты задаёшь этот вопрос, говорит о том что ты понятия не имеешь о предмете обсуждения. Поверхностный примитивизм в понимании предмета обсуждения через похожие вещи оставим детям, изучи как всё работает, хоть базово, а потом адекватные вопросы задавай, а не вот это вот.

Со ссылками на нормативные акты, плиз.

Какие акты? Ты взял либу в проект/скопировал код, ты обязан, без всяких актов, выполнить условия распространения. Точка.
Тут всё аналогично. Взял 10 проектов под MIT. 10 проектов под BSD натренил сеть, сгенерировал программу она идёт под двумя лицензиями BSD и MIT со всеми копирайтами авторов. Всё. Нет никаких проблем, ни юридических, ни технических.

LINUX-ORG-RU ★★★★★
()
Ответ на: комментарий от LINUX-ORG-RU

С тобой всё в порядке? Попробуй подумать.

<дальнейшая срань поскипана>

Вася, говори кратко и по делу.

thesis ★★★★★
()
Ответ на: комментарий от thesis

Ведь получается, что они таким образом дообучают сети на своем закрытом коде, правильно?

Я всегда думал, что там нет инкрементального обучения. Т.е. они накапливают критическую массу новых датасетов, что-то выкидывают вручную по каким-то ad-hoc критериям, а потом проводят тренировку на новом (но целом) датасете.

seiken ★★★★★
()
Ответ на: комментарий от seiken

По сути, чтобы качественно инкрементально дообучать, надо новые данные прогонять вместе со всем старым датасетом. Иначе возникает «катастрофическое забывание». А сколько это бы стоило, сложно даже представить.

James_Holden ★★★★★
()
Ответ на: комментарий от James_Holden

Любое обучение человека, предполагает развитие способности к копированию

Вообще-то строго наоборот. Копирование (отзеркаливание) развито у человека изначально, как и у животных. Обезьянка видит – обезьянка делает. Обучение заключается в многократном повторении (использовании встроенной способности) с целью возникновения инсайта, т.е. знания.

no-such-file ★★★★★
()
Последнее исправление: no-such-file (всего исправлений: 2)
Ответ на: комментарий от thesis

Чё я злой такой :( Мне это не нравится… За тон извиняюсь, но за смысл нет. Я всё что хотел сказал :)

Вася, говори кратко и по делу.

Ок, невронка программа и к мозгам имеет отношение такое же, как крыло бабочки к крылу боинга.

LINUX-ORG-RU ★★★★★
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)