LINUX.ORG.RU
ФорумTalks

Вышло первое решение суда об использовании книг для обучения нейронок.

 


0

0

Суд северного округа Калифорнии постановил, что использование текстов для обучения нейросетей не является нарушением смежных авторских прав (copyright) и попадает под легальное использование (fair use). Но сделал интересную оговорку:

Users interacted only with the Claude service, which placed additional software between the user and the underlying LLM to ensure that no infringing output ever reached the users. This was akin to the limits Google imposed on how many snippets of text from any one book could be seen by any one user through its Google Books service, preventing its search tool from devolving into a reading tool. (Так же суд сослался на создание превьюшек гуглом как допустимое использование.)

Иными словами, необходимо гарантировать, чтобы выхлоп нейронки не являлся копипастой оригинальных работ.

Детали: ANTHROPIC PBC создала датасет Book3. На неё подали в суд.

★★★★★

Можно добавить рандомных слов в выдачу. Например, после каждой запятой добавить 6ля,

tiinn ★★★★★
()
Последнее исправление: tiinn (всего исправлений: 1)
Ответ на: комментарий от tiinn

Например, после каждой запятой добавить 6ля,

Такой хок контент нам не нужен.

seiken ★★★★★
()
Последнее исправление: seiken (всего исправлений: 1)

ANTHROPIC PBC создала датасет Book3. На неё подали в суд.

Суд вынес постановление, что для обучения можно использовать только легально купленные тексты!
Факт хранения фирмой Anthropic более 7 млн пиратских книг в датасете для обучения признан нарушением авторских прав. Суд назначил отдельный судебный процесс на декабрь 2025 г. для расчета компенсации (обычно $750–$30000 за каждую копию).

sigurd ★★★★★
()
Последнее исправление: sigurd (всего исправлений: 1)
Ответ на: комментарий от MoldAndLimeHoney

Созданный дегенеративными сетями контент до этого момента имел мутный легальный статус, так как по факту состоит из сильно перемешанной копипасты.

Теперь как минимум в одной юрисдикции этот винегрет признан законным.

LamerOk ★★★★★
() автор топика
Ответ на: комментарий от LamerOk

Теперь как минимум в одной юрисдикции этот винегрет признан законным.

Далеко не всякий. Не просто признали, а придумали критерии, что считать законным.

question4 ★★★★★
()
Ответ на: комментарий от MirandaUser2

Google не платит правообладателям за материалы для Google Books?

Большая часть материалов, отсканированных для Google Books, никому не доступна из-за затыка с определением юридического статуса. У доступных книг обычно копирайт истёк или они свободны по другим причинам. Для некоторых книг текст недоступен, либо только превью, но есть ссылки на магазины и Google Play. Думаю, так и платит.

question4 ★★★★★
()

Иными словами, необходимо гарантировать, чтобы выхлоп нейронки не являлся копипастой оригинальных работ.

do_sample=True, temperature=0.7, top_p=0.9 :)

Obezyan
()

Иными словами, необходимо гарантировать, чтобы выхлоп нейронки не являлся копипастой оригинальных работ.

А ведь ничем другим выхлоп нейронки быть не может в принципе. :)

Stanson ★★★★★
()
Ответ на: комментарий от sigurd

обычно $750–$30000 за каждую копию

Будет интересно глянуть на такие санкции

mamina_radost
()

А вот интересно, если нейронка определит, что книга является результатом пересказа открытой информации (документации), можно ли будет подавать в суд на правообладателей за необоснованное обогащение? Ну или если я купил книгу, скормил её нейронке, то она может использовать это как факт законного цитирования?

bdrbt
()
Ответ на: комментарий от bdrbt

книга является результатом пересказа открытой информации

Так это про любую книгу сказать можно. Вы же не ожидали найти выжимки из архивов ЦРУ и секретной библиотеки Ватикана в книжном магазине.

ugoday ★★★★★
()
Ответ на: комментарий от tiinn

А вместо слова «бл...» вставлять «ля-ля-ля, сапоги».

sparkie ★★★★★
()
Ответ на: комментарий от LamerOk

Просто законы как всегда отстают от практики. Через пару лет придумают закон как это всё регулировать, а пока все пытаются застолбить себе будущее доминирование любыми методами. Победитель в итоге откупится малой кровью.

snizovtsev ★★★★★
()
Последнее исправление: snizovtsev (всего исправлений: 1)
Ответ на: комментарий от tiinn

Например, после каждой запятой добавить 6ля,

А после этого, следующее поколение ИИ будет так материться…

AlexVR ★★★★★
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)