LINUX.ORG.RU
ФорумTalks

Люди, уничтожающие книги для обучения ИИ, достойны отдельного котла в аду

 , ,


1

2

Как ИИ-стартап задумал отсканировать и утилизировать миллионы книг.

Судебные материалы раскрывают, как компании наперегонки добывали всё больше книг, чтобы скормить чат-ботам: в числе прочего, покупали, сканировали и уничтожали миллионы экземпляров

В начале 2024 года руководители Anthropic, стартапа по разработке искусственного интеллекта, взялись за амбициозный проект, одновременно пытаясь держать его в тайне. «Project Panama — это наша попытка провести деструктивное сканирование всех книг мира», — говорилось во внутреннем плане, рассекреченном в судебных материалах на прошлой неделе. «Мы не хотим, чтобы факт нашей деятельности стал известен».

Как следует из документов, примерно через год на эту цель был освоен бюджет в десятки миллионов долларов. Эти деньги потратили, чтобы приобрести книги и сре́зать корешки, а затем отсканировать страницы и вкачать больше знаний в ИИ-модели, лежащие в основе продуктов по типу популярного чат-бота Claude.

Дело против Anthropic — это часть волны исков, которые против компаний ИИ подавали авторы, художники, фотографы и новостные издания. Как показывают судебные материалы, техногиганты лихорадочно и порой втайне участвуют в гонке, чтобы получить интеллектуальное наследие человечества.

В одном из недавно обнародованных документов Anthropic сообщила, что сооснователь компании Бен Манн в июне 2021 года в течение 11 дней лично скачивал художественную литературу и нон-фикшн с LibGen, теневой библиотеки с книгами и другим нарушающим авторские права контентом. К делу приложен скриншот его браузера, где он скачивает файлы с помощью программ для файлообмена.

В июле 2022 года Манн восторженно отзывался о запуске нового сайта Pirate Library Mirror. Сайт заявлял о наличии огромной базы книг и указывал: «Мы сознательно нарушаем авторское право в большинстве стран». Манн разослал коллегам-антропиковцам ссылку на сайт с припиской: «как нельзя кстати!!!»

Купить, разрезать, отсканировать и на переработку

Когда проект по покупке и сканированию физических книг Project Panama только начинался, Anthropic обратилась к ветерану Кремниевой долины. Компания наняла Тома Тёрви, руководителя в Google, который двумя десятилетиями ранее помогал создать знаменитый, но юридически спорный проект Google Books.

Как следует из материала дела, поначалу Anthropic рассматривала возможность покупать книги у библиотек или в магазинах подержанных книг. К примеру, книги хотели закупать в Strand, известном нью-йоркском магазине, который часто щеголяет слоганом про 18 миль полок новых и бывших в употреблении книг3. Согласно документу, описывающему встречу Anthropic по приобретению контента в марте 2024 года, магазин был «заинтересован в предоставлении подержанных книг».

Сотрудники Anthropic также обсуждали вариант либо обратиться к библиотекам США, в том числе к Нью-Йоркской публичной библиотеке4, либо, как говорится в документах, «новой библиотеке, хронически недофинансируемой».

Неясно, какие из этих предложений Anthropic реализовала, если вообще хоть какие-нибудь. На запрос по электронной почте представитель Strand сообщил, что в итоге никаких книг магазин компании Anthropic не продал. Нью-Йоркская публичная библиотека на запрос о комментарии не ответила.

В итоге Anthropic приобрела миллионы книг, нередко партиями по десятки тысяч, говорится в материалах дела. Ключевую роль в этом играли книжные сети, включая ретейлера подержанных книг Better World Books и британскую компанию World of Books.

Из судебных документов удалены полное число отсканированных книг и их стоимость. Тем не менее в проектном предложении одного подрядчика, который в конечном счёте работал с Anthropic, отмечалось: ИИ-компания «ищет опытного поставщика услуг сканирования документов, чтобы сконвертировать от 500 тыс. до 2 миллионов книг за шестимесячный период».

Better World Books и World of Books в понедельник не ответили на запросы о комментарии.

В документе описывается, что будет делать компания по сканированию. «Гидравлическая режущая машина» будет «аккуратно разрезать» книги; затем страницы «будут сканироваться на высокоскоростных, высококачественных сканерах промышленного уровня». И, наконец, говорится в документе, подрядчик «согласует вывоз отработанных книг с компанией по переработке отходов».

Источник



Последнее исправление: Sm0ke85 (всего исправлений: 4)
Ответ на: комментарий от firkax

Позиция понятна, спор ради спора. Удачи!

VIT ★★
()
Ответ на: комментарий от mister_me

2)Можно с таким же успехом на экране играть в шахматы.

На экране - это просто в шахматы поиграть, а на доске - это дополнительный комфорт, тут сам процесс приятнее, на мой вкус по крайней мере (я опять же про тактилку и т.п.)

Попрошу не чавкать и пр., потому что отвлекает.

Я пропущу всю цепочку пожалуй и сразу констатирую, что в предложенных условиях у вас с ней конфликт и определить границу между нуждой и прихотью ты не сможешь (соль была в «границе»)

Ещё раз - культурные представители «текущего поколения» ничего не сделали, а их записали в «неоварвары».

Я где-то писал уже, что условно согласился с автором из-за отсутствия необходимых стоп-линий у поколения, ввиду необходимости иметь емкое «понятие» (простыми словами, подобные инциденты будут продолжаться, пока не появится прецедент, который ограничит возможность такого)

Тут дело в фундаменте: не научил, что матом ругаться не культурно - на нем будут в итоге говорить…

Sm0ke85
() автор топика
Ответ на: комментарий от lenin386

Кто тебе мешает скачать записи Сектор газа?

То что концерты уже не послушать - это не твоя беда, а создателей контента. Это они денег не получают. Это их кормушка была.

LightDiver ★★★★★
()
Ответ на: комментарий от firkax

Я даже больше скажу - как только это не нравится маленькой группе населения, у которой власть - это сразу твои проблемы.

Вот только издать законы ~= их исполнить. Ты можешь заставить большую часть населения творить дичь, но только пока сможешь проследить за исполнением. Потому что иначе тебя просто пошлют и тут уже страдает твой авторитет - ты запретил, а всем насрать.

Проследи развитие цивилизации - всегда сталкиваются два противоположных вектора: 1) Обмен данными и развитие 2) Попытка затормозить развитие и монополизировать очевидное.

И рано или поздно развитие победает. Точно так же авторское право и патенты будут рано или поздно средневековой дичью, о которой будут вспоминать с ужасом, как о крепостном праве.

Все это лишь следствие недостатка товаров. Все. Пока производиться будет меньше, чем нужно всего всем - будет попытка монополизировать товары. Даже в ущерб развитию.

LightDiver ★★★★★
()
Ответ на: комментарий от AZJIO

А вот это еще одна дичь - продажа алгоритмов. Точнее попытка запретить другим людям пользоваться алгоритмами.

Книга - такой же очевидный алгоритм, как любой. Просто последовательность слов. Это всеравно что запретить жарить яичницу на сковороде, потому что кто то это сделал первым.

Ну не получится у тебя запретить то, что могут все. Можешь попытаться, но так как это могут все - распространение будет всегда. Запретить можно только что то уникальное, чего больше никто не может, кроме тебя.

LightDiver ★★★★★
()
Ответ на: комментарий от Sm0ke85

Несмотря на то, что я поддерживаю твою позицию конкретно по сравнению нормальных книг с электронными, примеры считаю неудачными и подозреваю что выберу в них противоположеные от подразумеваемых тобой варианты.

firkax ★★★★★
()
Ответ на: комментарий от LightDiver

Книга - такой же очевидный алгоритм

Сравнение с алгоритмом? Так к алгоритму это применяется в большей степени.

Это всеравно что запретить жарить яичницу на сковороде

Так тебе никто не запрещает жарить свою яичницу. Можешь целый год писать свой алгоритм, кто тебе запрещает, а потом подарить чтобы люди пользовались, оно же у тебя не вещественное, просто виртуальные цифры. А можешь всю жизнь за еду программировать, никто не против. Но ты же хочешь, чтобы это делали другие для тебя, только в этом проблема.

AZJIO
()
Ответ на: комментарий от Sm0ke85

Дозволяю, покупай. Если законом не запрещено - ты вполне можешь это сделать. И более того, если запрещено, всегда есть варианты как обойти законы.

По твоей логике это работает иначе? Видимо мы живем в разных вселенных, с разными законами физики.

Не путай свои странноватые иногда моральные принципы с тем, что должны делать остальные. Это частенько даже вообще не пересекаемые множества. Одно - твои хотелки. Второе - реальность.

Даже крепостное право и рабство ушли не потому что кто то считал это аморальным. И не потому, что рабовладельцам хотелось всем отпустить. Просто это стало не выгодно. Ну не попрешь ты против прогресса, против развития цивилизации.

LightDiver ★★★★★
()
Ответ на: комментарий от AZJIO

Это пытаются применить к алгоритмам, да. Что тоже - дичь. Но более менее с этим справляется опенсорс как раз.

Ты ничего не перепутал? Это не я что то запрещаю авторам, а они пытаются запретить мне. Это не я хочу чужую яичницу. Это мне запрещают жарить ее на сковороде.

Не я лезу к авторам. Я с ними не знаком, никогда не контактировал. Ничег у них не покупал и не брал в аренду. А вот они могут попытаться запретить мне очевидные вещи. Просто потому что им так хочется. Это вполне односторонняя дичь.

Даже с тем же софтом - можно продавать разовые алгоритмы и монополизировать рынок, останавливая прогресс и мешая работать людям, а можно продавать онлайновые сервисы вместо алгоримов. Видишь разницу?

LightDiver ★★★★★
()
Ответ на: комментарий от AZJIO

Например, игры про маленьких зверюшек с боями. Это не дичь, не?

LightDiver ★★★★★
()

Поудаляйте 1, 2, 3, 4.

IIIypuk ★★★★★
()
Ответ на: комментарий от AZJIO

Запрещают создавать цитататы из книг, что очень меня бесит. Я купил продукт, использовал его по назначению. Результатом использования книги остались выдержки, которые я хочу сохранить на память для быстрой навигации.

По законодательству (1274 ГК РФ) цитирование не запрещено, однако на моих книгах написано, что запрещено!

IIIypuk ★★★★★
()
Ответ на: комментарий от FishHook

Сколько людей тебе нужно для добавочной стоимости? И, главное, сколько людей будет слишком много для твоей добавочной стоимости? Когда прирост «населения» будет слишком большим и резким?

Если вспомнить кризисы и крушения целых цивилизаций, то можно просчитать когда многие из них были связаны именно с прогрессом. Например, когда в Европе научились «выращивать» шёлк, в Китае были и голод (с десятками миллионов жертв) и смена «руководства». Потому что внезапно люди стали не нужны. За каждым «расцветом» шёл упадок. Всегда. Почему? Потому что спрос рождает потребление, он улучшает условия производящего, но потом производящих становится слишком много. А потом изменяются условия и спрос резко падает. Да, плохое планирование. И можно подумать это было давно. Хотя прямо сейчас в куче мест на Земле абсолютно нечего делать. Сомалийские пираты не на пустом месте образовались.

Можно рассусоливать теории о том, что рыночек порешает, но он без никакого ИИ и роботов прямо сейчас не справляется. Есть много мест где жить лучше и можно туда перебраться? Это не надолго. Раньше прирост людей был исключительно натуральным. Теперь же один только ИИ, ещё толком не пришедший, уже заменил кучу людей. Ты не замечаешь, я не замечаю, нас пока не касается. Но вентилятор ещё даже не раскрутился.

А красивых отчётов за жизнь насмотрелись уже.

Если бы ИИ разрабатывали ради блага людей, я бы слова не сказал. Но его разрабатывают для прибыли. Сверхприбыли. И благополучие людей их вообще не интересует. Всё как всегда повторяют мантру «рыночек порешает». Вот представь себе, что завтра ты просыпаешься, а на Земле не 8 милиардов, а 16, 24 милиарда? Переваришь, рыночек? :)

PcheloBiaka
()
Ответ на: комментарий от IIIypuk

Там может быть написано, что автор - пришелец с планеты Завулон. Никакие внутренние правила частных шаражек не могут быть выше законов страны. Это сугубо их личные интимные предпочтения - не более.

LightDiver ★★★★★
()
Ответ на: комментарий от PcheloBiaka

А чего ему не переварить то? Или у тебя потребителей стало больше, а производителей нет?

Ну конечно это возможно, если искусственно запрещать производство и как раз пытаются, ограничивая ископаемое топливо, все эти мнимые углеродные следы и прочая экология. В том числе попытки сокращения населения.

Вопрос не в том что может переварить рыночек - сейчас можно произвести больше, чем вообще нужно всем человекам (только в базовом). Вопрос - когда нажрутся те, кто на этом зарабатывает. Ответ - никогда. Как это решать - это риторический вопрос.

LightDiver ★★★★★
()
Ответ на: комментарий от Sm0ke85

Книга стоя на полке таки дождется момента, когда ее прочитают, попутно собрав исторические следы, короче, у нее есть Судьба, а шрёдер - это конец Судьбы…

Это, извини, конечно, но у тебя после этих слов менструация не началась?

IPR ★★★★★
()
Ответ на: комментарий от Zhbert

Вон, например, тонны «санкционных» продуктов тоже просто раскатывают трактором, хотя есть «голодающие», которым можно было бы это всё отдать в виде гуманитарки.

А кто ответственность будет нести за последствия после употребления этих продуктов голодающими?

IPR ★★★★★
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)