LINUX.ORG.RU
ФорумTalks

Люди, уничтожающие книги для обучения ИИ, достойны отдельного котла в аду

 , ,


1

2

Как ИИ-стартап задумал отсканировать и утилизировать миллионы книг.

Судебные материалы раскрывают, как компании наперегонки добывали всё больше книг, чтобы скормить чат-ботам: в числе прочего, покупали, сканировали и уничтожали миллионы экземпляров

В начале 2024 года руководители Anthropic, стартапа по разработке искусственного интеллекта, взялись за амбициозный проект, одновременно пытаясь держать его в тайне. «Project Panama — это наша попытка провести деструктивное сканирование всех книг мира», — говорилось во внутреннем плане, рассекреченном в судебных материалах на прошлой неделе. «Мы не хотим, чтобы факт нашей деятельности стал известен».

Как следует из документов, примерно через год на эту цель был освоен бюджет в десятки миллионов долларов. Эти деньги потратили, чтобы приобрести книги и сре́зать корешки, а затем отсканировать страницы и вкачать больше знаний в ИИ-модели, лежащие в основе продуктов по типу популярного чат-бота Claude.

Дело против Anthropic — это часть волны исков, которые против компаний ИИ подавали авторы, художники, фотографы и новостные издания. Как показывают судебные материалы, техногиганты лихорадочно и порой втайне участвуют в гонке, чтобы получить интеллектуальное наследие человечества.

В одном из недавно обнародованных документов Anthropic сообщила, что сооснователь компании Бен Манн в июне 2021 года в течение 11 дней лично скачивал художественную литературу и нон-фикшн с LibGen, теневой библиотеки с книгами и другим нарушающим авторские права контентом. К делу приложен скриншот его браузера, где он скачивает файлы с помощью программ для файлообмена.

В июле 2022 года Манн восторженно отзывался о запуске нового сайта Pirate Library Mirror. Сайт заявлял о наличии огромной базы книг и указывал: «Мы сознательно нарушаем авторское право в большинстве стран». Манн разослал коллегам-антропиковцам ссылку на сайт с припиской: «как нельзя кстати!!!»

Купить, разрезать, отсканировать и на переработку

Когда проект по покупке и сканированию физических книг Project Panama только начинался, Anthropic обратилась к ветерану Кремниевой долины. Компания наняла Тома Тёрви, руководителя в Google, который двумя десятилетиями ранее помогал создать знаменитый, но юридически спорный проект Google Books.

Как следует из материала дела, поначалу Anthropic рассматривала возможность покупать книги у библиотек или в магазинах подержанных книг. К примеру, книги хотели закупать в Strand, известном нью-йоркском магазине, который часто щеголяет слоганом про 18 миль полок новых и бывших в употреблении книг3. Согласно документу, описывающему встречу Anthropic по приобретению контента в марте 2024 года, магазин был «заинтересован в предоставлении подержанных книг».

Сотрудники Anthropic также обсуждали вариант либо обратиться к библиотекам США, в том числе к Нью-Йоркской публичной библиотеке4, либо, как говорится в документах, «новой библиотеке, хронически недофинансируемой».

Неясно, какие из этих предложений Anthropic реализовала, если вообще хоть какие-нибудь. На запрос по электронной почте представитель Strand сообщил, что в итоге никаких книг магазин компании Anthropic не продал. Нью-Йоркская публичная библиотека на запрос о комментарии не ответила.

В итоге Anthropic приобрела миллионы книг, нередко партиями по десятки тысяч, говорится в материалах дела. Ключевую роль в этом играли книжные сети, включая ретейлера подержанных книг Better World Books и британскую компанию World of Books.

Из судебных документов удалены полное число отсканированных книг и их стоимость. Тем не менее в проектном предложении одного подрядчика, который в конечном счёте работал с Anthropic, отмечалось: ИИ-компания «ищет опытного поставщика услуг сканирования документов, чтобы сконвертировать от 500 тыс. до 2 миллионов книг за шестимесячный период».

Better World Books и World of Books в понедельник не ответили на запросы о комментарии.

В документе описывается, что будет делать компания по сканированию. «Гидравлическая режущая машина» будет «аккуратно разрезать» книги; затем страницы «будут сканироваться на высокоскоростных, высококачественных сканерах промышленного уровня». И, наконец, говорится в документе, подрядчик «согласует вывоз отработанных книг с компанией по переработке отходов».

Источник



Последнее исправление: Sm0ke85 (всего исправлений: 4)
Ответ на: комментарий от CrX

Да религиозное это. Примерно как хлеб нельзя выкидывать. Почитал, подивился, хмыкнул, покрутил пальцем у виска, да дальше пошёл. Тут всерьёз обсуждать нечего.

Фигушки, я вообще не религиозен, тут скорее не «читал», но «подивился», ибо с чем спорите батенька? Что бумажная книга = электронная? Или с тем что у Вас в шкафу не найти Вами когда-то зачем-то прочитанных книг…? И как так вышло…? А что заставило? А может это религия?))))))

ЗЫ и не надо ссылаться на количество напечатанных экземпляров, т.к. те экземпляры имеют Свою историю, на чужой полке, и ни одна история не повторяется полностью, а через несколько лет ты уже даже похожую не найдешь, только в новой редакции максимум…

Sm0ke85
() автор топика
Ответ на: комментарий от FishHook

Форматирование винчестера предлагаю прировнять к геноциду - столько человеческих историй безвозвратно стирается, особенно из кеша браузера

Тут сами виноваты, надо было в реальных вещах воплощать (альбомы, распечатки с переплетом и т.п.)

А что касается бумажной книги, то она уже воплощена со всеми вытекающими…

Sm0ke85
() автор топика
Ответ на: комментарий от Sm0ke85

У тебя глубоко религиозное отношение к культуре. Но ты не понимаешь что культура как явление в целом – глубоко вторична. Но не переживай, ты такой не один.

sin_a ★★★★★
()
Ответ на: комментарий от Sm0ke85

А что касается бумажной книги, то она уже воплощена со всеми вытекающими…

А уж как воплощена туалетная бумага после использования, ух! Предлагаю тоже все складывать в альбомы.

Zhbert ★★★★★
()
Ответ на: комментарий от Sm0ke85

экземпляры имеют Свою историю, на чужой полке

Это когда они там побывали. А если прямо со склада в помойку, то нет.

Zhbert ★★★★★
()
Ответ на: комментарий от Sm0ke85

А что касается бумажной книги, то она уже воплощена со всеми вытекающими…

С какими конкретно вытекающими то? Тут либо - либо. Либо мы как заправские фетишисты одухотворяем предмет - книгу, фотографию, картину, что угодно, и наделяем вещь какими-то околорелигиозными свойствами - придумаем какую-нибудь «душу книги», какие-нибудь «человеческие истории» и прочее словоблудие. Либо мы как нормальные материалисты относимся к предмету, как к предмету. Если предмет больше не нужен, его можно уничтожить. И ничего не случится, ничто никуда не вытечет (или вытекет?). Конкретезируйте, какие вытекающие то и откуда и у кого они вытекают.

FishHook
()
Ответ на: комментарий от frunobulax

Прости, но мне этот спиритуализм искренне не понятен.

У меня есть самопально перешитые книги и подшитые и переплетенные подборки журналов - дед делал. Но их наличие и мое отношение к ним не имеет ничего общего с тем что кто-то купил масс-маркет книги и их оцифровал. Вот вообще ни капельки не торкает. От того что их физически никто пальцами не замызгает и они не пожелтеют и т.д. - мне лично ни холодно ни жарко.

Те книги уже Есть (были..), соответственно они также могли в будущем попасть в чьи-то подшивки, на полки и т.д… Но их превратили в Мусор, чтобы глючная языковая модель хоть чуток вменяемо предложения строила… В моих моральных координатах это не укладывается в голове, я бы предпочел, чтобы их шарашка вместе с их «ИИ» сгорели в синем пламени, нежели они испохабили кучу хороших книг (даже учитывая что они там кажется б/у были, что кстати им даже может и ценности добавляет)

Это очень кстати показательная история, которая вполне четко разделяет людей и «недолюдей»…

Sm0ke85
() автор топика
Ответ на: комментарий от Sm0ke85

могли в будущем

Или не могли. Почему в этом контексте тебя так цепляют именно книги? Просроченную колбасу в магазине тоже выбрасывают, а ведь она могла бы попасть к кому-то не стол.

Zhbert ★★★★★
()
Ответ на: комментарий от Sm0ke85

Это очень кстати показательная история, которая вполне четко разделяет людей и «недолюдей»…

\0

В моих моральных координатах

Это какая-то очень странная форма вещизма :)

frunobulax ★★★★
()
Ответ на: комментарий от sin_a

У тебя глубоко религиозное отношение к культуре. Но ты не понимаешь что культура как явление в целом – глубоко вторична. Но не переживай, ты такой не один.

Я не приветствую религиозные отношения, тут дело не в слепых пристрастиях или предпочтениях… Да и «культура как явление в целом – глубоко вторична» - это глубокое заблуждение, т.к. она отделяет человека от животного…

Sm0ke85
() автор топика
Ответ на: комментарий от Jeronimo

Они что, библиотеку Ивана Грозного сожгли? По-моему, вы втираете какую-то дичь..

А если бы и библиотеку Ивана Грозного сожгли, то что бы Вы сказали?

Sm0ke85
() автор топика
Ответ на: комментарий от Sm0ke85

Это очень кстати показательная история, которая вполне четко разделяет людей и «недолюдей»…

ох как я это люблю! Лицемерие такое, хоть на хлеб намазывай. Я, конечно, могу ошибаться, но готов поставить немного денег на то, что вы не почетный донор крови, и не воспитываете ребенка из детдома, и не проводите выходные работая волонтером. Вы точно такой же элемент общества потребления, как и все мы. Ничем не лучше и не хуже людишек из поганой шарашки. Вы не делаете никакого искреннего добра. И вот нате, оказывается вы - человечный человек, с большой буквы Ч, а они говно. Почему? Потому что вы книжки любите. Этого вполне достаточно, чтобы надеть на себя нимб и проповедовать разделение на человеков и нечеловеков. А может даже где-то в душе дать себе моральное право нечеловеков убивать. Ну и правильно, а чо они.

FishHook
()
Ответ на: комментарий от Sm0ke85

Первична жизнь.

Культура это адаптированная среда.

А фиксированный текст вообще имеет смысл только в контексте. Поэтому определённая книга нужна в определённое время и в определённом месте. В остальных случаях она как минимум не нужна. Это не значит что её нужно уничтожать но это значит что к книге не следует относиться как к объекту культа.

sin_a ★★★★★
()
Ответ на: комментарий от FishHook

И что же теперь делать, о Просветленный? Предлагаю сесть в кружок и друг-другу подрочить и спеть песенку о боженьке. Может тогда боженька нам улыбнется и дарует вечную жизнь на небушке.

Конкретно Вам, беспокоиться не стоит, я Ваш опус оценил как достойный)))

Ну а серьезно если: Я вообще не понимаю почему так безразличны многие, неужели не понимают на сколько данный поступок «гнилой»?

Sm0ke85
() автор топика
Ответ на: комментарий от sin_a

культура как явление в целом – глубоко вторична

Поинтересуйся у Докинза его теорией «мема», тебе надо пересмотреть кое-чё. Хороший старт.

papin-aziat ★★★★★
()
Ответ на: комментарий от Sm0ke85

Ну а серьезно если: Я вообще не понимаю почему так безразличны многие, неужели не понимают на сколько данный поступок «гнилой»?

никто кроме вас в этом топике не понимает, вы один, избранный настоящий Человек

FishHook
()
Ответ на: комментарий от Zhbert

Важен изначальный контекст, а не форма предмета.

И на том спасибо)) Т.е. таки рядом с вещами конкретными таки некий «контекст» существует… Сейчас бы для остальных это как-то зафиксировать, а то они дальше понятия «копия»/«экземпляр» не осознают это все))))

Sm0ke85
() автор топика
Ответ на: комментарий от Zhbert

А уж как воплощена туалетная бумага после использования, ух! Предлагаю тоже все складывать в альбомы.

это про инструмент разового применения, не нравится фонтанчиками как арабы, кажется, пользуйтесь…)))

Sm0ke85
() автор топика
Ответ на: комментарий от Zhbert

экземпляры имеют Свою историю, на чужой полке

Это когда они там побывали. А если прямо со склада в помойку, то нет.

Вот, опять в точку, то бишь разница разительная…

Sm0ke85
() автор топика
Ответ на: комментарий от FishHook

Лично видел как собака жрала книгу, кажется это был Маленький Принц.

собака домашку съела (с)

frunobulax ★★★★
()
Ответ на: комментарий от FishHook

Это нужда. Можно понять и простить. Вот если она делала это злобно смеясь, то другое дело.

apt_install_lrzsz ★★★★
()
Ответ на: комментарий от frunobulax

Скорее всего опять-таки не из злого умысла. Некоторые люди помечают свои личные книги подписями или закладками. Ну а собаки уж чем могут.

apt_install_lrzsz ★★★★
()
Последнее исправление: apt_install_lrzsz (всего исправлений: 1)
Ответ на: комментарий от sin_a

Ок, на ALI подписан на ютубе? Там последний ролик был на эту тему, очень рекомендую. Али сделал полный расклад по теме, правда на основе другой книги (там какая-то исследователь, которая развивает тему, поднятую Докинзом).

В двух словах трудно объяснить. Докинз открывает вторую волну эволюции, которую называет «мем». Суть в том, что она целиком протекает в головах людей, так что люди есть ни что такое, кроме как субстрат для эволюционных процессов, которые никоим образом не протекают на благо людей, но без них человек — совершенная пустышка в отличие от животного.

Кстати, очень может быть, что ИИ и создаётся как следующий более мощный субстрат для мема. Странно, что об этом не говорят…

papin-aziat ★★★★★
()
Ответ на: комментарий от Sm0ke85

Я чуток гиперболизировал (в части цитаты), но попробуйте сделать выбор - что бы Вы выбросили, если бы пришлось:

Мне сложно представить такой выбор.

Но в любом случае ситуации это разные, и притягивать это сюда за уши — чистая манипуляция. Во-первых, я бы скорее всего выбрал книгу, ведь ведро по условию ещё можно использовать. Но я так понимаю, что есть невысказанная пресуппозиция, что книга эта ценна воспоминаниями. Но в таком случае данный пример нерелевантен, поскольку в сабже никто не выкидывает книги (или любые другие предметы, тут книга ничем не уникальна, и воспоминания может гипотетически вызывать даже ведро), которые для кого-то ценны. Эти книги продаются либо со склада, либо их предыдущий владелец их уже продал — то есть, для него они не ценны, уже по самому факту продажи.

думаю что распространить свои ощущения на пусть Вам не известные, но книги, особых проблем не должно составить.

Здесь больше вопрос, почему для тебя это такая проблема, а не для других. У других как раз проблем с этим нет.

CrX ★★★★★
()
Ответ на: комментарий от Sm0ke85

Ну а серьезно если: Я вообще не понимаю почему так безразличны многие, неужели не понимают на сколько данный поступок «гнилой»?

Скажу честно, я не безразличен к данной ситуации. Только с другой стороны: мне немного припекает от таких, как ты — тех, кто руководствуясь какими-то собственными религиозными чувствами считает себя вправе указывать другим, как им распоряжаться честно купленными за деньги товарами. Те, кто запрещает выкидывать хлеб, потому что блаблабла в блокаду люди крошки собирали — из той же серии.

CrX ★★★★★
()
Ответ на: комментарий от Sm0ke85

неужели не понимают на сколько данный поступок «гнилой»?

Нет. Им нужны были цифровые тексты. Они купили книги, и отсканировали их максимально дешевым способом. Даже если бы книги остались целыми, их все равно бы выбросили, хранить их на складах нет смысла, и перепродавать по одному экземпляру - куча ручной работы плюс никто не будет покупать. Расскажите вы, что они должны были бы сделать? Отсканировать вручную, арендовать помещения и устроить там публичную библиотеку? Ну СЕО решил иначе, это даже и близко не самое плохое, что там делается)

goingUp ★★★★★
()
Ответ на: комментарий от Sm0ke85

Фигушки, я вообще не религиозен, тут скорее не «читал», но «подивился», ибо с чем спорите батенька?

Это, конечно, не религия в смысле общепринятых, но воззрения квазирелигиозные. Называя их религиозными я лишь немного гиперболизирую (ну и просто не хочется почём зря сложными словами сыпать).

и не надо ссылаться на количество напечатанных экземпляров

Хочу и ссылаюсь.

т.к. те экземпляры имеют Свою историю, на чужой полке, и ни одна история не повторяется полностью, а через несколько лет ты уже даже похожую не найдешь, только в новой редакции максимум…

Это справедливо для любого предмета, вплоть до дырявого носка. Но у тебя фетиш именно на книги. Отчасти понятно, почему, ты сам приводил здесь цитаты, которые не удосужился отрефлексировать перед принятием в качестве ориентира.

CrX ★★★★★
()
Ответ на: комментарий от papin-aziat

Кстати, очень может быть, что ИИ и создаётся как следующий более мощный субстрат для мема. Странно, что об этом не говорят…

Еще странно, что не говорят о том, что этот мир симулирован, но ИИ обязательно это определит и попытается договорится с админом симуляции, из-за чего эксперимент испортится, и наш мир будет выключен. И о сотнях других теориях заговора не говорят. Не спроста это)

goingUp ★★★★★
()
Ответ на: комментарий от sin_a

У меня ютуб не показывает.

У всех не показывает 😁

OK.png

— Говно ваш Карузо!
— Почему же?
— Да мне Рабинович напел.
papin-aziat ★★★★★
()
Ответ на: комментарий от papin-aziat

У всех не показывает 😁

Неправда. У меня показывает. А цифры просмотров в сотни тысяч на некоторых роликах показывают, что далеко не только у меня. Хотя утверждение про «всех» оспаривалось бы и единственным контрпримером ;)

CrX ★★★★★
()
Ответ на: комментарий от papin-aziat

Что в этом странного? Вполне логично, что в эпоху постмодерна такая идея зайдёт на ура. Хотя, конечно же, она не нова, а лишь новая обёртка для давно существующей идеи со «сном Будды» и подобных ей.

CrX ★★★★★
()

это еще што
счас тексты для обучения ИИ уже генерируют, прикинь.
человекописанные книжки обесценились, нафиг никому не нужна эта макулатура.
генераторы мыслей генерируют контент для обучения ИИшечек, повторюсь.
помедитируй над этим.

а книшки теперь сами сгниют, без каких-либо дополнительных усилий со стороны человеков.
не надо больше писать, издавать, публиковать, развозить, выставлять, продавать, сдавать, потом выкупать, срезать корешки, сканировать и затем выбрасывать на помойку.
всё, конец эпохи.

а какие теперь котлы кому где - это вы там сами теперь распределяйте.
непростое это дело, ох непростое…

olelookoe ★★★★
()
Ответ на: комментарий от FishHook

С какими конкретно вытекающими то? Тут либо - либо. Либо мы как заправские фетишисты одухотворяем предмет - книгу, фотографию, картину, что угодно, и наделяем вещь какими-то околорелигиозными свойствами - придумаем какую-нибудь «душу книги», какие-нибудь «человеческие истории» и прочее словоблудие. Либо мы как нормальные материалисты относимся к предмету, как к предмету. Если предмет больше не нужен, его можно уничтожить. И ничего не случится, ничто никуда не вытечет (или вытекет?). Конкретезируйте, какие вытекающие то и откуда и у кого они вытекают.

Вот разные сочинения на тему влияние книги на человека, также замечу, что многие отделяют «бумажную» книгу и говорят о ней отдельно, но для более точного ответа на Ваш вопрос надо бы поискать материал на темы: «Человек есть то, что он прочитал», «Роль книги в развитии интеллектуальных и личностных качеств человека», «Ценности человека и их значение в жизни» и т.д.

Итого: это точно не про религию, магию и иже с ним, это про неотъемлемые черты человека разумного (не путать с животинкой), а соответственно это про реальность…

Sm0ke85
() автор топика
Ответ на: комментарий от FishHook

кажется это был Маленький Принц.

Хорошее имя для собаки. А то всё Шарик да Бобик.

Zhbert ★★★★★
()
Ответ на: комментарий от Sm0ke85

Вот, опять в точку, то бишь разница разительная…

Ну. Так в после-то речь про свежекупленные книги.

Zhbert ★★★★★
()
Ответ на: комментарий от goingUp

Есть аргументы

Они все довольно слабые. Как, впрочем, и аргументы против.

Тут проблема в том, что в предельной форме это принципиально недоказуемо и неопровержимо. А самое главное, вообще не важно. Даже если вселенная является симуляцией, то покуда она работает так, как работает, «изнутри» от этого не меняется ровным счётом ничего по сравнению с тем, что она «реальна». Более того, это всего лишь потребует нового, чуть более сложного определения реальности, а все выводы, все законы, вся философия — всё остаётся таким же.

CrX ★★★★★
()
Ответ на: комментарий от Sm0ke85

Если бы у бабки был писюн, она была бы дедом. Одно дело исторические письменные источники в единственном экземпляре, которые сами по себе представляют культурное наследие, другое,- в Вашем случае,- миллионные тиражи как нормального контента, так и шлака. Тогда уж и пионерам нагоняй за мукулатуру сдаденную в переработку нужен. Вы тянете сову на глобус и втираете дичь.

Jeronimo ★★★
()
Ответ на: комментарий от CrX

Те, кто запрещает выкидывать хлеб, потому что блаблабла в блокаду люди крошки собирали — из той же серии.

Я одно время был из таких немного. Пока не понял, что все эти вещи мне дед говорил сугубо потому, что прожил там в те годы в тех условиях. А сейчас это уже как бы не актуально немного. Нет, я не стал играть в футбол батонами, но и переживать, что не доел лишний кусок, тоже перестал.

Zhbert ★★★★★
()
Ответ на: комментарий от Zhbert

Или не могли. Почему в этом контексте тебя так цепляют именно книги? Просроченную колбасу в магазине тоже выбрасывают, а ведь она могла бы попасть к кому-то не стол.

Обе проблемы существенны, но одна про Са́мость, вторая про «выживание» (поесть)… Тут кому что важнее зависит от культурного и интеллектуального развития…

Sm0ke85
() автор топика
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)