LINUX.ORG.RU
ФорумTalks

Заархивировать интернет

 


0

1

Я вот тут подумал, был такой персонаж, который предлагал заархивировать весь интернет на флешку. А ведь сбылось! Нынешние БЯМ в общем-то это сделали. Что думаете по этому поводу, сочатнеки?



Последнее исправление: CrX (всего исправлений: 1)

Как сказал один сотрудник местного поисковика: «Мы скачали весь интернет. Два раза».

rechnick ★★★
()
Ответ на: комментарий от sabacs

Ты не можешь восстановить содержимое, только сгенерировать подобное

no-dashi-v2 ★★★★
()
Ответ на: комментарий от sabacs

Ну восстанови мне, скажем, 18-й пост из знаменитого ЛОРовского треда «Русские физики выбирают Slackware» (я сам не смотрел, какой там 18-й, число от балды). Пусть LLM скажет, кто там автор, что он написал, какого числа.

Можешь использовать любую LLM, только без возможности непосредственно открыть сайт и посмотреть.

CrX ★★★★★
()
Ответ на: комментарий от sabacs

Нет. И я сомневаюсь, что проигнорировали. Просто это действительно не архив, и восстановить из него ничего нельзя. Точно так же, как нельзя восстановить текст книги «Война и Мир» из изложения по нему, написанного самым гениальным школьником и без ошибок.

CrX ★★★★★
()
Ответ на: комментарий от CrX

По jpeg тоже не восстановить исходник… большая часть «информации» в Интернет — информационный шум, его отбрасывание не приводит к потере информации.

sabacs
() автор топика

Что думаете по этому поводу, сочатнеки?

Что БЯМ – сжатие с огромными потерями.

dataman ★★★★★
()
Ответ на: комментарий от sabacs

По jpeg тоже не восстановить исходник…

Ну так это и не архивация, а сжатие с потерями.

Только при LLM это не сжатие с потерями даже, это, как совершенно верно сказали выше — базовые вектора. Ничего даже близкого к исходнику оттуда восстановить не возможно. Какие-то самые базовые факты энцеклопедические — да, но не более того.

Если приводить аналогию, то можно сказать, что это «сжатие» с гигантскими потерями. Не как у jpeg даже при самом низком качестве. Скорее как вместо файла изображения с картиной «Тайная вечеря» сохранить текстовый файл с содержимым «Длинный стол, в центре Иисус, слева 6 апостолов, справа 6 опостолов, у одного нож». Вот такого уровня «сжатие», а не уровня JPEG.

большая часть «информации» в Интернет — информационный шум, его отбрасывание не приводит к потере информации.

Это уже субъективщина и к глупости, высказанной в сабже не имеет никакого отношения.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 2)
Ответ на: комментарий от CrX

Это уже субъективщина и к глупости, высказанной в сабже не имеет никакого отношения.

Не согласен. Гигабайты «срачей» можно свести буквально к одному абзацу, а иногда и к одному предложению текста. Без потери смысла.

sabacs
() автор топика
Ответ на: комментарий от dataman

потерями

Это покрывается приобритениями в виде галлюцинаций

mamina_radost
()
Ответ на: комментарий от sabacs

Не согласен. Гигабайты «срачей» можно свести буквально к одному абзацу, а иногда и к одному предложению текста. Без потери смысла.

Это попросту не так — нельзя. Точнее, это субъективная оценка ценности информации. Я понимаю, что ты имеешь в виду, и даже неважно, согласен я с этой оценкой или нет, суть ведь не в этом, а в том, что это НЕ архивирование и тем более не архивирование «всего интернета».

CrX ★★★★★
()

archive.org всё уже заархивировано до нас.

futurama ★★★★★
()
Ответ на: комментарий от dataman

объём хранимых данных в 2016 году можно оценить на уровне 1,96 х 10^22 бит = 2,45 зеттабайта

Скорее всего за эти 10 лет объём вырос раз в 10+

CrX ★★★★★
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)