LINUX.ORG.RU

К сожалению без примера ссылок по которым скачивается изображение и адреса самого сайта ничего не понятно.

К тому же я думаю это всё не совсем легально будет.

В Firefox в инструментах разработчика точно можно сохранить всю сессию посещения сайта, там будут все запросы, что были со страницы, все post и get запросы и возвращённые данные.

В целом думаю ничего готового нет, ты можешь только проанализировать как работает открытие нужного тебе документа, посмотреть какие запросы на загрузку частей изображения идут, проследить закономерности.

Как найдёшь закономерности, какими post запросами загружаются части изображения тебе нужно получить cookies и сам POST запрос, в целом это можно сделать из инструментов разработчика, правым кликом по запросу, далее выбираешь запрос из инструментов разработчика, кликаешь правой кнопкой мыши и выбираешь пункт контекстного меню «Copy URL -> Copy as cURL (POSIX)» - это будет команда через curl со всем необходимыми данными, правда могут быть нюансы, но думаю всё же вся.

Далее разбираешь её и пишешь скрипт, который скачает тебе все части, а потом смотришь какой порядок и собираешь само изображение, страницу, многостраничный файл.

Может быть, что одним из POST запросов в начале в некотором виде запрашивается размещение этих частей.

Т.е. тебе нужно уметь писать скрипты на любом скриптовом языке, в котором ты сможешь написать механику формирования ссылок на части изображения, передавая их в CURL с нужными заголовками.

Если кратко, то стек может быть таким:

  • bash - формирование ссылок
  • curl - скачивание
  • imagemagick - сборка изображения из частей
  • pdftk - для сбора многостраничного PDF документа, если нужно.

А так, если кратко, готового инструмента нет.

Если у тебя нет достаточных навыков, то вообще никак.

kostik87 ★★★★★
()

Скорее всего, там как с видео или аудио, которые теперь отдаются не просто потоком mp3, как раньше, а разбиты на мелкокуски и забираются по очереди. Некоторые расширения для загрузки умеют такое качать и собирать воедино, например dwhelper для огнелиса. Но это касается только видео, чтобы картины так разбивались я пока ещё не сталкивался, тьфу тьфу тьфу.

Ну и да, это скорее всего незаконно, и если тебя спалят в процессе, то может быть набутыливание в той или иной мере.

Zhbert ★★★★★
()
Ответ на: комментарий от kostik87

https://gavo.arsvo.ru а ссылок на изображение там нет https://gavo.arsvo.ru/Pages/StorageFiles/StorageFilesList.aspx?ItemId=8637795&ItemType=5 это ссылка на страницу конкретного дела открывается только с активным абонементом, для просмотра изображений открывается окно где их можно листать но ссылка в адресной строке остается эта же

vit1995
() автор топика

попробуй написать им просьбу прислать тебе нормальные файлы в нормальном виде по нужному списку, опиши свою ситуацию, приложи справки. так же непонятно, почему какой-то там абонемент всего на неделю (ахрив на бюджетные деньги, для читателей), проси продлять бесконечно, опиши им ситуацию

anonymous
()
Ответ на: комментарий от anonymous

К сожалению, архивы так же как и МВД имеют палочную систему и у них нет никакой мотивации идти на встречу, поскольку так они не смогут набить палки по клиентам которые сидят в архиве = не получат деньги в следующий период.

Обычно в таких случаях выгоднее в региональное СМИ обратиться, их сейчас боты ЦУРов мониторят, бывает очень быстро все решается. Но конечно да, первый шаг - написать запрос в архив.

recei
()
Ответ на: комментарий от kostik87

если бы я умел писать скрипты я бы не куда не обращался мне нужен уже готовый и чтобы он выдавал целые изображения а не эти куски, я нашел один, он скачивает эти куски и с ним идет второй который их склеивает но то ли качаются не все то ли склеивает криво, но многие страницы получаются фрагментарно, может их можно как то соединить в один скрипт который будет выдавать сразу готовые целые изображения?

vit1995
() автор топика
Ответ на: комментарий от vit1995

Значит разбирайся, если имеешь скрипты. Писать что-то для тебя для выкачивания платных данных общей стоимостью 300 тыс. рублей никто не будет.

По какой статье может быть юридически квалифицирован несанкционированный доступ к защищённым данным я не знаю и знать не хочу.

Хотя сумма думаю не имеет значение, а имеет лишь то, что данные имеют ограниченный доступ, а не опубликованы открыто.

Все карты в твоих руках, в том числе и ответственность за действия, которые ты будешь делать.

kostik87 ★★★★★
()
Ответ на: комментарий от kostik87

я написал здесь не для того чтобы на до мной издевались мне лет 5 разбираться надо чтобы самому что то написать и то вряд ли что то получится, а вам всем здесь сидящим это разплюнуть тем более имея исходный материал а я НИЩИЙ ИНВАЛИД с низким интеллектом я надеюсь что не все здесь такие бездушные как вы , я уже с ума схожу просто от того что не могу получить эти несчастные метрические книги, извелся весь,знаете какие это нервы я уже на любые унижения готов лишь бы наконец решить эту проблему а встречаю только издевательства не все в конце концов рождаются гениями, я родился дураком я просто не способен все это понять я вообще инвалид по психике отставание в развитии

vit1995
() автор топика
Ответ на: комментарий от vit1995

Во-первых, над тобой никто не издевается.

Я изложил лично свою позицию, что реализовывать скачивание данных с ограниченным доступом считаю противозаконно.

В третьих, для новичка на сайте ты очень хорошо пользуешься не слишком явным функционалом.

kostik87 ★★★★★
()
Ответ на: комментарий от zimniy

Я и не запоминаю. А посыл был в том, что человек зарегистрировался сегодня, прикрывается инвалидностью и тем, что он ничего не знает в Linux. Но знает часть функций форума, которые новичку могут быть неизвестны.

Плюс стиль ответов намекает если не на троллинг, то на провокацию уж точно, выставление себя жертвой и обвинение других.

Т.е. вывод, что он уже здесь был и либо зашёл под другим ником либо под новым, но это не важно, раз был когда-то - минимально писать bash скрипты хотя бы умеет, а раз умеет - не понятно зачем это все.

kostik87 ★★★★★
()
Ответ на: комментарий от vit1995

Может есть воронежкие сайты/группы вконтакта тех, кто занимается гениалогией и найдется желающий помочь.

В текущей постановке вопроса задача нерешаема.

Только если ты найдешь желающего написать скрипт за цену меньше абонемента.

ya-betmen ★★★★★
()
Ответ на: комментарий от anonymous

https://forum.vgd.ru/post/588/70400/p5513883.htm#pp5513883

нашел опчика, понятно откуда он услышал про скрипты:

Советую удалить пост. Буквально сегодня писал в соседней теме - не стоит тянуть такое в паблик. Вам-то всё-равно, раз не пользуетесь Элар-архивами. А архивисты увидят и прикроют лавочку. Прошлый вариант ведь в этом году уже прикрыли (когда скачивалось проще и без водяных знаков). PS. Скрипт неоптимальный, можно всё цельной картинкой вынуть.

Не думаю, что технически сложно, но есть ряд нюансов:

  1. Если продают (кстати, продавать такие данные вообще законно?), то обходные пути доступа наверняка караются.

  2. Я б посмотрел, но там после логина через ЕСИА еще ручная регистрация с ручным апрувом, который может занимать несколько рабочих дней.

  3. Не очень понятно, зачем почти слепому человеку с низким интеллектом и сколиозом нужны эти данные.

anonymous
()

знаю одного типа который качает от туда изображения тысячами с помощью какого-то скрипта

Так попроси у него этот скрипт

Dog ★★★
()
Ответ на: комментарий от kostik87

Я изложил лично свою позицию, что реализовывать скачивание данных с ограниченным доступом считаю противозаконно.

А НЕ давать скачать данные, показываемые на экране компьютера - это что? Причем были бы данные ДСП или еще хуже, их бы за деньги не показывали. Это просто бизнес, причем на общественном материале, которым эти старые метрические книги являются.

Но это все философия, реально конечно есть риск, что могут натянуть за скрипт скачивания. Поэтому, если такое делать, то как-то не со своего IP =) Топикстартер, впрочем, по любому со своим абонементом.

praseodim ★★★★★
()
Последнее исправление: praseodim (всего исправлений: 1)
Ответ на: комментарий от vit1995

аписал здесь не для того чтобы на до мной издевались мне лет 5 разбираться надо чтобы самому что то написать и то вряд ли что то получится

Конечно, ты ведь даже родной язык не осилил, куда тебе скрипты писать.

а вам всем здесь сидящим это разплюнуть

И кто в здравом уме захочет присесть на ровном месте?

а я НИЩИЙ ИНВАЛИД с низким интеллектом

Это должно смотивировать других на неправомерные действия?

Zhbert ★★★★★
()
Ответ на: комментарий от praseodim

А НЕ давать скачать данные, показываемые на экране компьютера - это что?

Эм… Ну ты же с библиотеки не можешь себе книг набрать просто так? А там их тоже показывают.

Zhbert ★★★★★
()
Ответ на: комментарий от vit1995

а я НИЩИЙ ИНВАЛИД с низким интеллектом

Чувак, здесь все ИНВАЛИДЫ, половина нищая, и процентов десять с низким интеллектом, так что, ты не в той среде ищешь. Тут большинство уровня «Далее-далее-далее- mount /dev/nvme0n1p1 ~/porno»

tiinn ★★★★★
()
Ответ на: комментарий от Zhbert

Аналогия слабая. Если книги на руки выдаются, ничего не мешает их отсканировать (даже если это что-то нарушает). Я вообще про ситуацию, что доступ дали, но приняли меры, чтобы не сохранил материалы у себя.

По некоторому опыту работы вообще с архивами скажу, что если нет прямой наводки на нужное место, может реально потребоваться перебрать горы коробок и папок. И занять это все может даже не часы и не дни. Так что я топикстартера очень хорошо понимаю. С этим электронным доступом с такими ограничениями получается в чем-то как в сказке про лису и журавля. Типа и работу провели по сканированию и электронный доступ есть, но хрен тебе, а не полноценная работа.

praseodim ★★★★★
()
Последнее исправление: praseodim (всего исправлений: 1)
Ответ на: комментарий от anonymous

И с чужой авторизацией в есиа, что само по себе является преступлением?

Кстати темный момент, да. Но удаленный доступ на другой компьютер с согласия его владельца пока еще не является незаконным. Так что логин на его комп, а на том компе если есть сессия, авторизованная в есиа, то все нормально. Тем более, что чисто технически так бы скорее всего и пришлось сделать.

Я не очень компетентен в вебе и самое главное - времени сейчас категорически нет ни на что, иначе мог бы попробовать помочь таким образом.

praseodim ★★★★★
()
Последнее исправление: praseodim (всего исправлений: 1)
Ответ на: комментарий от praseodim

Я вообще про ситуацию, что доступ дали, но приняли меры, чтобы не сохранил материалы у себя.

Ну ЕМНИП в некоторых отделах РНБ, где редкие и старинные книги, такие же правила.

Zhbert ★★★★★
()
Ответ на: комментарий от praseodim

По некоторому опыту работы вообще с архивами скажу, что если нет прямой наводки на нужное место, может реально потребоваться перебрать горы коробок и папок. И занять это все может даже не часы и не дни. Так что я топикстартера очень хорошо понимаю. С этим электронным доступом с такими ограничениями получается в чем-то как в сказке про лису и журавля. Типа и работу провели по сканированию и электронный доступ есть, но хрен тебе, а не полноценная работа.

Ну тут согласен, да.

Zhbert ★★★★★
()
Ответ на: комментарий от praseodim

А НЕ давать скачать данные, показываемые на экране компьютера - это что?

Если они показываются на экране ПК - значит теоретически их можно скачать.

Можешь - скачивай.

Аналогично music.yandex.ru - там аудио треки передаются частями в зашифрованном виде, расшифровывается на стороне клиента. Т.е. сохранить полученные через POST запрос данные можно, но что с ними делать - не понятно. Я не разбирался.

Собственно тут вопрос простой: владельцы, что этого архива, что music.yandex.ru предоставляют доступ, в том числе за деньги или по подписке, они в праве встраивать средства защиты доступа к своему контенту.

Т.е. ответ простой: не хочешь платить - не пользуйся. Ищи альтернативные источники, что одного, что другого. Оплата идёт за предоставление доступа к сервисы, что в одном, что в другом случае и через этот сервис к данным в нём.

Если можешь найти данные в другом месте бесплатно - находи.

В тоже время владельцы электронного архива потратили деньги на его создание и оцифровку, их право выкладывать бесплатно или за деньги.

kostik87 ★★★★★
()
Ответ на: комментарий от anonymous

Не очень понятно, зачем почти слепому человеку с низким интеллектом и сколиозом нужны эти данные.

Это как раз легко, он мог подработку взять(как раз рассчитанную на тупую работу, с кучей механических действий). Инвалидам тоже надо кушать и жить на что-то.

Loki13 ★★★★★
()
Ответ на: комментарий от kostik87

Собственно тут вопрос простой: владельцы, что этого архива, что music.yandex.ru предоставляют доступ, в том числе за деньги или по подписке, они в праве встраивать средства защиты доступа к своему контенту.

В тоже время владельцы электронного архива потратили деньги на его создание и оцифровку, их право выкладывать бесплатно или за деньги.

Потратили бюджетные деньги. С чего вдруг это стало «их» контентом? Это государственные архивы и в них хранятся общественно-значимые документы, метрические книги, в частности. Деньги на это идут из бюджета. Оцифровка архивов производилась тоже на бюджетные деньги. Как и их содержание.

С чего вообще государевы мужи решили, что доступ у общества к таким архивам должен быть коммерческий? Да еще и совсем не за символическую плату. Оплата их содержания? Там не такие и большие деньги нужны, если на общественных началах всякие либгены могут функционировать.

Еще и низзя просто так сохранить данные.

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

Это государственные архивы и в них хранятся общественно-значимые документы, метрические книги, в частности.

Любая выписка из кадастрового плана земельных участков производится за деньги.

В том числе и внесение записей.

По факту любая информация, необходимая инженерам-геодезистам так же получается только за деньги, в том числе и обновление карт местности, информация по геодезическим пунктам и прочему.

К тому же, если такая информация станет доступна открыто и бесплатно всем желающим - это может привести к шквалу мошенничества и прочих проблем в земельном законодательстве.

Аналогично и с геологическими данными, если там содержится информация о залежах природных ископаемых - то это стратегически важная информация и она тем более не может быть доступна просто так публично. Даже если конкретных записей нет, то уверен по косвенным признакам можно сделать выводы.

Потратили бюджетные деньги. С чего вдруг это стало «их» контентом?

И теперь этот функционал есть и информацию можно получить. Найдите гос. контракт, в котором описан объём и стоимость работ, а так же ответственность и тогда можно предметно говорить, что и кем было сделано, сколько это стоило, кто и за какую цену или бесплатно может получать сведения оттуда.

Там не такие и большие деньги нужны, если на общественных началах всякие либгены могут функционировать.

Если могут - отлично. Значит можно воспользоваться ими. Я хз, что такое либген.

kostik87 ★★★★★
()
Ответ на: комментарий от kostik87

Любая выписка из кадастрового плана земельных участков производится за деньги.

А причем тут бумажные архивы и официальная выписка из кадастрового плана? Которая юридический документ вообще-то и деньги берутся за это.

К тому же, если такая информация станет доступна открыто и бесплатно всем желающим - это может привести к шквалу мошенничества и прочих проблем в земельном законодательстве.

Вон оно чего, проблема не в мошенниках, а в бесплатно доступной информации оказывается... Ну так у мошенников это бизнес такой специфический, причем высокоприбыльный, они денег по любому найдут.

Найдите гос. контракт, в котором описан объём и стоимость работ, а так же ответственность и тогда можно предметно говорить, что и кем было сделано, сколько это стоило, кто и за какую цену или бесплатно может получать сведения оттуда.

А нахрена это искать? Если это сделано, как сообщалось, за госбюджет, то почему надо еще и платить потом? Если за частные деньги, то как получилась такая скрытая приватизация доступа к архивам? Типа как с платными дорогами и все в порядке?

Тут можно сказать, что доступ к бумагам никто не отменял, но вспоминаю, что слышал жалобы (не с этим архивом связанные), что оцифровка - хорошо, но после нее обычному человеку уже совсем не дают доступ к бумагам. Не знаю как в данном случае, может и дают. Пока.

praseodim ★★★★★
()
Последнее исправление: praseodim (всего исправлений: 1)
Ответ на: комментарий от praseodim

В СССР было проще - в гос архивы и за деньги и бесплатно не пускали, если по должности тебе не положено. А тут пока за деньги пускают хоть всяких рандомов.

anonymous
()