LINUX.ORG.RU
ФорумAdmin

[скрипты] автоматическое скачивание и распечатка

 


0

0

Собстно исходные данные:
На http://kommersant.ru/daily/ есть ссылка обозначенная "PDF, весь номер"(каждый день разная), далее ввод логина/пароля(они есть) после чего выдается pdf-файл.
Сам я в этих всяких вебах не силен, возможно ли как-то автоматизировать процесс скачивания?

★★★★★

Можно генерировать в Shell имя файла, а качать с помощью curl или wget (оба поддерживают авторизацию - хоть через SSL). Чтобы запускалось каждый день в определенное время - cron.

Файл можно печатать с мопощью lp или lpr

Noldor
()
Ответ на: комментарий от Noldor

>Можно генерировать в Shell имя файла, а качать с помощью curl или wget (оба поддерживают авторизацию - хоть через SSL).

Там не все так просто, надо ввести логин/пароль в полях, нажать кнопку, после чего выдается ссылка для скачивания.

madcore ★★★★★
() автор топика
Ответ на: комментарий от madcore

Кстати, wget поддерживает авторизацию(--password). Я, в своё время, тупо регекспами парсил страницы на предмет ссылок :)

true_admin ★★★★★
()
Ответ на: комментарий от true_admin

>Кстати, wget поддерживает авторизацию(--password). Я, в своё время, тупо регекспами парсил страницы на предмет ссылок :)

Там не такая авторизация, надо поля заполнять.

madcore ★★★★★
() автор топика
Ответ на: комментарий от AITap

>Тогда парсить на наличие форм, а потом curl + POST.

Да чего там парсить? Один раз HTML прочитать - один раз curl в скрипте прописать.

nnz ★★★★
()
Ответ на: комментарий от AITap

В общем, получилось через кукисы не вводя пароль.

madcore ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.