LINUX.ORG.RU

Взять отпарсенный текст с URL.


0

0

Стоит задача сабжа. Т.е. есть страница, нужно поулчить голый текст.

lynx -dump <url> не работает не смотря ни на какие игры с ключами. В смысле - работает, но всё скачивает исключительно в транслите. Нужна любая русская кодировка (в конечном итоге - UTF-8).

Может, кто или ключик работающий для lynx'а подскажет, или альтернативу. Включая чисто офлайновый парсер скачанного текста :)

★★★★★

Re: Взять отпарсенный текст с URL.

Совсем ох..ел? Может тебе еще и полы помыть?
Да такого утиля как грязи.

anonymous ()

Re: Взять отпарсенный текст с URL.

echo "character_set=UNICODE (UTF-8)" >> ~/.lynxrc

ananas ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.