поиск ссылок в текстовом файле

0

2

Есть файл, в каждой строчке которого имеется url-ссылка, как до так и после ссылки возможен какой-нибудь текст, ссылка ограничена пробелами, возможен вариант, когда строчка равна url-ссылке (тогда без пробелов). Вопрос: как проще выдрать ссылки из файла, либо вообще очистить файл от шелухи, оставив одни ссылки?

Ссылка

← После логина в ubuntu не продолжает загружаться

vim (консольный) - подсветка текущего буфера →

sed

anonymous
(20.10.10 15:09:41 MSK)

Ссылка

А там тегов html случайно нет?

KblCb ★★★★★
(20.10.10 15:12:18 MSK)

┌┤~├──────────────────────────────────────────────────────────┤gotf@persephone├─
└─> cat links 
http://ololo.org/fail
string
 another string
 http://link.com 
word http://anothersite.ru some more words
┌┤~├──────────────────────────────────────────────────────────┤gotf@persephone├─
└─> cat links | grep -o "\<http://[a-z0-9./-]*\>"
http://ololo.org/fail
http://link.com
http://anothersite.ru

Наверно, это очень криво.

GotF ★★★★★
(20.10.10 15:14:53 MSK)

Ответ на: комментарий от KblCb 20.10.10 15:12:18 MSK

тегов нет

gingerino ★
(20.10.10 15:15:01 MSK) автор топика

Ссылка

Ответ на: комментарий от GotF 20.10.10 15:14:53 MSK

Почемуто у меня вместо этого выводится приглашение в виде «>»

$cat links | grep -o «\<http://[a-z0-9./-]*\>»

gingerino ★
(20.10.10 15:57:47 MSK) автор топика

Ответ на: комментарий от gingerino 20.10.10 15:57:47 MSK

УМВР

┌┤~├──────────────────────────────────────────────────────────┤gotf@persephone├─
└─> bash --version
GNU bash, version 3.2.39(1)-release (x86_64-pc-linux-gnu)
┌┤~├──────────────────────────────────────────────────────────┤gotf@persephone├─
└─> grep --version 
GNU grep 2.5.3

GotF ★★★★★
(20.10.10 16:03:21 MSK)

Ссылка

Я пользуюсь таким способом. Какие в нём недостатки?

sed -rn 's/.*(((https?|ftp):\/\/[^'\'' <>"]+|(www|web|w3).[-a-z0-9.]+)[^'\'' .,;<>"):]).*/\1/p'

Chaser_Andrey ★★★★★
(20.10.10 16:05:57 MSK)

Ссылка

Ответ на: комментарий от gingerino 20.10.10 15:57:47 MSK

Хм, попробуй двойные кавычки заменить одинарными. Это твоё шелл выделывается.

GotF ★★★★★
(20.10.10 16:09:10 MSK)

Ответ на: комментарий от GotF 20.10.10 16:09:10 MSK

спасибо помогло!

gingerino ★
(20.10.10 16:13:29 MSK) автор топика

Ответ на: комментарий от gingerino 20.10.10 16:13:29 MSK

moncler coats

Почемуто у меня вместо [url=http://www.monclerjacketstyle.com/]moncler coats[/url] этого выводится приглашение в виде

wanghuanju
(21.10.10 07:54:24 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← После логина в ubuntu не продолжает загружаться

General

vim (консольный) - подсветка текущего буфера →

УМВР

moncler coats

Похожие темы