[bash] Простая поисковая система.

0

2

Набросал тут за вечер. На основе wget --spider.
Бот - парсит html и проверяет не проиндексированы ли уже ссылки. Кусок бота, который проверяет, чтобы сохраненные ссылки не повторялись. Клиентская часть.
Короче, скачивается html странички, с помощью wget --spider и утилит для обработки текста выдергиваются ссылки, направляются в файл. Потом в этом файле, в цикле, каждая ссылка проверяется с другой, находятся одинаковые и файл редактируется. Код еще сыроват и полностью программа не заработала, но по отдельным частям проверял. Потом будет выдергиваться краткая информация о страничке и заноситься в индексы в два столбика - ссылка и описание. Вводим в клиенте искомое и выдается ссылка. Это все должно автоматически быть. ЧЯДНТ? Может чего посоветуете? :)

Ссылка

← [Qt] Потоки со своим eventloop'ом

[c] Sample stdin > bzip > stdout →

>Может чего посоветуете?

не использовать баш.

anonymous
(02.06.11 14:23:21 MSK)

> ЧЯДНТ? Может чего посоветуете?

Сменить bash на Perl/Python/Ruby.

Простая поисковая система.

Зачем оно нужно?

~~geekless~~ ★★
(02.06.11 14:26:36 MSK)

Ответ на: комментарий от anonymous 02.06.11 14:23:21 MSK

> не использовать баш.
Ты думаешь я серьезно программирую? Для закрепления материала: «Программирование на баш» - домашнее задание :)

~~Phaser~~
(02.06.11 14:26:37 MSK) автор топика

Ответ на: комментарий от Phaser 02.06.11 14:26:37 MSK

>программа
>баш
Даже звучит странно. ;)

Insomnium ★★★★
(02.06.11 14:29:54 MSK)

Ссылка

Ответ на: комментарий от Phaser 02.06.11 14:26:37 MSK

Для закрепления материала: «Программирование на баш» - домашнее задание

    lines=`wc -l ~/Bot/links | awk '{print $1}'`
    for a in `seq 0 $lines`;do
        line=$a"p"
        link=`sed -n $line ~/Bot/links`

Какой-то кромешный ужас.

~~geekless~~ ★★
(02.06.11 14:30:25 MSK)

Ссылка

подучив awk можно переписать в 3 раза короче, но это уже задротство.
Забей, теперь это пройденный этап.

zolden ★★★★★
(02.06.11 17:18:39 MSK)

Ответ на: комментарий от geekless 02.06.11 14:26:36 MSK

> Сменить bash на Perl/Python/Ruby.
Питон подучиваю.

~~Phaser~~
(02.06.11 20:15:54 MSK) автор топика

Ссылка

Ответ на: комментарий от zolden 02.06.11 17:18:39 MSK

Слушай, можно как-то присвоить переменной значение из нескольких строк в столбец? И потом выуживать оттуда по одной и давать её выхлоп.

~~Phaser~~
(02.06.11 20:56:11 MSK) автор топика

Ответ на: комментарий от Phaser 02.06.11 20:56:11 MSK

Можно, отчего ж не можно...
Но для начала, чтобы сэкономить время на объяснения придётся перейти на нормальный шелл (и это не bash)

%>cat tst                                                                                                                                                                 
1
2
3
4
%>myvar=$(cat tst)                                                                                                                                                                                   
%>echo ${myvar}                                                                                                                                                                                      
1
2
3
4
%>echo ${myvar:2:1}
2

хотя это баловство какое-то, лучше сразу массив использовать

но сдаётся мне ты на самом деле задачу неправильно сформулировал

zolden ★★★★★
(02.06.11 21:32:09 MSK)

Ответ на: комментарий от zolden 02.06.11 21:32:09 MSK

> Но для начала, чтобы сэкономить время на объяснения придётся перейти на нормальный шелл (и это не bash)
Чем вам всем баш не нравиться?

~~Phaser~~
(02.06.11 22:31:47 MSK) автор топика

Ответ на: комментарий от Phaser 02.06.11 22:31:47 MSK

Ты правда хочешь это знать?

zolden ★★★★★
(02.06.11 23:29:27 MSK)

Ответ на: комментарий от zolden 02.06.11 23:29:27 MSK

> Ты правда хочешь это знать?
Да :) По сравнению с другими шеллами.

~~Phaser~~
(02.06.11 23:34:04 MSK) автор топика

Ответ на: комментарий от Phaser 02.06.11 23:34:04 MSK

Если я тебе скажу man zsh, ты же всё равно ничего не поймёшь. Доучивай лучше питон

zolden ★★★★★
(02.06.11 23:49:00 MSK)

Ответ на: комментарий от zolden 02.06.11 23:49:00 MSK

Чем зсх лучше? В двух словах. Почему ты думаешь, что я не пойму?

~~Phaser~~
(03.06.11 00:22:44 MSK) автор топика

Ответ на: комментарий от Phaser 03.06.11 00:22:44 MSK

было много холиваров, поиск бы хоть посмотрел Find и пробелы (комментарий)

zolden ★★★★★
(03.06.11 10:39:02 MSK)

Ответ на: комментарий от zolden 03.06.11 10:39:02 MSK

> было много холиваров, поиск бы хоть посмотрел http://www.linux.org.ru/forum/development/5950997#comment-5952779
Доводы, мягко говоря, субъективные, на любителя.

~~Phaser~~
(03.06.11 11:11:26 MSK) автор топика

Ответ на: комментарий от zolden 03.06.11 10:39:02 MSK

Ты думаешь, повернуть аватарку на 90 градусов оригинально?

~~Phaser~~
(03.06.11 11:25:59 MSK) автор топика

Ссылка

Ответ на: комментарий от Phaser 03.06.11 11:11:26 MSK

$ time ( find /usr/include -name \*.h -exec grep printf /dev/null >| /dev/null {} \; )
Real: 4,89s User: 1,41s System: 3,46s CPU-percent: 99%
$ time ( zargs /usr/include/**/*.h -- grep printf /dev/null >| /dev/null )
Real: 0,27s User: 0,14s System: 0,14s CPU-percent: 102%

у меня не очень с английским, поэтому на просто на цифры укажи где там субъективные доводы

zolden ★★★★★
(03.06.11 12:00:56 MSK)