LINUX.ORG.RU

Пара вопросов


0

1

1. Есть столбцы с содержимым

/html/body/div/a=Темы по интересам.
/html/body/div/span=(+34)
Пишу так,
sed 's/\///g'
удаляет только / а как теперь добавить к sed 's/\///g' чтобы удалить оставшееся?! А именно, htmlbodydiva= и htmlbodydivspan= читал мануал но почему-то ругается, то символов много, то еще что-то.

2. После выполнения скрипта получаю такое содержимое:

htmlbodydiva=Вопросы - ответы.
htmlbodydivspan=(+34)
htmlbodydiva=Неофициальные помощники сайта.
htmlbodydivspan=(+25)
htmlbodydiva=Архив
htmlbodydivspan=(>100)
Хорошо, эти htmlbodydiva= и htmlbodydivspan= уйдут но получается следующее:
Вопросы - ответы.
(+34)
Неофициальные помощники сайта
(+25)
и тд. А можно ли как сделать чтобы было так: Вопросы - ответы. (+34), Неофициальные помощники сайта (+25) Т.е расположить не в столбик, а в строчку?!

Скрипт:

#! /bin/bash
# -*- coding: utf-8 -*-# 
wget -qO- --load-cookies=/tmp/cookies.txt "http://бла-бла"  | 
grep -o '<div class="even">.*</div>' | html2 | iconv -t latin1 | grep -B6 'span=(.*)'  |
grep 'a=\|span=(' | sed 's/\///g' 

Получаю:

htmlbodydiva=Вопросы - ответы.
htmlbodydivspan=(+34)
htmlbodydiva=Неофициальные помощники сайта.
htmlbodydivspan=(+25)
htmlbodydiva=Архив
htmlbodydivspan=(>100)

Пара вопросов по bash

Пишу так,

sed 's/\///g'

И при чём тут bash?

вычисты кашу из головы, а потом

man sed

anonymous ()

А можно ли как сделать чтобы было так: Вопросы - ответы. (+34), Неофициальные помощники сайта (+25) Т.е расположить не в столбик, а в строчку?!

Можно. И да, анонимус прав.

HerrWeigel ★★★★ ()
Последнее исправление: HerrWeigel (всего исправлений: 1)

Братиш, ты лошадок то не гони, а спокойно сформулируй постановку задачи.
А лучше все велосипеды себе оставь и просто пример входного и выходного файла покажи

zolden ★★★★★ ()
Ответ на: комментарий от kraz5

Убедительная просьбатроллить в другом месте.

Чини детектор, я просто указал на то, что вопросы нужно корректнее сформулировать. Кто-то такой поток сознания поймет, а кто-то нет.

HerrWeigel ★★★★ ()
Ответ на: комментарий от zolden

#! /bin/bash # -*- coding: utf-8 -*-# wget -qO- --load-cookies=/tmp/cookies.txt «бла-бла» | grep -o '<div class=«even»>.*</div>' | html2 | iconv -t latin1 | grep -B6 'span=(.*)' | grep 'a=\|span=(' | sed 's/\///g'

На выходе получаю:

htmlbodydiva=Вопросы - ответы. htmlbodydivspan=(+34) htmlbodydiva=Неофициальные помощники сайта. htmlbodydivspan=(+25) htmlbodydiva=Архив htmlbodydivspan=(>100)

kraz5 ()
Ответ на: комментарий от anonymous
$ cat data.txt | awk 'BEGIN{FS="="}{if (NR%2==1) {printf "%s ",$2} else {print $2}}'
anonymous ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.