Добавить переносы строки

0

2

Есть длинная строка более 30 мб, вида:
dsdkfjkjdf<NN>adslklksdf<NN>kdljljsd<NN>odsklkldfsklfg><NN>kjkjlkjsdal
На вот такую команду:
echo «dsdkfjkjdf<NN>adslklksdf<NN>kdljljsd<NN>odsklkldfsklfg><NN>kjkjlkjsdal» | sed 's/<NN>/^M<NN>/g'
в рузультате только:
<NN>kjkjlkjsdallfg>
А нужно чтобы набор символов начинающийся с <NN> был с новой строки. Как быть?

Ссылка

← drbd+ocfs2+hearbeat

Сортировка почты →

sed 's/<NN>/\xA<NN>/g'

x905 ★★★★★
(23.12.10 12:47:56 MSK)

что такое ^M?! операционкой не ошибся? здесь это называется \n

aol ★★★★★
(23.12.10 12:51:55 MSK)

Ссылка

$ echo "dsdkfjkjdf<NN>adslklksdf<NN>kdljljsd<NN>odsklkldfsklfg><NN>kjkjlkjsdal" | sed 's/<NN>/\n<NN>/g'
dsdkfjkjdf
<NN>adslklksdf
<NN>kdljljsd
<NN>odsklkldfsklfg>
<NN>kjkjlkjsdal

arsi ★★★★★
(23.12.10 12:52:21 MSK)

Ссылка

Ответ на: комментарий от x905 23.12.10 12:47:56 MSK

Спасибо, забыл уточнить что требуется для solaris sed, не gnu.

Viper ★
(23.12.10 12:56:08 MSK) автор топика

Ответ на: комментарий от Viper 23.12.10 12:56:08 MSK

http://www.unix.com/shell-programming-scripting/108272-sed-replace-new-line-didn-t-work-solaris.html

Dear...

the problem is the new line where you have to enter new line literary so the command should be :-

sed 's,STRING1, #STRING1\
STRING2,' < filename > output_file

P.S.: проверить негде %)

aol ★★★★★
(23.12.10 13:53:41 MSK)

А нужно чтобы набор символов начинающийся с <NN> был с новой строки. Как быть?

можно создать файл сл. содержания:

#!/bin/sed -f 
s/<NN>/
&/g

Насколько я помню, так должно работать везде.

~~drBatty~~ ★★
(23.12.10 13:59:46 MSK)

Ответ на: комментарий от aol 23.12.10 13:53:41 MSK

Ага, так работает, блин, но как не удобно. :-(

Viper ★
(23.12.10 14:36:22 MSK) автор топика

Ссылка

Ответ на: комментарий от drBatty 23.12.10 13:59:46 MSK

Блин, а как он долго это делает с 30 Мб файлом... :-((( Несколько минут... При том, что tr (правда с заменой всего одного символа (несколько символов не может) на новую строку делает это за несколько секунд. Надо perl чтоль для этого приспосабливать?

Viper ★
(23.12.10 14:41:54 MSK) автор топика

Ответ на: комментарий от Viper 23.12.10 14:41:54 MSK

>Блин, а как он долго это делает с 30 Мб файлом... :-((( Несколько минут... При том, что tr (правда с заменой всего одного символа (несколько символов не может) на новую строку делает это за несколько секунд. Надо perl чтоль для этого приспосабливать?

попробуйте gawk, дело в том, что тут надо работать с мелкими записями, а не с одной огромной задачей. sed заточена на обработку текста с мелкими строчками (~50-100 байт), причём строки обязательно должны разделятся \n. А вот gawk способна обработать любые записи, в т.ч. и «строчки», где разделитель не \n, а произвольное RE.

ЕМНИП в перловке таже беда что и в sed.

(вот только я не знаю, может-ли это простая, не гнутая awk).

~~drBatty~~ ★★
(23.12.10 15:37:46 MSK)

Ответ на: комментарий от drBatty 23.12.10 15:37:46 MSK

> ЕМНИП в перловке таже беда что и в sed.

смотря как готовить ;)

немножко не то, что требовалось:

$ echo "dsdkfjkjdf<NN>adslklksdf<NN>kdljljsd<NN>odsklkldfsklfg><NN>kjkjlkjsdal" | perl -pe 'BEGIN{$/="<NN>";$\="\n"}'
dsdkfjkjdf<NN>
adslklksdf<NN>
kdljljsd<NN>
odsklkldfsklfg><NN>
kjkjlkjsdal

то, что хотел автор:

$ echo "dsdkfjkjdf<NN>adslklksdf<NN>kdljljsd<NN>odsklkldfsklfg><NN>kjkjlkjsdal" | perl -pe 'BEGIN{$/="<NN>"} s/<NN>$/\n<NN>/'
dsdkfjkjdf
<NN>adslklksdf
<NN>kdljljsd
<NN>odsklkldfsklfg>
<NN>kjkjlkjsdal

хотя хз, бенчмарков не делал ^^

arsi ★★★★★
(23.12.10 16:29:02 MSK)

Ответ на: комментарий от arsi 23.12.10 16:29:02 MSK

doc@dt:~/docs/scripts$ time -p perl -pe 'BEGIN{$/="<NN>"} s/<NN>$/\n<NN>/' < big.txt >/dev/null
real 8.17
user 5.39
sys 0.05
doc@dt:~/docs/scripts$ time -p perl -pe 'BEGIN{$/="<NN>"} s/<NN>$/\n<NN>/' < big.txt >/dev/null
real 8.34
user 5.44
sys 0.05
doc@dt:~/docs/scripts$ time -p perl -pe 'BEGIN{$/="<NN>"} s/<NN>$/\n<NN>/' < big.txt >/dev/null
real 8.34
user 5.30
sys 0.06
doc@dt:~/docs/scripts$ time -p sed 's/<NN>/\n&/g' big.txt >/dev/null
real 2.74
user 1.44
sys 0.02
doc@dt:~/docs/scripts$ time -p sed 's/<NN>/\n&/g' big.txt >/dev/null
real 2.18
user 1.45
sys 0.02
doc@dt:~/docs/scripts$ time -p sed 's/<NN>/\n&/g' big.txt >/dev/null
real 2.77
user 1.47
sys 0.02
doc@dt:~/docs/scripts$ ls -lh big.txt 
-rw-r--r-- 1 doc users 33M 2010-12-23 16:33 big.txt

Вывод - perl хуже.

тестовый файл - повторённое кучу раз <NN>adslklksdf

~~drBatty~~ ★★
(23.12.10 16:48:24 MSK)

Ответ на: комментарий от Viper 23.12.10 14:41:54 MSK

у вас памяти хватило? почему-то результаты очень разные - у меня секунды, у вас минуты. может вы искали не <NN>? А что-нить вроде <(b)>[^<]*<\1> ? В любом случае, для значительного ускорения можно использовать POSIX локаль, тогда sed работает как perl, с байтами а не символами в UTF-8 (размер символов считать не нужно, они все по 1 байту)

~~drBatty~~ ★★
(23.12.10 16:56:26 MSK)