sed - ускорить обработку файла

0

1

Добрый день. Такая задача.

Имеется достаточно большой xml файл в котором некоторые строки содержат вхождения которые нужно заменить. Вхождения в строках всегда разные и соответственно есть файл содержащий перечень этих замен оформленный в файл команд sed. В целом это выглядит так:

sed -f change.txt in.xml > out.xml

change.txt содержит такие команды:

s/«161497»/«s61127»/
s/«161513»/«s61143»/
s/«161498»/«s61128»/

Таких строк более 20 000.

in.xml содержит порядка 50 000 строк и только примерно 6 000 из них имеют вхождения для замены. Строки в которых есть вхождения для замены всегда начинаются с одной и той же последовательности символов. Сам по себе файл постоянно обновляется, поэтому вхождения не постоянны и изменяются в пределах этих 20 000 замен. На сколько я понимаю sed прогоняет каждую строку через файл команд, что достаточно замедляет работу. В данном случае получается около 44 000 холостых прогонов. Как указать SED, что поиск нужно проводить только в строках которые к примеру начинаются с определенной последовательности символов, которая всегда постоянна, а остальные строки переписывать как есть?

Ссылка

← А mongodb вообще умеет general_ci для строк?

mpv maximizing lua →

А что, доку прочитать дольше чем писать эту простыню?

/.../ { ...; }

slovazap ★★★★★
(28.09.21 19:39:07 MSK)

Ответ на: комментарий от slovazap 28.09.21 19:39:07 MSK

Весьма признателен за ответ. А можно ссылку на доку где это описано? Я не совсем понимаю куда эту конструкцию вставить. Пока далеко не гуру в данном вопросе.

tn-s
(28.09.21 20:10:35 MSK) автор топика

XSLT

anonymous
(28.09.21 20:15:12 MSK)

Ссылка

Ответ на: комментарий от tn-s 28.09.21 20:10:35 MSK

А можно ссылку на доку где это описано?

https://www.gnu.org/software/sed/manual/sed.html

Я не совсем понимаю куда эту конструкцию вставить.

Обернуть в неё свои команды замены.

slovazap ★★★★★
(28.09.21 20:31:42 MSK)

Ответ на: комментарий от slovazap 28.09.21 20:31:42 MSK

Благодарю. Чуть ранее там нашел это. Единственно пришлось подумать что с этим делать и действительно догадался обернуть! Благодарю. примерно раз в 10 сократилось время обработки.

tn-s
(28.09.21 20:47:28 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← А mongodb вообще умеет general_ci для строк?

Development

mpv maximizing lua →

Похожие темы