sed без регулярных выражений

Вероятно, уже многократно задаваемый вопрос, но если бы я нашел ответ, я бы не спрашивал. Как мне заставить работать sed без регулярных выражений?

pete@crunchbang:/usr/local/bin$ echo 'также'|sed 's/т.к./because/g'
becauseе

А мне нужно, чтобы точка интерпретировалась как точка.

Важное дополнение. Я не могу экранировать такие символы с помощью слэша, поскольку надо обработать с помощью sed файл, в котором присутствует обычный текст с кучей точек и прочих пунктуационных знаков. Специально для sed подгонять этот файл я не буду - он для этого слишком большой и используется другими программами.

И еще одно дополнение. Для замены используется команда

sed -i "s/$orig/$transl/g" "$tmpfile"

, поэтому переменные не должны пострадать.

Ссылка

← Как программно смешать входы двух-трёх звуковух для записи?

выбор звуковой карты из системы →

Тебе точки надо экранировать в шаблоне, а не в обрабатываемом файле.

~~sdio~~ ★★★★★
(13.05.12 11:47:45 MSK)

какая стоит задача?
то что вы описали - не задача, а придуманные вами костыли

zolden ★★★★★
(13.05.12 11:49:02 MSK)

Если на один раз, то можно открыть в текстовом редакторе и заменить вручную.

Автоматизировать — например, так: http://stackoverflow.com/a/10467453/467290

note173 ★★★★★
(13.05.12 12:04:09 MSK)

Ответ на: комментарий от zolden 13.05.12 11:49:02 MSK

какая стоит задача?

В одном файле берется оригинал и перевод, в другом - исходный текст. При нахождении оригинала в исходном тексте оригинал заменяется на перевод.

то что вы описали - не задача, а придуманные вами костыли

Где вы увидели в моем решении костыли?

Deleted
(13.05.12 12:13:43 MSK)

grep -F

anonymous
(13.05.12 12:14:44 MSK)

Ответ на: комментарий от note173 13.05.12 12:04:09 MSK

Если на один раз, то можно открыть в текстовом редакторе и заменить вручную.

На один раз я обычно скрипт не пишу.

Автоматизировать — например, так: http://stackoverflow.com/a/10467453/467290

Спасибо, посмотрим, что это даст.

Deleted
(13.05.12 12:16:38 MSK)

Ссылка

Ответ на: комментарий от sdio 13.05.12 11:47:45 MSK

Точек в шаблоне может и не быть. Шаблон может представлять собой как слово или фразу без точек, так и целое(ые) предложение(я) с точками.

Deleted
(13.05.12 12:18:05 MSK)

Ответ на: комментарий от anonymous 13.05.12 12:14:44 MSK

И как мне применить его в сочетании с sed?

Deleted
(13.05.12 12:19:49 MSK)

$ TRANS=because
$ ORIG=$(echo 'т.к.' | sed 's/./\\&/g')
$ echo 'также т.к.' | sed "s/$ORIG/$TRANS/g"
также because

schizoid ★★★
(13.05.12 12:23:27 MSK)

Ответ на: комментарий от Deleted 13.05.12 12:19:49 MSK

не использовать sed

anonymous
(13.05.12 12:24:02 MSK)

Ответ на: комментарий от schizoid 13.05.12 12:23:27 MSK

Нет, не совсем правильно. По ссылке вышедаденой на stackoverflow - более правильное решение.

schizoid ★★★
(13.05.12 12:26:29 MSK)

Ссылка

Ответ на: комментарий от Deleted 13.05.12 12:18:05 MSK

шаблон нужно сначала обработать, чтобы экранировать точки.

silwer@dalamar ~ $ a=$(echo 'т.к.' | sed 's/\./\\./g')
silwer@dalamar ~ $ echo $a
т\.к\.
silwer@dalamar ~ $ echo "т.к. что-то" | sed 's/'$a'/because/g'
because что-то

silw ★★★★★
(13.05.12 12:26:47 MSK)

Ответ на: комментарий от schizoid 13.05.12 12:23:27 MSK

router@jb:~$ echo '12[35]45234т.к.$%^' | perl -e 'use utf8; if ( $ENV{"LANG"} =~ /UTF/i ) {  binmode STDIN, ":utf8"; binmode STDOUT, ":utf8"; }; while ($_=<>) { chomp; print "\Q$_\E\n";}'
12\[35\]45234т\.к\.\$\%\^
router@jb:~$

Заморачиваться с utf пришлось только из-за русских букв.

З.Ы. Как ты подсветку синтаксиса включил?

router ★★★★★
(13.05.12 12:35:29 MSK)

Ответ на: комментарий от anonymous 13.05.12 12:24:02 MSK

+1, пусть тс оторвется от этих ворот и присмотрится к другим.

anonymous
(13.05.12 12:54:59 MSK)

Ссылка

Ответ на: комментарий от router 13.05.12 12:35:29 MSK

Как ты подсветку синтаксиса включил?

[code=bash]
...
[/code]

~~sdio~~ ★★★★★
(13.05.12 13:05:02 MSK)

Ссылка

Ответ на: комментарий от silw 13.05.12 12:26:47 MSK

шаблон нужно сначала обработать, чтобы экранировать точки.

Шаблон изменять нельзя, его используют и другие программы. А создать копию шаблона и менять - долго и костыльно.

Deleted
(13.05.12 13:15:44 MSK)

Ответ на: комментарий от anonymous 13.05.12 12:24:02 MSK

не использовать sed

Ваши предложения?

Deleted
(13.05.12 13:16:24 MSK)

Ответ на: комментарий от Deleted 13.05.12 13:16:24 MSK

вот, или python/perl/ruby

anonymous
(13.05.12 13:21:29 MSK)

Ответ на: комментарий от anonymous 13.05.12 13:21:29 MSK

grep -F

Grep-то в данном случае работает правильно, но sed - нет. Но мне нужна именно замена.

python/perl/ruby

Самосовершенствование, конечно, хорошо, но я не программист, и ради довольно-таки простых вещей python/perl/ruby учить не хочется.

Deleted
(13.05.12 13:33:14 MSK)

Ответ на: комментарий от Deleted 13.05.12 13:33:14 MSK

хорошо, но я не программис

Тогда установи mysql - так был replace как бинарь.

anonymous
(13.05.12 13:41:31 MSK)

Ссылка

Ответ на: комментарий от Deleted 13.05.12 12:13:43 MSK

Где вы увидели в моем решении костыли?

Перевод sed'ом это даже не костыли, а эпическая инвалидная коляска
Есть google translate в связке с консолью или консольная версия какого-нить stardict'а

zolden ★★★★★
(13.05.12 14:10:16 MSK)

Ответ на: комментарий от zolden 13.05.12 14:10:16 MSK

Есть google translate в связке с консолью

Нужен не перевод, а подстановка тех терминов, которые уже есть в базе.

консольная версия какого-нить stardict'а

У stardict'a свои словари. К тому же, вместо того, чтобы написать простое и легко расширяемое решение для себя, придется разбираться в чужом коде.

Deleted
(13.05.12 14:15:00 MSK)

Ответ на: комментарий от Deleted 13.05.12 12:13:43 MSK

В одном файле берется оригинал и перевод, в другом - исходный текст. При нахождении оригинала в исходном тексте оригинал заменяется на перевод.

Если пар оригинал-перевод больше одной, то такое решение (много раз проходиться sed'ом по всему файлу) является неэффективным по времени. Следует использовать алгоритм Ахо-Корасик:

http://aho-corasick.narod.ru/

http://e-maxx.ru/algo/aho_corasick

gentoo_root ★★★★★
(13.05.12 14:26:42 MSK)

Ответ на: комментарий от anonymous 13.05.12 13:21:29 MSK

perl, в отличие от sed, в виде
perl -p -i -e «s/$orig/$transl/g» «$tmpfile»
не жалуется на точки, зато не умеет обрабатывать выражения в виде «слово и/или слово, да еще при прогоне вместо „содержит кольцевой элемент“ я получил эпичное „содержиbecause�льцевой элемент“.

Deleted
(13.05.12 14:58:07 MSK)

Ответ на: комментарий от gentoo_root 13.05.12 14:26:42 MSK

Почитаю на досуге, но мне хоть как-нибудь... :(

Deleted
(13.05.12 15:00:06 MSK)

Ссылка

Ответ на: комментарий от Deleted 13.05.12 14:58:07 MSK

Похоже игнораста нашёл. Киньте ему кто-нибудь ссылку на моё предыдущее сообщение.

router ★★★★★
(13.05.12 15:03:55 MSK)

Ответ на: комментарий от Deleted 13.05.12 14:58:07 MSK

ну естественно, он же тебе не заэскейпил точки сам, а так и воспринимает их как спецсимвол в регулярном выражении.

maloi ★★★★★
(13.05.12 15:06:02 MSK)

Ссылка

Ответ на: комментарий от Deleted 13.05.12 14:58:07 MSK

Perl может все, в отличии от Вас.

anonymous
(13.05.12 15:14:33 MSK)

Ответ на: комментарий от anonymous 13.05.12 15:14:33 MSK

Да я и не сомневаюсь. :)

Deleted
(13.05.12 15:22:44 MSK)

Ссылка

Ответ на: комментарий от router 13.05.12 15:03:55 MSK

Прошу прощения, было много вариантов, решил попробовать позже. Похоже, что работает :)

Deleted
(13.05.12 15:23:29 MSK)

Ссылка

Ответ на: комментарий от Deleted 13.05.12 14:15:00 MSK

Нужен не перевод, а подстановка тех терминов, которые уже есть в базе.

gettext?

anonymous
(13.05.12 15:24:35 MSK)

Ответ на: комментарий от anonymous 13.05.12 15:24:35 MSK

Вероятно, подойдет, но я использую текстовик с оригиналом/переводом и для других целей, например, чтобы создать словарь автозамены для OpenOffice.

Deleted
(13.05.12 15:39:17 MSK)

Ссылка

Ответ на: комментарий от Deleted 13.05.12 13:15:44 MSK

зачем его менять для остальных программ? и с каких пор на шелле созлать еще одну переменную костыльно и долго?

silw ★★★★★
(13.05.12 16:15:42 MSK)

Ответ на: комментарий от silw 13.05.12 16:15:42 MSK

зачем его менять для остальных программ?

Потому что для того, чтобы sed нормально научился обрабатывать обычные текстовики, все спец. символы приходится экранировать, даже в самом файле. Выше мне подсказали костыль, как это делать без изменения файла.

и с каких пор на шелле созлать еще одну переменную костыльно и долго?

И что это такая за переменная?

Deleted
(13.05.12 18:29:13 MSK)

Ответ на: комментарий от Deleted 13.05.12 18:29:13 MSK

ты писал

sed -i "s/$orig/$transl/g" "$tmpfile"

ну сделай еще одну переменную:

orig_sed=$(echo $orig | sed 's/\./\\./g')

silw ★★★★★
(13.05.12 20:26:14 MSK)

Ответ на: комментарий от silw 13.05.12 20:26:14 MSK

Само по себе, переменную можно быстро создать. Я имел в виду, что затачивать исходный файл под sed долго и неправильно.

Deleted
(14.05.12 00:55:16 MSK)

Ответ на: комментарий от Deleted 14.05.12 00:55:16 MSK

ну так файл и не надо затачивать, только переменную обрабатывать. конечно это лишний вызов sed в каждом проходе, но разве производительность критична в данном случае?

silw ★★★★★
(14.05.12 11:59:27 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Как программно смешать входы двух-трёх звуковух для записи?

General

выбор звуковой карты из системы →

Похожие темы