Вопрос по регулярному выражению

0

0

В текстовом файле есть две идентичные строки, каждая начинается с новой строки, одна строка с точкой на конце, вторая без точки.

Нужно удалить строку с точкой в конце.

Целый день ломал голову, как сделать это через sed, возможно есть другие варианты ?

Подскажите, пожалуйста.

Ссылка

← uWSGI+django

Использование map без возвращаемого значения →

sed '/^string\./d'

nerve ★★
(07.08.17 17:01:22 MSK)
Последнее исправление: nerve 07.08.17 17:01:45 MSK (всего исправлений: 1)

echo -e '1\n1.\n1' | sed -e '/^.*\.$/d'

quester ★★
(07.08.17 17:07:19 MSK)

Ссылка

sed '/^string\.$/d'

anonymous
(07.08.17 17:07:23 MSK)

Ссылка

grep -v "\.$" filename

superuser ★★★★☆
(07.08.17 17:09:59 MSK)
Последнее исправление: superuser 07.08.17 17:11:59 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от nerve 07.08.17 17:01:22 MSK

Суть в том, что в реальном примере - таких строк больше тысячи. Каждые две идентичны друг другу и одна из них с точкой, следующая пара снова повторяется и идентичны только себе, но опять одна строка из пары с точкой и т.д.

Как быть в этом случае ?

gamble
(07.08.17 17:12:12 MSK) автор топика

Ответ на: комментарий от gamble 07.08.17 17:12:12 MSK

Хреновый из тебя ПМ - не умеешь чётко ставить задачу.

Скорее всего, задача должна звучать приблизительно так: «Удалить из файла все строки с точкой в конце при условии, что в этом же файле есть такая же строка без тоски в конце».

Варианты правильных ответов:

1) man shell, man grep, man sed

2) man awk

anonymous
(07.08.17 17:25:12 MSK)

Ответ на: комментарий от anonymous 07.08.17 17:25:12 MSK

Я чётко поставил задачу. Есть текстовый файл, в нём 1553 строк, которые начинаются с новой строки.

Каждая пара идентична друг другу, но одна строка из пары - с точкой. И так далее, по той же схеме.

У вас нет верного решения ? Маны мне не помогут, я перебираю это всё с 9 утра

gamble
(07.08.17 17:33:20 MSK) автор топика

Ответ на: комментарий от gamble 07.08.17 17:33:20 MSK

Маны мне не помогут, я перебираю это всё с 9 утра

Найми специалиста.

anonymous
(07.08.17 17:35:40 MSK)

Ссылка

grep '\.$' < myfile |
sed 's/\.$//'>dotlines
grep -F -v -x -f dotlines < myfile > result

Можно ещё на awk сохранять строки в массив и фильтровать.

legolegs ★★★★★
(07.08.17 17:36:42 MSK)

Ответ на: комментарий от gamble 07.08.17 17:33:20 MSK

sed '/.*\.$/d'

anonymous
(07.08.17 17:38:37 MSK)

Ответ на: комментарий от legolegs 07.08.17 17:36:42 MSK

первый grep - лишний, промежуточный «dotlines» - избыточен.

anonymous
(07.08.17 17:39:32 MSK)

Ответ на: комментарий от anonymous 07.08.17 17:38:37 MSK

sed '/\.$/d'

Fixed.

anonymous
(07.08.17 17:40:40 MSK)

Ссылка

Ответ на: комментарий от anonymous 07.08.17 17:38:37 MSK

Да ! Работает ! Благодарю !!!

gamble
(07.08.17 17:41:05 MSK) автор топика

Ответ на: комментарий от anonymous 07.08.17 17:39:32 MSK

Лишний, но я плохо знаю sed. Промежуточный файл можно заменить на <() но затруднится отладка.

legolegs ★★★★★
(07.08.17 17:41:59 MSK)

Ссылка

Ответ на: комментарий от gamble 07.08.17 17:41:05 MSK

Ниже еще короче.

Просто удаляет все строки с точкой в конце.

anonymous
(07.08.17 17:43:32 MSK)

Ссылка

Ответ на: комментарий от gamble 07.08.17 17:41:05 MSK

Так одинокие строки с точкой надо сохранять?

legolegs ★★★★★
(07.08.17 17:46:57 MSK)

Ответ на: комментарий от legolegs 07.08.17 17:46:57 MSK

Гениальность решения как в раз в том, что удаления строк с точкой на конце достаточно, если всё ровно так, как описывает топикстартер.

А в том, что там могут быть и строки не следующие в «парах» - в общем-то никто не виноват, кроме самого вопрошающего. Если решать задачу «в лоб» по принципу «за что купил» (оно же «наот*бись») - то решение с удалением однозначно верное.

DRVTiny ★★★★★
(07.08.17 20:11:11 MSK)

Ссылка

Мне почему-то кажется, что это правильнее простого удаления...

echo -e '123\n123.\n678\n947.\n456\n456.\n789\n789.' | sed -nr 'N; s/^(.+)\n\1./\1/; p'
123
678
947.
456
789

DRVTiny ★★★★★
(07.08.17 20:29:35 MSK)

Ответ на: комментарий от gamble 07.08.17 17:33:20 MSK

Я чётко поставил задачу. Есть текстовый файл, в нём 1553 строк, которые начинаются с новой строки.
Каждая пара идентична друг другу, но одна строка из пары - с точкой. И так далее, по той же схеме.

Если они парные, то почему их нечётное количество?

Stil ★★★★★
(08.08.17 01:19:11 MSK)

Ссылка

Ответ на: комментарий от DRVTiny 07.08.17 20:29:35 MSK

echo -e '123\n123.\n678\n947.\n456\n456.\n789\n789.' | sed -nr 'N; s/^(.+)\n\1./\1/; p'

Маленький баг:

echo -e '123\n123.\n678\n947.\n456\n456.\n789\n789'a | sed -nr 'N; s/^(.+)\n\1./\1/; p'
123
678
947.
456
789

Заодно, вариант для того, чтобы не убирало строки из одной точки и следующей из двух:

echo -e '123\n123.\n678\n947.\n456\n456.\n789\n789a\n.\n..' | sed -nr 'N; s/^(.*[^.])\n\1\./\1/; p'
123
678
947.
456
789
789a
.
..

vodz ★★★★★
(08.08.17 15:50:52 MSK)

Ответ на: комментарий от vodz 08.08.17 15:50:52 MSK

Yes, you right! :)

DRVTiny ★★★★★
(08.08.17 16:12:26 MSK)

Ответ на: комментарий от DRVTiny 08.08.17 16:12:26 MSK

sed "s/you/you're/"

anonymous
(08.08.17 18:40:04 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← uWSGI+django

Development

Использование map без возвращаемого значения →

Похожие темы