помогите с egrep

0

2

нужно найти строчки типа

3242-24-85455
3-2-42-24-85-455

т.е такие, что содержат 12 цифр и разделены минусами, но главное чтобы среди этих 12 цифр был хотя бы один минус. Придумал так:

egrep '[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]' ./*.txt

Но получается, что находит и строки без минусов. Помогите пожалуйста)

Ссылка

← Wayland и события клавиатуры

Жесткий диск будет жить или нет? →

Бей перлом, фредди!

echo -e "123-456789012\n123456789012" | perl -ne '$digit_count = $_ =~ tr/[0-9]//; $is_minus=index($_, "-") != -1; print "$_" if $digit_count==12 and $is_minus'

123-456789012

$- — текущая строка stdin, включая \n.

anonymous
(22.02.16 01:22:50 MSK)

Ссылка

grep '-'  ./*.txt | egrep '[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]'

Smola ★
(22.02.16 01:25:30 MSK)

Ответ на: комментарий от Smola 22.02.16 01:25:30 MSK

ок, а если мне надо просто вывести названия файлов? т.е grep с флагом -l

zagruzkaaa
(22.02.16 01:42:07 MSK) автор топика

Ответ на: комментарий от zagruzkaaa 22.02.16 01:42:07 MSK

grep -h "-" *.txt | grep -xE '[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]-{0,1}[0-9]'| grep -xlf - *.txt

Smola ★
(22.02.16 02:26:16 MSK)

Сделайте уже на ЛОРе раздел «ниасилил домашку».

thesis ★★★★★
(22.02.16 02:27:48 MSK)

Ответ на: комментарий от Smola 22.02.16 02:26:16 MSK

Фу. Такое же безмозглое фу, как у ТСа, только еще и в конвейере.

thesis ★★★★★
(22.02.16 02:28:30 MSK)

Ответ на: комментарий от thesis 22.02.16 02:28:30 MSK

Как предлагаешь сделать лучше?
Кроме как поменять местами первые два паттерна, ничего ее могу придумать.

Smola ★
(22.02.16 02:38:49 MSK)

Ответ на: комментарий от zagruzkaaa 22.02.16 01:42:07 MSK

То опаньки. Если надо непременно в одну команду, то заюзай сед:

[lc40222@melpulp01 ~]$ echo "123412341234" | sed -n -E -e '/\-/ !d' -e '/[[:digit:]][[:digit:]\-]{10}[[:digit:]]/ p'
[lc40222@melpulp01 ~]$ echo "123412-341234" | sed -n -E -e '/\-/ !d' -e '/[[:digit:]][[:digit:]\-]{10}[[:digit:]]/ p'
123412-341234
[lc40222@melpulp01 ~]$

Чтобы оно выводило имена файлов тебе придется склепать скриптик.

И регекс у тебя адовый получился, конечно.

alex_the_v ★★★
(22.02.16 02:44:57 MSK)

Ссылка

Ответ на: комментарий от Smola 22.02.16 02:38:49 MSK

Да, и '([0-9]-{0,1}){11}[0-9]'

Smola ★
(22.02.16 02:47:00 MSK)

Ответ на: комментарий от thesis 22.02.16 02:27:48 MSK

Ну-ка, покажи нам всем, папка.

alex_the_v ★★★
(22.02.16 02:47:56 MSK)

Ответ на: комментарий от Smola 22.02.16 02:47:00 MSK

Final edition:

grep -hxE '([0-9]-{0,1}){11}[0-9]' *.txt | grep "-" | grep -xlf - *.txt

Smola ★
(22.02.16 02:51:30 MSK)

Ответ на: комментарий от alex_the_v 22.02.16 02:47:56 MSK

Ну смотри, сына:

grep -P '\d(?!\d{11})((\d\d)|(\d\-(?!\-))|((?<!\-)\-\d)){5}\d'

thesis ★★★★★
(22.02.16 02:55:03 MSK)

Ответ на: комментарий от thesis 22.02.16 02:55:03 MSK

grep -P

Читер, это - экпериментал фича. Но ты все равно крут как скалистые горы, отец, медленно снимаю шляпу.

alex_the_v ★★★
(22.02.16 03:00:06 MSK)

Ответ на: комментарий от thesis 22.02.16 02:55:03 MSK

Точно?

[smola@HP250 tst]$ grep -P '\d(?!\d{11})((\d\d)|(\d\-(?!\-))|((?<!\-)\-\d)){5}\d' *.txt
1.txt:12345678901-2
1.txt:1234567890-1-2
1.txt:12345-67890-1-2
1.txt:12345-67890-1-2ee
1.txt:1112345-67890-1-2ee
1.txt:1112345-67890-1-2
2.txt:12345-67890-1-2
2.txt:12345-67-890-1-2
3.txt:1234-56890-12

[smola@HP250 tst]$ grep '' *.txt
1.txt:12345678901-2
1.txt:1234567890-1-2
1.txt:12345-67890-1-2
1.txt:12345-67890-1-2ee
1.txt:1112345-67890-1-2ee
1.txt:1112345-67890-1-2
2.txt:12345-67890-1-2
2.txt:12345-67-890-1-2
2.txt:123456789012
3.txt:123456789012
3.txt:1234-56890-12

Smola ★
(22.02.16 03:00:52 MSK)

Ответ на: комментарий от Smola 22.02.16 03:00:52 MSK

У тебя так же будет, ты че думал. \b в начало и в конец добавить надо.

alex_the_v ★★★
(22.02.16 03:02:49 MSK)
Последнее исправление: alex_the_v 22.02.16 03:03:13 MSK (всего исправлений: 1)

Ответ на: комментарий от alex_the_v 22.02.16 03:02:49 MSK

У меня все норм:

$ grep -hxE '([0-9]-{0,1}){11}[0-9]' *.txt | grep "-" | grep -xf - *.txt
1.txt:12345678901-2
1.txt:1234567890-1-2
1.txt:12345-67890-1-2
2.txt:12345-67890-1-2
2.txt:12345-67-890-1-2

Smola ★
(22.02.16 03:04:57 MSK)

Ответ на: комментарий от alex_the_v 22.02.16 03:00:06 MSK

Да чего там экспериментал, перл же. Т.е. не грепом же единым.
Иначе хез как быть без конвейера.

thesis ★★★★★
(22.02.16 03:06:04 MSK)

Ответ на: комментарий от Smola 22.02.16 03:00:52 MSK

УМВР. Grep 2.20, CentOS7. Что за греп у тебя?

thesis ★★★★★
(22.02.16 03:07:20 MSK)
Последнее исправление: thesis 22.02.16 03:07:55 MSK (всего исправлений: 1)

Ответ на: комментарий от Smola 22.02.16 03:04:57 MSK

А, ну да, у тебя там -x, сорри.

alex_the_v ★★★
(22.02.16 03:07:49 MSK)

Ссылка

Ответ на: комментарий от thesis 22.02.16 03:07:20 MSK

grep (GNU grep) 2.23

Smola ★
(22.02.16 03:08:57 MSK)

Ссылка

Ответ на: комментарий от thesis 22.02.16 03:06:04 MSK

Да чего там экспериментал

Ну, например не выйдет -x воткнуть как Смола сделал. В грепе перловые регекспы частенько через одно место работают. Лучше уж тогда прямо перл и юзать, он тоже практически вездесущ.

alex_the_v ★★★
(22.02.16 03:19:24 MSK)

Ссылка

Ответ на: комментарий от thesis 22.02.16 03:07:20 MSK

У меня, кстати, тоже не пашет:

[lc40222@melpulp01 ~]$ echo "12341234-1234adsf" | grep -P '\d(?!\d{11})((\d\d)|(\d\-(?!\-))|((?<!\-)\-\d)){5}\d'
12341234-1234adsf
[lc40222@melpulp01 ~]$ grep -V
grep (GNU grep) 2.20

alex_the_v ★★★
(22.02.16 03:20:15 MSK)

Ответ на: комментарий от Smola 22.02.16 02:51:30 MSK

У меня, кстати, еще и регексп косячный, матчит 10 цифр или минусов. Твой правильней.

alex_the_v ★★★
(22.02.16 03:24:43 MSK)

Ссылка

Ответ на: комментарий от alex_the_v 22.02.16 03:20:15 MSK

Прикольно. УМВР. А что за дистр?
ЗЫ: напрашивается вывод «греп крив, регексп крут».

Если кому не лениво, прогоните перлом:

perl  -nle 'print "$&" if /\d(?!\d{11})((\d\d)|(\d\-(?!\-))|((?<!\-)\-\d)){5}\d/' rexptest.txt

# cast

Smola

thesis ★★★★★
(22.02.16 03:38:49 MSK)
Последнее исправление: thesis 22.02.16 03:44:37 MSK (всего исправлений: 2)

OMG! KISS

egrep '[0-9-]{13,23}'

Т.е. у нас любая комбинация с минимум 12 цифр и даш и до 12 цифр и 11 дашей и всё что посередине. Остальное можно вычистить во втором проходе.

PS: Some people, when confronted with a problem, think «I know, I'll use regular expressions.» Now they have two problems.

beastie ★★★★★
(22.02.16 04:12:05 MSK)
Последнее исправление: beastie 22.02.16 04:15:16 MSK (всего исправлений: 4)

Ответ на: комментарий от thesis 22.02.16 03:38:49 MSK

Обрезает строки:

[smola@HP250 tst]$ perl  -nle 'print "$&" if /\d(?!\d{11})((\d\d)|(\d\-(?!\-))|((?<!\-)\-\d)){5}\d/' all.txt 
2345678901-2
1234567890-1
2345-67890-1
2345-67890-1
1112345-6789
1112345-6789
2345-67890-1
12345-67-890
1234-56890-1
[smola@HP250 tst]$ cat  all.txt
12345678901-2
1234567890-1-2
12345-67890-1-2
12345-67890-1-2ee
1112345-67890-1-2ee
1112345-67890-1-2
12345-67890-1-2
12345-67-890-1-2
123456789012
123456789012
1234-56890-12

Smola ★
(22.02.16 04:21:36 MSK)
Последнее исправление: Smola 22.02.16 04:22:59 MSK (всего исправлений: 1)

Ответ на: комментарий от thesis 22.02.16 03:38:49 MSK

[lc40222@melpulp01 ~]$ cat /etc/redhat-release
CentOS release 6.7 (Final)
[lc40222@melpulp01 ~]$ echo -ne "1234-1234-1234\n3216-6547-9874sdfasdfa\n" >rexptest.txt
[lc40222@melpulp01 ~]$ perl  -nle 'print "$&" if /\d(?!\d{11})((\d\d)|(\d\-(?!\-))|((?<!\-)\-\d)){5}\d/' rexptest.txt
1234-1234-12
3216-6547-98

Я ж тебе говорил, что -P не рулит =)

alex_the_v ★★★
(22.02.16 05:53:32 MSK)

Ответ на: комментарий от beastie 22.02.16 04:12:05 MSK

Правильно говорят: простота хуже воровства. На втором проходе вычистить мы тут все такие умные. Ты в один регексп попробуй, вон Тезис хоть и владеет кунг фу, а тоже лажанул немного.

Мистер загрузкааааа, маза, даже не ожидал такого живого интереса к своей проблеме =)

alex_the_v ★★★
(22.02.16 06:02:11 MSK)