Разделение записей в awk

0

1

Хочу посчитать кол-во вхождения слова в файле. Сейчас, программа считает строки где есть искомое слово и переходит к следующей строке, т.е. если в строке одно или более слово, он считает его за одно. Поставил разделитель записей RS=" " - не помогло. В чем проблема?

BEGIN { i=0; RS=" "; } /cat/ { i++; } END { print «count: » i; }

Ссылка

← MyGUI - избавиться от предупреждений

Обрезание части вывода gcc →

УМВР

~$ cat > /tmp/1
cat cat cat
^D
~$ cat /tmp/1 | awk 'BEGIN { i=0; RS=" "; } /cat/ { i++; } END { print "count: " i; }'
count: 3

Может у вас разделитель tab?

~~hexdump01010101~~
(25.10.12 23:41:26 MSK)

Ответ на: комментарий от hexdump01010101 25.10.12 23:41:26 MSK

Не совсем, оказывается переход на новую строку теперь он не считает разделителем. Теперь новый вопрос: как сделать чтоб и то, и то считалось разделителем?

MarvinParanoid
(26.10.12 00:03:45 MSK) автор топика

Ответ на: комментарий от MarvinParanoid 26.10.12 00:03:45 MSK

man awk

anonymous
(26.10.12 00:04:49 MSK)

Ссылка

Ответ на: комментарий от MarvinParanoid 26.10.12 00:03:45 MSK

Вроде работает:

RS="(\\n| )"

~~hexdump01010101~~
(26.10.12 00:18:14 MSK)

Ссылка

В AWK есть Record Separator и Field Separator.

Чтобы и то, и другое сделать одним и тем же разделителем, ЕМНИП, необходимо регулярное выражение, а регулярные выражения в качестве разделителей поддерживаются только в gawk.

Я бы так написал:

BEGIN {
        count = 0; #Для красоты вывода, если слов нет
}

{
   for(i = 1; i <= NF; i++) if(tolower($i) == "cat") count++;
}

END {
   print "count: " count;
}

proud_anon ★★★★★
(26.10.12 00:24:24 MSK)