bash - найти вхождения в файл

0

1

Приветствую! Вот не могу сообразить:
есть два файла, первый вида:
1
2
3
4
5
Нужно:
вывести в другой файл все строки из второго, в которых вcтречаются строки из первого + слово(например, test) Например:
1 файл
123
456
789

2 файл
aaa gdfgd 333 123 test
aaa ffds 333 345 test
aaa fsf 434 789 test
aaa 4gdf 453 789 test1

Слово test
На выходе должно получиться:
aaa gdfgd 333 123 test
aaa fsf 434 789 test

Прошу совета
Я правильно думаю что это надо реализовывать через sed?

Ссылка

← [Просьба] тест патча ядра на Advanced Format дисках (4k sector)

Приоритеты потоков →

Не парься и напиши этот фильтр на перле или руби.

~~geekless~~ ★★
(01.03.11 07:08:52 MSK)

Ответ на: комментарий от geekless 01.03.11 07:08:52 MSK

тоже как вариант
можно пример? не особо силён в этих языках
я понимаю что нужно построчно прочитать файл, найти входжение, записать строку, проверить на наличие слова и записать

CepbIu
(01.03.11 07:43:27 MSK) автор топика

grep?

Sinensis
(01.03.11 07:49:01 MSK)

Ответ на: комментарий от CepbIu 01.03.11 07:43:27 MSK

Набросал псевдокод на Руби. Работоспособность не проверял.

# Читаем файл со списком ключей, заполняем хэш:
search_keys = {}
IO.read(filename1).each_line { |line| search_keys[line.strip] = 1 }

# Читаем и фильтруем stdin:
STDIN.read.each_line do |line|
	line = line.strip.split(' ')
	puts line.join(' ') if line[4] == 'test' && search_keys.has_key?(line[3])
end

~~geekless~~ ★★
(01.03.11 07:52:59 MSK)

Ответ на: комментарий от geekless 01.03.11 07:52:59 MSK

Хотя изменение полей строки не требуется же, поэтому лучше без join-а:

STDIN.read.each_line do |line|
   l = line.strip.split(' ')
   puts line if l[4] == 'test' && search_keys.has_key?(l[3])
end

~~geekless~~ ★★
(01.03.11 07:57:52 MSK)

Ответ на: комментарий от geekless 01.03.11 07:57:52 MSK

не подоёдет, тк не известно в каком l будет

CepbIu
(01.03.11 08:09:41 MSK) автор топика

Ответ на: комментарий от Sinensis 01.03.11 07:49:01 MSK

можно подсказку?
не могу сообразить как сделать

CepbIu
(01.03.11 08:11:21 MSK) автор топика

Ответ на: комментарий от CepbIu 01.03.11 08:09:41 MSK

Ну так передавай в параметрах. Я тебе алгоритм показал, а не готовую программу.

~~geekless~~ ★★
(01.03.11 08:11:35 MSK)

Ответ на: комментарий от CepbIu 01.03.11 08:11:21 MSK

Или у тебя в произвольном месте строки могут стоять данные? Тогда либо длиииииинную регулярку нарисовать, либо перебирать в цикле элементы l в моём примере.

~~geekless~~ ★★
(01.03.11 08:18:24 MSK)

Ответ на: комментарий от geekless 01.03.11 08:11:35 MSK

мне может быть не известно где оно
алгоритм я сам написал выше

CepbIu
(01.03.11 08:18:29 MSK) автор топика

Ссылка

Ответ на: комментарий от geekless 01.03.11 08:18:24 MSK

долго и нудно

CepbIu
(01.03.11 08:24:17 MSK) автор топика

Ответ на: комментарий от CepbIu 01.03.11 08:24:17 MSK

Регулярка

Осторожно, быдлокод!

"(" + IO.read(filename).each_line.select {|v| v.strip != «» } .map {|v| Regexp.quote v.strip} .join(«|») + ")\stest"

~~geekless~~ ★★
(01.03.11 08:30:30 MSK)

Ссылка

Ответ на: комментарий от CepbIu 01.03.11 08:11:21 MSK

grep -f file1.txt file2.txt | grep -w test >> file3.txt

anonymous
(01.03.11 08:51:09 MSK)

Ответ на: комментарий от CepbIu 01.03.11 08:11:21 MSK

Так как Вам нужно чтобы последовательности символов во втором файле были отделены от остальных пробелами, то можно так:

grep -wf file1.txt file2.txt | grep -w test >> file3.txt

Sinensis
(01.03.11 08:58:37 MSK)

Ответ на: комментарий от Sinensis 01.03.11 08:58:37 MSK

на выходе
aaa gdfgd 333 123 test
строки не хватает, те так только смотрит по первой строке файла 1

CepbIu
(01.03.11 09:33:39 MSK) автор топика

Ответ на: комментарий от CepbIu 01.03.11 09:33:39 MSK

все там правильно, ищите ошибки в том, как вы перепечатали команду. Скорее всего вы упустили -f в первом грепе.

silw ★★★★★
(01.03.11 09:35:00 MSK)

Ответ на: комментарий от anonymous 01.03.11 08:51:09 MSK

спасиюо, то что нужно

CepbIu
(01.03.11 09:35:05 MSK) автор топика

Ссылка

Ответ на: комментарий от silw 01.03.11 09:35:00 MSK

grep -f file1.txt file2.txt | grep -w test >> file3.txt работает
если в первом поставить w - то нет

CepbIu
(01.03.11 09:39:50 MSK) автор топика

Ссылка

Ответ на: комментарий от geekless 01.03.11 07:08:52 MSK

А неделю назад этот курсовик тут решили таки на баше...

Shtucer ★
(01.03.11 09:41:29 MSK)

Ответ на: комментарий от Shtucer 01.03.11 09:41:29 MSK

Ну я думал, ТСу нужно искать по полям, а не вхождения в любом месте строки.

~~geekless~~ ★★
(01.03.11 09:49:49 MSK)

Ссылка

Ответ на: комментарий от Shtucer 01.03.11 09:41:29 MSK

можно по подробнее? мне уже хочется понять логику человека, почему он захотел писать ~10 строк кода, вместо того что бы воспользоваться тем что уже изначально есть

CepbIu
(01.03.11 09:50:26 MSK) автор топика