Как из одного txt файла удалить все строки которые встречаются в другом txt файле

0

2

Всем доброго времени суток! Как из одного txt файла удалить все строки которые встречаются в другом txt файле. Пример строк в файлах: 1.txt:

http://site1.com/statii.php?id=10869

https://site2.com/bbs/viewtopic.php?f=6&t=1385&start=30

http://site3.com/index.php?topic=993.0;wap2

2.txt:

http://site10.com/statii.php?id=10869

https://site2.com/xmct.phplvg=27_Investor&Relations_3442/allitem=on

http://site30.com/index.php?topic=993.0;wap2

должен выйти результат: result.txt:

http://site1.com/statii.php?id=10869

http://site3.com/index.php?topic=993.0;wap2

Ну нужно сравнивать не полностью всю строку, а только домены которые находяться между символами //тут домен/

Ссылка

← Помогите дёрнуть базу телефонных номеров с avito.ru по регионам?

Обмен данными между двумя формами pyqt5 →

Если не страшна потеря порядка:

cat /tmp/{a,b} | sort -b | uniq -u > /tmp/result.txt

anonymous
(28.12.16 12:49:53 MSK)

Есть команда

comm

Почитай

man comm

kostik87 ★★★★★
(28.12.16 12:51:23 MSK)

Ответ на: комментарий от anonymous 28.12.16 12:49:53 MSK

Спасибо большое но данная команда проверяет на дубли целые строки в файлах, а мне нужно чтоб проверка на дубли была между символами //любой текст/

Karpov680
(28.12.16 14:25:50 MSK) автор топика

Ссылка

Если правильно, то вот так:

 perl -e 'open($fAll, "<file.txt"); open($fExcl, "<excl.txt"); foreach (<$fExcl>) { $host=$_; $host =~ s#^.+//##g; $host =~ s#/.*##g; $hash{$host}=1} foreach (<$fAll>) {$host=$_; $host =~ s#^.+//##g; $host =~ s#/.*##g; if (!exists($hash{$host})) {print $_}} '

Свои некорректные комментарии удалил.

PHPFan
(28.12.16 14:52:58 MSK)

Ответ на: комментарий от PHPFan 28.12.16 14:52:58 MSK

Спасибо большое все работает. хотел еще спросить, как сделать чтоб результат сохраняло в txt файл, а не выводило результат в терминале

Karpov680
(28.12.16 15:03:27 MSK) автор топика

Ответ на: комментарий от Karpov680 28.12.16 15:03:27 MSK

Пожалуйста. :) В конце команды можно добавить > [файл]. Например,

perl -e '...' > rezultat.txt

PHPFan
(28.12.16 15:06:56 MSK)

Ссылка

grep -o '//[^/]\+/' 2.txt | grep -vFf - 1.txt > result.txt

Jini ★★
(28.12.16 16:41:54 MSK)
Последнее исправление: Jini 28.12.16 16:43:28 MSK (всего исправлений: 2)

Ссылка

ммм, задание на собеседование, да?

anonymous
(28.12.16 17:21:09 MSK)

Ссылка

Каждый год в зимнюю сессию ~~мы с друзьями ходим в баню~~ я вижу на ЛОРе этот вопрос в незначительно отличающемся виде. А во время семестра учиться не судьба была?

~~redgremlin~~ ★★★★★
(28.12.16 17:45:20 MSK)

Ссылка

moreutils/combine

anonymous
(28.12.16 21:14:13 MSK)

Ссылка

Ответ на: комментарий от PHPFan 28.12.16 14:52:58 MSK

Поэтому перл и умер.

~~entefeed~~ ☆☆☆
(28.12.16 21:18:53 MSK)

Ссылка

Ответ на: комментарий от kostik87 28.12.16 12:51:23 MSK

Самый правильный коммент ТС и не заметил. Типично.

legolegs ★★★★★
(28.12.16 21:29:59 MSK)

Ответ на: комментарий от legolegs 28.12.16 21:29:59 MSK

какой комент?

Karpov680
(28.12.16 21:34:37 MSK) автор топика

Ответ на: комментарий от Karpov680 28.12.16 21:34:37 MSK

Тот, на который я ответил.

legolegs ★★★★★
(28.12.16 23:36:49 MSK)

Ответ на: комментарий от legolegs 28.12.16 23:36:49 MSK

а чем утилита comm лучше чем решения на перле?

Karpov680
(28.12.16 23:41:42 MSK) автор топика

Ответ на: комментарий от Karpov680 28.12.16 23:41:42 MSK

Тем, что у неё есть документация, а что делает код на перле уже через месяц не вспомнишь.

legolegs ★★★★★
(29.12.16 10:06:06 MSK)

Ссылка

Можешь модифицировать этот велосипед:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <err.h>

void help(char* name){
	printf("\nUsage:\n\t%s <file1> <file2>\n\t\tprint lines of <file1>, that not present in <file2>\n", name);
	printf("\t%s -v <file1> < file2>\n\t\tshows lines of <file1>, that present in <file2>\n", name);
	exit(0);
}

int main(int argc, char** argv){
	char *buf, *F1, *F2, *ptr, *ptr1;
	int file1, file2, n = 0, Vflag = 0;
	long size1, size2;
	struct stat St;
	if(argc < 3 || strcmp(argv[1], "-h") == 0 || strcmp(argv[1], "--help")  == 0) help(argv[0]);
	if(strcmp(argv[1], "-v") == 0){ Vflag = 1; n = 1;}
	if( stat(argv[n+1], &St) < 0) err(1, "\n\tCan't stat %s", argv[n+1]);
	size1 = St.st_size;
	if( stat(argv[n+2], &St) < 0) err(2, "\n\tCan't stat %s", argv[n+2]);
	size2 = St.st_size;
	file1 = open(argv[n+1], O_RDONLY);
	if(file1 < 0) err(3, "\n\tCan't open %s", argv[n+1]);
	file2 = open(argv[n+2], O_RDONLY);
	if(file2 < 0) err(4, "\n\tCan't open %s", argv[n+2]);
	buf = malloc(16385); // буфер для строки
	F1 = malloc(size1 + 1); // содержимое файла 1
	ptr1 = F1;
	F2 = malloc(size2 + 1); // содержимое файла 2
	if(read(file1, F1, size1) != size1) err(5, "\n\tCan't read %s", argv[n+1]);
	F1[size1] = 0;
	close(file1);
	if(read(file2, F2, size2) != size2) err(6, "\n\tCan't read %s", argv[n+2]);
	F2[size2] = 0;
	close(file2);
	while(ptr1){
		ptr = strchr(ptr1, '\n');
		if(ptr) *ptr = 0;
		strncpy(buf, ptr1, 16384);
		if(strstr(F2, buf) == NULL){ if (Vflag == 0) printf("%s\n", buf);}
		else if(Vflag == 1) printf("%s\n", buf);
		if(ptr) ptr1 = ptr + 1;
		else ptr1 = NULL; // конец строки
	}
	free(buf); free(F1); free(F2);
	exit(0);
}

anonymous
(29.12.16 12:11:37 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Помогите дёрнуть базу телефонных номеров с avito.ru по регионам?

Development

Обмен данными между двумя формами pyqt5 →

Похожие темы