Доброго времени суток, лор
Пишу простой md5 хэшэр на кутях с хранением хэшэй в mysql
нужно искать повторы хэшэй в базе, моё гугл-фу выдало запрос
select * from hashes where filehash not in (select distinct filehash from hashes)
он, в принципе, работает
вот только после того, как я просканировал /etc и /usr/include (ну там просто много файлов), получил примерно 18к записей, натравил на базу этот запрос, мускуль ушёл в себя со 100% загрузки процессора...
структура базы:
CREATE TABLE `hashes` (
`path` varchar(256) NOT NULL,
`filehash` char(32) DEFAULT NULL,
PRIMARY KEY (`path`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;