вобшем задача такая: есть несколько серверов, на них где-то по теробайте файлов, необходимо определять какой файл присуцвует на каком из серверов. ну или на нескольких серверах сразу. возможный вариант решения задачи: создать базу сигнатур файлов обшую для всех серверов, в которой в часности есть урла файла и его сигнатура. база по мере появление / изменения / удаления файлов обновляется. так вот вопрос: как "дешевле" получать сигнатуру файла? какую шэш функцию использовать? была еше мысля шитать контрольную сумму скажем из каждого 100го байта + хэш длины файла. вобшем принимаются любые предложения / мысли / примеры ЗЫ: только без "зачем изобретать велосипед?" это только часть задачи.