Допустим есть некий полностью абстрактный текст - просто набор байт. Но это для прораммы он является набором байт, для человека это может быть осмысленным текстом. Нужно как-то выделить из этого текста отдельные слова. Т.е. нужно искать повторяющиеся последовательности байтов. Причём надо с одной стороны искать и не маленькие последовательности (буквы, слоги), но и не сильно длинные (повторяющиеся словосочетания, предложения). Возможно ли это? И может есть какие-нибудь алгоритмы? Что-то вечером в голову ничего путного не приходит...