Собственно, требуется прочитать некий текстовик (или html) в строку и найти в ней указанную фразу.
Чем и как это лучше сделать? В голове летает мысль выпилить все предлоги/союзы/знаки препинания, разбить строку по пробелам в массив, с помощью pymorphy привести каждый элемент в начальную форму, собрать строку обратно, ну и искать. Но создается впечатление, что что-то здесь не так.
Системы, вроде Sphynx ищут по собственным таблицам индекса, что не приемлимо.