Нужно отчекрыживать из статей/блогозаписей шапку, чтобы формировать ленту «нового». Подскажите, где реализованы хорошие алгоритмы подобного. Фишка в том, что нужно примерно ограничивать высоту контента, и результат зависит от содержимого. Например, есть ли картинки, таблицы и т.п.
Вариант тупо переклеить текстовые ноды в один параграф и обкоцать длину уже есть, но хочется получше.
Где-то уже видел более продвинутые реализации, но никак не могу найти. Достаточно будет просто ссылки на готовые проекты, на любом языке. Изобретать на ходу не вижу смысла - наверняка такая задача уже сто раз решалась.