Надо разделить текстовую строчку по знакам препинания и EOL. Нужно сохранить разделители, чтобы потом можно было собрать абзац (все элементы запихиваются в базу).
Я сделал вот такое (python):
re.split("([\.,:;!\?]?\s)", S)
Но возвращает лишние значения в конце списка. Подскажите более грамотный регексп, плиз.
Да, в конце строки может не оказаться EOL (напр. конец файла).