Всем привет! Не могу понять, как разбить текст на слова. То есть допустим на вход даётся строка «этопримертекста», а на выходе нужно получить список слов в виде массива [«это», «пример», «текста»] или в виде текста «это пример текста», неважно. Язык, на котором написаны слова, не важен. Язык программирования тоже неважен. Для упрощения можно использовать только топ-100 или топ-1000 самых популярных слов. Также нужно, чтобы сложность была не экспоненциальная, то есть надо использовать наверное какие-нибудь эвристики. Также нужна устойчивость к опечаткам, поэтому алгоритм бойера-мура не подойдёт. Также нужно это сделать без использования нейросетей
Перемещено Dimez из general