Доброго дня.
у меня есть строка такого вида:
«test тест ÄäÖöÅå тест täällä и здесь тест». Строка UTF-8
Мне нужно вытащить из нее все русские слова питоном.
То есть должно получиться что-то типа
'тест', 'тест', 'и здесь тест'
Уже второй день сижу ничего не могу сделать.
пробовал выражение re.compile(ur'([^a-zA-zÄäÖöÅå]+)', re.U).
findall вытаскивает все ÄäÖöÅå наружу вместе с русскими символами.
То есть
' тест ÄäÖöÅå тест ', 'ää', 'ä и здесь тест'
Такое вообще возможно сделать питоном?