LINUX.ORG.RU

Как с текстового файла поудалять все английские слова и символы?

 , ,


0

2

В общем хочу с помощью festival озвучить мои книги и залить на телефон. Но вот если в тексте попадаются английские символы, то фестиваль матерится и выдает: LTS_Ruleset russian_downcase: no rule matches: LTS_Ruleset: # *here* — # Может кто решал такие проблемы, буду рад советом.

sed "s,[a-z],,gi" <in.txt >out.txt

Но возможно в твоём случае можно как-то лучше сделать, например читать другим голосом или преобразовать как транслит.

Deleted ()
Ответ на: комментарий от ziemin

Сплошной «мгимо финишд» получится Ж)

ИМХО это лучше, чем пропавшие слова посреди предложения =).

Deleted ()
Ответ на: комментарий от lazyklimm

Отдельные фразы слушал, так ничего, качество звучания удовлетворяет.

sergej-kulja ()

поудалять все английские слова и символы

А дальше что? Русские ракеты долетают только до океанского дна, а всё остальное даже недостойно упоминания.

anonymous ()
Ответ на: комментарий от sergej-kulja

Еще не распознает @,#,$,%,^,&,*,~,-,_ Как и это удалить?

Тогда уж проще наоборот сделать:

sed "s,[^а-я.\, ()0-9],,gi" <in.txt | xargs >out.txt

Deleted ()
Ответ на: комментарий от Deleted

О, спасибо, это помогло. Вот только еще осталось подкорректировать произношение. А то произношение не очень. например загадочное читает как загадошное, также где надо читать «ё», читает «е» и т.д.

sergej-kulja ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.