LINUX.ORG.RU

sed 's/Ё/E/g;s/ё/e/g' -i file

silw ★★★★★
()
sed -e 's/Ё/Е/g' -e 's/ё/е/g' -i
[ megabaks@desktop ] ~ $ cat lor-ё 
Как одной командой заменить в файле все буквы "Ё" на "Е" и все случаи "ё" на "е"ёёёёёёёёёёёёёёёЁЁЁЁЁЁЁЁЁЁЁЁЁЁ?
[ megabaks@desktop ] ~ $ sed -e 's/Ё/Е/g' -e 's/ё/е/g' -i lor-ё 
[ megabaks@desktop ] ~ $ cat lor-ё 
Как одной командой заменить в файле все буквы "Е" на "Е" и все случаи "е" на "е"еееееееееееееееЕЕЕЕЕЕЕЕЕЕЕЕЕЕ?
[ megabaks@desktop ] ~ $ 
megabaks ★★★★
()

sed -i 'y/ёЁ/еЕ/' file ?

AITap ★★★★★
()

Это задача тривиальная. Вот бы научить все «ё», записанные как «е» как положено менять :)

KRoN73 ★★★★★
()
Ответ на: комментарий от KRoN73

Это тоже тривиальная задача, если текст грамотный. Если есть словарь, то все сведется к простому поиску, сравнению, принятию решения. Или есть какие-то нестандартные идеи?

cdshines ★★★★★
()
Ответ на: комментарий от silw

сажаешь студентку какого-нить педвуза

Ога. Она и напишет Алёхина вместо Алехина или «афёру» вместо «аферы» :) Проблема замены буквы «ё» не только в том, что люди начинают терять «ё» во всяких «манёврах», Афанасиях Фётах или Фрёйдах, но и в том, что начинают, наоборот, лепить «ё» туда, куда не надо :)

KRoN73 ★★★★★
()
Ответ на: комментарий от cdshines

Если есть словарь, то все сведется к простому поиску, сравнению, принятию решения
то все сведется

Все или всё? :)

KRoN73 ★★★★★
()
Ответ на: комментарий от power

Не нужно же.

Татьяныч, перелогиньтесь! :)

KRoN73 ★★★★★
()
$ echo еееёёёЕЕЕЁЁЁ | tr 'Ёё' 'Ее'
ееееееЕЕЕЕЕЕ
feinsbot
()
Ответ на: комментарий от KRoN73

Зачем? Использовать «ё» рекомендуется только в сложных топонимах, именах, а также в детской литературе и литературе для иностранцев по изучению русского языка.

Deleted
()
Ответ на: комментарий от cdshines

Все

Осталось обучить таким правилам скрипт :)

Хотя словарь поможет хотя бы на известных фамилиях и наиболее часто путаемых словах. Пожалуй, стоит на форум прикрутить :)

KRoN73 ★★★★★
()
Ответ на: комментарий от KRoN73

Ох, очередной ё-срач.

Не понимаю, почему в таких случаях все вспоминают Лебедева. Он вообще-то не из своей головы все это взял. Открой любое советское издание не для детей и попробуй отыскать там «лёд», «афёру» и прочее.

В подавляющем большинстве случаев е-ё запросто восстановить из контекста, а язык стремится к упрощению, это нормально. Те, кто бьет истерику о смерти «ё», пускай сначала выпьют за упокой хотя бы ятя.

Deleted
()
Ответ на: комментарий от KRoN73

Контекст - великая штука. Если представить, что его вдруг нет, тогда нужно и ударения в каждом слове ставить.

Deleted
()
Ответ на: комментарий от Deleted

В подавляющем большинстве случаев е-ё запросто восстановить из контекста

А как скрипт поймет контекст?

TGZ ★★★★
()
Ответ на: комментарий от KRoN73

не поймёт, когда «планер», а когда «планёр»

А что, есть разница?

А вот если из контекста не ясно «все» или «всē», тогда надо писать «ē».

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от TGZ

Это я к тому, что скрипт не нужен.

Deleted
()
Ответ на: комментарий от Deleted

Не понимаю, почему в таких случаях все вспоминают Лебедева

Потому что он флагман :)

Открой любое советское издание не для детей и попробуй отыскать там «лёд»

См. выше про экономию свинца.

«афёру»

Гы. «Афёру». Вот и ещё одна жертва убирания буквы «ё». Афера пишется через «е» и никак иначе.

В подавляющем большинстве случаев е-ё запросто восстановить из контекста

Твой пример с «афёрой» очень показателен. Я уже молчу про массу фамилий, напрочь потерявших «ё», даже русских.

а язык стремится к упрощению

В данном случае не упрощение, а искажение.

пускай сначала выпьют за упокой хотя бы ятя

А чем «ѣ» в XX веке отличалась от «е»? Чем «бѣда» отличается от «беда»? Вот Рёрих и Рерих — произносятся совершенно по-разному.



Дай угадаю, ты не понимаешь, зачем нужен losless и довольствуешься mp3@128kbps? :)

KRoN73 ★★★★★
()
sed -e 's/Ё/Е/g' -e 's/ё/е/g' -i filename
observer ★★★
()
Ответ на: комментарий от Eddy_Em

А что, есть разница?

Угу. «Планер» — это профессиональный сленг для «планёр самолёта». Чтобы коротко различать конструкционный компонент от типа.

KRoN73 ★★★★★
()
Ответ на: комментарий от KRoN73

См. выше про экономию свинца.

Не нужно прикрывать свинцом нагромождение лишних сущностей.

Твой пример с «афёрой» очень показателен.

Ни разу не показателен. Хоть «ё», хоть «е», значение одинаково. С заимствованными словами немало проблем, не нужно делать из этого трагедию.

В данном случае не упрощение, а искажение.

Вот на такие аргументы всегда советую ознакомиться с «Живой как жизнь» Чуковского. Эта книга учит более-менее комплексному взгляду на развитие языка. Думаю, тебе будет любопытно, например, узнать, что слово «развитие» не так давно имело единственное значение - прозябание. Ахтунг, искажение!

А чем «ѣ» в XX веке отличалась от «е»? Чем «бѣда» отличается от «беда»?

Лень уточнять. Вот «миръ» и «мiръ», например, отличались ну очень сильно. И что? Язык стал хуже с отменой i?

Deleted
()
Ответ на: комментарий от KRoN73

cdshines

Если есть словарь, то все сведется к простому поиску, сравнению, принятию решения

то все сведется

Все или всё? :)

Естественный человеческий язык не может быть формализован полностью.

Это доказано всей историей теоретической грамматики филологов всех времён и народов. Со времён Аристотеля пишут грамматику с исключениями.

Если кому интересно, то скажу одну вещь, которую давно надумал, но в связи с переводами с иностранного.

Язык нужно рассматиравть не атомарно, деля на части, а в целом.

Правильно было сказано, что если " есть словарь, то все сведется к простому поиску, сравнению, принятию решения", но эта база данных (словарь) должна содержать не слова, а целые фразы, абзацы, целые тексты. И выборка должна быть, не по словам, а по всему контекту, выраженному - минимум - фразами, максимум - большими кусками текстов.

И тогда не станет неадекватных подстановок, возможны будут разве что разные, но адекватные варианты.

Как и с переводами: нужно запоминать проверенные переводы целиком в базе данных.

record ★★★★★
()
Ответ на: комментарий от anonymous

файл указал

$ sed --version
GNU sed version 4.2.1

$ locale
LANG=en_US.UTF-8
LC_CTYPE=«en_US.UTF-8»
LC_NUMERIC=«en_US.UTF-8»
LC_TIME=«en_US.UTF-8»
LC_COLLATE=«en_US.UTF-8»
LC_MONETARY=«en_US.UTF-8»
LC_MESSAGES=«en_US.UTF-8»
LC_PAPER=«en_US.UTF-8»
LC_NAME=«en_US.UTF-8»
LC_ADDRESS=«en_US.UTF-8»
LC_TELEPHONE=«en_US.UTF-8»
LC_MEASUREMENT=«en_US.UTF-8»
LC_IDENTIFICATION=«en_US.UTF-8»
LC_ALL=

h0lder
() автор топика
Ответ на: комментарий от record

Например, в такой базе будет фраза «всё сведётся», но не будет фраз «всё сведется» и «все сведётся».

record ★★★★★
()

Не нужно так делать.

KivApple ★★★★★
()
Ответ на: комментарий от Deleted

Те, кто бьет истерику о смерти «ё», пускай сначала выпьют за упокой хотя бы ятя.

Ты уже перестал различать ударные [э] и [о] после мягкой согласной? Положи машину времени обратно!

geekless ★★
()
Ответ на: комментарий от Deleted

Вот «миръ» и «мiръ», например, отличались ну очень сильно. И что? Язык стал хуже с отменой i?

Ты глуп. Отменой буквы ты не отменишь фонем.

geekless ★★
()

Ё как раз очень сложная буква, я бы поэтому избегал её писать.

Если в случае ѣ всё понятно, почему и где она писалась, есть логичные правила, то вот чередование Е и Ё можно только заучить.

Откуда берётся Ё в словах Ёжик, Ёлка — я не знаю. В моём учебнике русского языка таких правил не было.

А раз нет понятного правила, то лучше писать Е, а произносить — это ужь кто как хочет.

anarquista ★★★★★
()
Ответ на: комментарий от Deleted

Не распарсил.

Это не удивительно.

Ты о чем?

Я о фонетике, мой плохопарсящий друг. Сходи-ка ты лучше подучи матчастьца.

geekless ★★
()
Ответ на: комментарий от anarquista

А ты знаешь, чѣм отличается «лѣчу» от «лечу»?

По нормам литературного языка, ничем. Диалектопроблемы не волнуют.

geekless ★★
()
Ответ на: комментарий от Deleted

В «миръ» и «мiръ» были разные фонемы? Нет, похоже, что глуп именно ты.

Приписать оппоненту противоположное им сказанному, потом опровергнуть и назвать глупцом — это несколько заезжено, тебе не кажется?

geekless ★★
()
Ответ на: комментарий от geekless

Заканчивай клоунаду.

В литературе не для детей и иностранцев, а также не в топонимах буква «ё» уж давно мертва.

Deleted
()
Ответ на: комментарий от Deleted

Это ты заканчивай. Спрашиваю еще раз: ты уже перестал различать ударные [э] и [о] после мягкой согласной?

Простой ответ: да или нет.

geekless ★★
()
Ответ на: комментарий от geekless

Не перестал. Я восстанавливаю фонему из контекста. Также я делаю, например, с ударениями.

Deleted
()
Ответ на: комментарий от Deleted

В литературе не для детей и иностранцев, а также не в топонимах буква «ё» уж давно мертва.

На LOR'e и без детей?

record ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.