LINUX.ORG.RU

GNU grep 2.13

 ,


0

1

4 июля Джим Мейеринг сообщил о выходе очередной версии GNU grep. За десять недель разработки 4 программиста сделали 24 коммита, отмечает он.

Исправлено две ошибки появившиеся в версии 2.6:

  • grep -i в многобайтовых локалях теперь правильно выводит строки, содержащие буквы, чьё представление в верхнем и нижнем регистре занимает различное число байтов. Это, например, «и-с-точкой» в турецком языке. Прежние версии GNU grep могли либо пропустить часть строки, либо, наоборот, вывести мусор;
  • опции --include и --exclude теперь снова можно совмещать друг с другом. Так, «grep --include='*.[ch]' --exclude='system.h' PATTERN *» читает все файлы *.c и *.h, кроме system.h.

Новые особенности:

  • grep без опции -z теперь считает разреженные файлы бинарными, если можно легко определить, что файл действительно разреженный.

>>> Подробности

★★★★★

Проверено: catap ()
Последнее исправление: catap (всего исправлений: 3)

grep — одна из самых часто используемых утилит. Ура прогрессу!

powerpc
()

А когда уже наконец перловые регекспы в нём перестанут быть экспериментальной фичей?

firestarter ★★★☆
()
Ответ на: комментарий от drBatty

мне кажется, что такие вот небольшие изменения и поправки показывают, как сложно в действительности написать такую программу.

Или насколько неудачной является кодировка UTF-8.

anarquista ★★★★★
() автор топика
Ответ на: комментарий от anarquista

Или насколько неудачной является кодировка UTF-8.

А что ты предлагаешь. ВНЕЗАПНО тотально всем перейти на повсеместное UTF-16-BE?

powerpc
()

Скачал, собрал, поставил. Попробовал в паре своих скриптов - всё, что нужно лично мне работает. Ппоробовал на своих часто применяемых use case-ах - полёт нормальный. Конечно, это далеко от комплексного тестирования, но «продукт готов к употреблению» (мною, во всяком случае).

DeVliegendeHollander ★★
()
Ответ на: комментарий от powerpc

Они и в UTF16 есть. А тем быдлокодерам, которые об этом не знают, нужно отрывать руки FTGJ.

x3al ★★★★★
()
Ответ на: комментарий от Hertz

Идиотская азиатская письменность подлежит захоронению.

Весьма часто возникает ощущение, что в одном азиатском иероглифе содержится гораздо больше мыслей, чем в десятке комментариев некоторых персонажей на ЛОРе (в данном случае я не конкретно про тебя). И чью же «письменность» считать «идиотской»? :)

PS: К тому же категоричность высказываний обычно характеризует их автора далеко не с лучшей стороны.

DeVliegendeHollander ★★
()
Ответ на: комментарий от Hertz

Да пусть живёт. Мне просто жутко нравится идея utf8: более популярные символы (альфацифровые латинские) — 1 байт, всякая более используемая фигня (типа кириллицы) — 2 байта, прочая — 3-4 байта. Это utf8.

Мне совершенно не симпатизирует никакое utf16/utf32 вообще, какие бы «бизнес-процессы» оно вам не облегчало / позволяло отмыть и распилить больше.

powerpc
()

Второе изменение радует

leave ★★★★★
()
Ответ на: комментарий от DeVliegendeHollander

Да неэффективнен способ описания иероглифами. По любому китайцы всех своих иероглифов то не знают... Сплошной гемор, под каждый термин − новый символ. Как бы utf64 выдумывать не пришлось. То ли дело кириллица/латиница − комбинирование символов в слова, всё просто и понятно. И изучать язык легче на много порядков. Проще читать, проще писать и печатать. Даже если не знаешь значения слова, то хотя бы можешь прочитать и запомнить его чтобы потом узнать что почём. Короче, сливает азиатчина...

Hertz ★★★★★
()
Ответ на: комментарий от DeVliegendeHollander

обычно характеризует их автора далеко не с лучшей стороны

Как будто тут институт благородных девиц или палата лордов. Это лор, здесь это в порядке вещей. В рамках нашей местной культуры.

Hertz ★★★★★
()
Ответ на: комментарий от powerpc

Но при этом текстовики в той же мерзопакостной cp1251 весят существенно легче utf`ных файлов. Символов в ней хватит на всех. Азиаты пусть обламываются. Пусть переходят на латиницу/кириллицу. И себе и людям громадную услугу тем самым окажут.

Hertz ★★★★★
()
Ответ на: комментарий от buddhist

За десять недель разработки 4 программиста сделали 24 коммита

Лавсан бы закопал.

Лавсан делает 24 коммита за час?

malbolge ★★
()
Ответ на: комментарий от Hertz

Пусть переходят на латиницу/кириллицу

Так это и арабы пускай переходят, и индусы тоже. Да заодно и кириллицу уж тогда устранить, чего уж там.

mix_mix ★★★★★
()
Ответ на: комментарий от powerpc

Как транспортная кодировка — да. Внутри программы иногда удобней работать с символами одинаковой ширины.

at ★★
()
Ответ на: комментарий от Hertz

`>По любому китайцы всех своих иероглифов то не знают...

Да. Но оно нафиг не надо.

Сплошной гемор, под каждый термин − новый символ.

Щито? Иероглифы часто используются как морфемы, а не как слова.

Даже если не знаешь значения слова, то хотя бы можешь прочитать и запомнить его чтобы потом узнать что почём.

Я бы предпочёл знать значение и запомнить (форму), не зная точного чтения. И с иероглифами это на порядок легче, чем с этими вашими алфавитами.

То ли дело кириллица/латиница − комбинирование символов в слова, всё просто и понятно.

Нифига не понятно. Тонна правил для чтения в том же английском, другая тонна исключений. И чем это лучше?

Проще читать

4.2

проще писать и печатать.

И слова в 2-4 раза длиннее.

Но при этом текстовики в той же мерзопакостной cp1251 весят существенно легче utf`ных файлов.

Да, целых 2 мегабайта экономии на (толстую) книгу. Лицоладонь.

Азиаты пусть обламываются. Пусть переходят на латиницу/кириллицу.

Китайцы, внезапно, не могут перейти. Им что, всем сдохнуть скажешь?

x3al ★★★★★
()

две ошибки появившиеся в версии 2.6:

Вот это действительно новое. Фичи закончились, теперь в греп пишут баги.

AVL2 ★★★★★
()
Ответ на: комментарий от x3al

Китайцы, внезапно, не могут перейти. Им что, всем сдохнуть скажешь?

а компы и всю технику где брать будем?

AVL2 ★★★★★
()
Ответ на: комментарий от anarquista

Или насколько неудачной является кодировка UTF-8.

предлагаешь назад, в уютную 1251?

drBatty ★★
()
Ответ на: комментарий от AVL2

а компы и всю технику где брать будем?


Можно подумать, если китайцы вымрут разом, их производственную эстафету никто не подхватит, ага.
Да за такой кусок денег та же Индия у себя заводов нашлёпает, где будут трудиться за копейки индийцы местные.

blackst0ne ★★★★★
()
Ответ на: комментарий от anarquista

Или что подобную программу можно написать. Написать так, чтобы она была законченной. Потому что прогресс ради прогресса - это болезнь.

mine
()
Ответ на: комментарий от mine

Вообще-то, насколько я знаю, индус - это тот, кто исповедует индуизм. А жители Индии как раз индийцы.

lipstick
()
Ответ на: комментарий от mine

Кто такие индийцы? Помесь индейцев из Америки и индусов из Индии?


Вам самому не стыдно такую безграмотность говорить?

Индийцы - официальный этнохороним Индии.
Индусы - почитатели индуизма.

blackst0ne ★★★★★
()
Ответ на: комментарий от Hertz

Не стоит так. С точки зрения тех же американцев кирилица тоже большое недоразумение. Ведь есть же латынь. Но, почему-то, каждый народ держится за свою письменность. И свой язык. Видно, что-то в этом есть. Наш алфавит похож на ассемблер, их - на высокоуровневый Python. Что лучше, что хуже решить невозможно - это просто разные вещи.

lucentcode ★★★★★
()
Ответ на: комментарий от lucentcode

Для обмена данными через приборы, которые подразумевают некую системность входящих данных , лучше иметь один относительно логичный язык, который можно нормально парсить и делать проверки на валидность. Английский вписывается, с его строгим порядком следования слов и четко ограниченным количеством букв (машине глубоко плевать на сложные правила произношения и прочие «человеческие» проблемы с английским). А иероглифы не очень.

anonymous
()
Ответ на: комментарий от anonymous

Для обмена данными через приборы, которые подразумевают некую системность входящих данных , лучше иметь один относительно логичный язык, который можно нормально парсить и делать проверки на валидность. Английский вписывается, с его строгим порядком следования слов и четко ограниченным количеством букв

Никуда ваш логичный английский не вписывается. Только lojban, только хардкор!

SKYRiDER ★★★
()
Ответ на: комментарий от Yareg

Заодно упразднить всю европейскую диакритику и греческий, доо.

Немецкую - с удовольствием перевел бы. ß - ss, ä - e, ö - oe, ü - y. Когда-то у англичан были свои буквы - упразднили, оставили только классические латинские + j, v, w.

Bagrov ★★★★★
()
Ответ на: комментарий от anonymous

лучше иметь один относительно логичный язык, который можно нормально парсить и делать проверки на валидность.

А иероглифы не очень.

Так английский тоже не очень, по вашим требованиям нужен логлан.

loz ★★★★★
()
Ответ на: комментарий от loz

Почему не очень? Строгий порядок следования — есть. Фиксированный набор букв и их простота — есть. Распространенность среди большинства прямоходящих — есть. Что ещё вам надо-то всем?

anonymous
()
Ответ на: комментарий от Hertz

Hertz

Идиотская азиатская письменность подлежит захоронению.

Эта письменность - единственный способ общения у много общинного китайского народа. Иероглифы не несут фонетику. А разные общины в Китае говорят на совершенно разных языках, которые хоть у нас и называют диалектами, но не являются родственными и отличаются друг от друга не меньше чем ацтекский и русский. Иероглифы читаются на всех этих языках одинаково, так как передают не произношение конкретного языка, а смысл написанного. Стыдно этого не знать. На Китайские народы нужно смотреть не свысока, а со снисхождением. Учитывая все эти трудности - они все же процветают как единая «нация» (чего к сожалению не скажешь о Россиянах).

anonymous
()
Ответ на: комментарий от malbolge

Он закопал порт SBCL под офтопик потому, что у них за 4 месяца не было коммитов

theNamelessOne ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.