GNU grep 2.13

0

1

4 июля Джим Мейеринг сообщил о выходе очередной версии GNU grep. За десять недель разработки 4 программиста сделали 24 коммита, отмечает он.

Исправлено две ошибки появившиеся в версии 2.6:

grep -i в многобайтовых локалях теперь правильно выводит строки, содержащие буквы, чьё представление в верхнем и нижнем регистре занимает различное число байтов. Это, например, «и-с-точкой» в турецком языке. Прежние версии GNU grep могли либо пропустить часть строки, либо, наоборот, вывести мусор;
опции --include и --exclude теперь снова можно совмещать друг с другом. Так, «grep --include='*.[ch]' --exclude='system.h' PATTERN *» читает все файлы *.c и *.h, кроме system.h.

Новые особенности:

grep без опции -z теперь считает разреженные файлы бинарными, если можно легко определить, что файл действительно разреженный.

>>> Подробности

Ссылка

← Новая версия программы ДЭНСИ:КАССА

Опубликован roadmap RHEL7 →

← 1 2 3 4 →

Теперь винде точно капец! (c)

~~Raving_Zealot~~ ★★
(05.07.12 18:26:13 MSK)

Ссылка

круто. правда я не турок, потому мне вощемта пох.

~~drBatty~~ ★★
(05.07.12 18:37:32 MSK)

grep — одна из самых часто используемых утилит. Ура прогрессу!

~~powerpc~~ ★
(05.07.12 18:47:29 MSK)

Ссылка

А когда уже наконец перловые регекспы в нём перестанут быть экспериментальной фичей?

~~firestarter~~ ★★★☆
(05.07.12 20:48:09 MSK)

Ссылка

Ответ на: комментарий от drBatty 05.07.12 18:37:32 MSK

мне кажется, что такие вот небольшие изменения и поправки показывают, как сложно в действительности написать такую программу.

Или насколько неудачной является кодировка UTF-8.

anarquista ★★★★★
(05.07.12 21:18:36 MSK) автор топика

Ответ на: комментарий от anarquista 05.07.12 21:18:36 MSK

Или насколько неудачной является кодировка UTF-8.

А что ты предлагаешь. ВНЕЗАПНО тотально всем перейти на повсеместное UTF-16-BE?

~~powerpc~~ ★
(05.07.12 21:56:57 MSK)

За десять недель разработки 4 программиста сделали 24 коммита

Лавсан бы закопал.

buddhist ★★★★★
(05.07.12 21:57:57 MSK)

Скачал, собрал, поставил. Попробовал в паре своих скриптов - всё, что нужно лично мне работает. Ппоробовал на своих часто применяемых use case-ах - полёт нормальный. Конечно, это далеко от комплексного тестирования, но «продукт готов к употреблению» (мною, во всяком случае).

DeVliegendeHollander ★★
(05.07.12 22:02:44 MSK)

Ответ на: комментарий от powerpc 05.07.12 21:56:57 MSK

А что ты предлагаешь. ВНЕЗАПНО тотально всем перейти на повсеместное UTF-16-BE?

UTF32 же.

x3al ★★★★★
(05.07.12 22:07:39 MSK)

Ответ на: комментарий от x3al 05.07.12 22:07:39 MSK

Ах, ну да. Точно. Чтобы все кетайские йёроглефы были. Да. Простите.

~~powerpc~~ ★
(05.07.12 22:32:23 MSK)

Ответ на: комментарий от powerpc 05.07.12 22:32:23 MSK

Они и в UTF16 есть. А тем быдлокодерам, которые об этом не знают, нужно отрывать руки FTGJ.

x3al ★★★★★
(05.07.12 22:36:00 MSK)

Ссылка

Ответ на: комментарий от powerpc 05.07.12 22:32:23 MSK

кетайские йёроглефы

Идиотская азиатская письменность подлежит захоронению.

Hertz ★★★★★
(06.07.12 00:08:05 MSK)

Ответ на: комментарий от Hertz 06.07.12 00:08:05 MSK

Только US-ASCII, только хардкор.

Deleted
(06.07.12 00:09:01 MSK)

Ответ на: комментарий от Hertz 06.07.12 00:08:05 MSK

Идиотская азиатская письменность подлежит захоронению.

Весьма часто возникает ощущение, что в одном азиатском иероглифе содержится гораздо больше мыслей, чем в десятке комментариев некоторых персонажей на ЛОРе (в данном случае я не конкретно про тебя). И чью же «письменность» считать «идиотской»? :)

PS: К тому же категоричность высказываний обычно характеризует их автора далеко не с лучшей стороны.

DeVliegendeHollander ★★
(06.07.12 00:14:46 MSK)

Ответ на: комментарий от Hertz 06.07.12 00:08:05 MSK

Да пусть живёт. Мне просто жутко нравится идея utf8: более популярные символы (альфацифровые латинские) — 1 байт, всякая более используемая фигня (типа кириллицы) — 2 байта, прочая — 3-4 байта. Это utf8.

Мне совершенно не симпатизирует никакое utf16/utf32 вообще, какие бы «бизнес-процессы» оно вам не облегчало / позволяло отмыть и распилить больше.

~~powerpc~~ ★
(06.07.12 00:16:30 MSK)

Ответ на: комментарий от powerpc 06.07.12 00:16:30 MSK

Причем здесь распил, если облегчается работа программиста?

leave ★★★★★
(06.07.12 00:46:06 MSK)

Второе изменение радует

leave ★★★★★
(06.07.12 00:46:24 MSK)

Ссылка

Ответ на: комментарий от DeVliegendeHollander 06.07.12 00:14:46 MSK

Да неэффективнен способ описания иероглифами. По любому китайцы всех своих иероглифов то не знают... Сплошной гемор, под каждый термин − новый символ. Как бы utf64 выдумывать не пришлось. То ли дело кириллица/латиница − комбинирование символов в слова, всё просто и понятно. И изучать язык легче на много порядков. Проще читать, проще писать и печатать. Даже если не знаешь значения слова, то хотя бы можешь прочитать и запомнить его чтобы потом узнать что почём. Короче, сливает азиатчина...

Hertz ★★★★★
(06.07.12 00:46:33 MSK)

Ответ на: комментарий от DeVliegendeHollander 06.07.12 00:14:46 MSK

обычно характеризует их автора далеко не с лучшей стороны

Как будто тут институт благородных девиц или палата лордов. Это лор, здесь это в порядке вещей. В рамках нашей местной культуры.

Hertz ★★★★★
(06.07.12 00:47:32 MSK)

Ответ на: комментарий от powerpc 06.07.12 00:16:30 MSK

Но при этом текстовики в той же мерзопакостной cp1251 весят существенно легче utf`ных файлов. Символов в ней хватит на всех. Азиаты пусть обламываются. Пусть переходят на латиницу/кириллицу. И себе и людям громадную услугу тем самым окажут.

Hertz ★★★★★
(06.07.12 00:50:26 MSK)

Ответ на: комментарий от buddhist 05.07.12 21:57:57 MSK

За десять недель разработки 4 программиста сделали 24 коммита
Лавсан бы закопал.

Лавсан делает 24 коммита за час?

malbolge ★★
(06.07.12 00:53:02 MSK)

Ответ на: комментарий от Hertz 06.07.12 00:50:26 MSK

Пусть переходят на латиницу/кириллицу

Так это и арабы пускай переходят, и индусы тоже. Да заодно и кириллицу уж тогда устранить, чего уж там.

mix_mix ★★★★★
(06.07.12 00:56:13 MSK)

Ссылка

Ответ на: комментарий от powerpc 06.07.12 00:16:30 MSK

Как транспортная кодировка — да. Внутри программы иногда удобней работать с символами одинаковой ширины.

at ★★
(06.07.12 01:00:38 MSK)

Ссылка

Ответ на: комментарий от Hertz 06.07.12 00:46:33 MSK

`>По любому китайцы всех своих иероглифов то не знают...

Да. Но оно нафиг не надо.

Сплошной гемор, под каждый термин − новый символ.

Щито? Иероглифы часто используются как морфемы, а не как слова.

Даже если не знаешь значения слова, то хотя бы можешь прочитать и запомнить его чтобы потом узнать что почём.

Я бы предпочёл знать значение и запомнить (форму), не зная точного чтения. И с иероглифами это на порядок легче, чем с этими вашими алфавитами.

То ли дело кириллица/латиница − комбинирование символов в слова, всё просто и понятно.

Нифига не понятно. Тонна правил для чтения в том же английском, другая тонна исключений. И чем это лучше?

Проще читать

4.2

проще писать и печатать.

И слова в 2-4 раза длиннее.

Но при этом текстовики в той же мерзопакостной cp1251 весят существенно легче utf`ных файлов.

Да, целых 2 мегабайта экономии на (толстую) книгу. Лицоладонь.

Азиаты пусть обламываются. Пусть переходят на латиницу/кириллицу.

Китайцы, внезапно, не могут перейти. Им что, всем сдохнуть скажешь?

x3al ★★★★★
(06.07.12 01:09:47 MSK)

две ошибки появившиеся в версии 2.6:

Вот это действительно новое. Фичи закончились, теперь в греп пишут баги.

~~AVL2~~ ★★★★★
(06.07.12 01:18:40 MSK)

Ссылка

Ответ на: комментарий от x3al 06.07.12 01:09:47 MSK

Китайцы, внезапно, не могут перейти. Им что, всем сдохнуть скажешь?

а компы и всю технику где брать будем?

~~AVL2~~ ★★★★★
(06.07.12 01:19:30 MSK)

Ответ на: комментарий от anarquista 05.07.12 21:18:36 MSK

Или насколько неудачной является кодировка UTF-8.

предлагаешь назад, в уютную 1251?

~~drBatty~~ ★★
(06.07.12 01:23:29 MSK)

Ссылка

Ответ на: комментарий от AVL2 06.07.12 01:19:30 MSK

а компы и всю технику где брать будем?

Можно подумать, если китайцы вымрут разом, их производственную эстафету никто не подхватит, ага.
Да за такой кусок денег та же Индия у себя заводов нашлёпает, где будут трудиться за копейки индийцы местные.

blackst0ne ★★★★★
(06.07.12 01:31:43 MSK)

Ответ на: комментарий от anarquista 05.07.12 21:18:36 MSK

Или что подобную программу можно написать. Написать так, чтобы она была законченной. Потому что прогресс ради прогресса - это болезнь.

mine ★
(06.07.12 01:37:15 MSK)

Ссылка

Ответ на: комментарий от blackst0ne 06.07.12 01:31:43 MSK

Кто такие индийцы? Помесь индейцев из Америки и индусов из Индии?

mine ★
(06.07.12 01:38:20 MSK)

Ответ на: комментарий от mine 06.07.12 01:38:20 MSK

Вообще-то, насколько я знаю, индус - это тот, кто исповедует индуизм. А жители Индии как раз индийцы.

lipstick ★
(06.07.12 02:00:41 MSK)

Ссылка

Ответ на: комментарий от mine 06.07.12 01:38:20 MSK

Кто такие индийцы? Помесь индейцев из Америки и индусов из Индии?

Вам самому не стыдно такую безграмотность говорить?

Индийцы - официальный этнохороним Индии.
Индусы - почитатели индуизма.

blackst0ne ★★★★★
(06.07.12 02:03:53 MSK)

Ссылка

Ответ на: комментарий от Hertz 06.07.12 00:47:32 MSK

Пижончик. (это по результатам обоих ответов)

DeVliegendeHollander ★★
(06.07.12 02:05:31 MSK)

Ссылка

Ответ на: комментарий от Hertz 06.07.12 00:08:05 MSK

Не стоит так. С точки зрения тех же американцев кирилица тоже большое недоразумение. Ведь есть же латынь. Но, почему-то, каждый народ держится за свою письменность. И свой язык. Видно, что-то в этом есть. Наш алфавит похож на ассемблер, их - на высокоуровневый Python. Что лучше, что хуже решить невозможно - это просто разные вещи.

lucentcode ★★★★★
(06.07.12 02:26:16 MSK)

Кому нужна эта поделка, когда есть ack?

anonymous
(06.07.12 02:49:42 MSK)

Ответ на: комментарий от anonymous 06.07.12 02:49:42 MSK

Кому нужна эта поделка, когда есть ack?

WTF?

~~drBatty~~ ★★
(06.07.12 03:01:44 MSK)

Ответ на: комментарий от x3al 06.07.12 01:09:47 MSK

Я бы предпочёл знать значение и запомнить (форму), не зная точного чтения.

И как тогда читать, не перводя?

~~Yareg~~ ★★★
(06.07.12 03:07:12 MSK)
Последнее исправление: Yareg 06.07.12 03:08:56 MSK (всего исправлений: 1)

Ответ на: комментарий от Hertz 06.07.12 00:50:26 MSK

cp1251

Заодно упразднить всю европейскую диакритику и греческий, доо.

~~Yareg~~ ★★★
(06.07.12 03:08:27 MSK)

Ответ на: комментарий от lucentcode 06.07.12 02:26:16 MSK

Для обмена данными через приборы, которые подразумевают некую системность входящих данных , лучше иметь один относительно логичный язык, который можно нормально парсить и делать проверки на валидность. Английский вписывается, с его строгим порядком следования слов и четко ограниченным количеством букв (машине глубоко плевать на сложные правила произношения и прочие «человеческие» проблемы с английским). А иероглифы не очень.

anonymous
(06.07.12 03:09:43 MSK)

Ответ на: комментарий от anonymous 06.07.12 03:09:43 MSK

Для обмена данными через приборы, которые подразумевают некую системность входящих данных , лучше иметь один относительно логичный язык, который можно нормально парсить и делать проверки на валидность. Английский вписывается, с его строгим порядком следования слов и четко ограниченным количеством букв

Никуда ваш логичный английский не вписывается. Только lojban, только хардкор!

SKYRiDER ★★★
(06.07.12 03:45:26 MSK)

Ссылка

Ответ на: комментарий от lucentcode 06.07.12 02:26:16 MSK

С точки зрения тех же американцев кирилица тоже большое недоразумение.

С моей точки зрения тоже.

drull ★☆☆☆
(06.07.12 04:45:04 MSK)

Ответ на: комментарий от Yareg 06.07.12 03:08:27 MSK

Заодно упразднить всю европейскую диакритику и греческий, доо.

Немецкую - с удовольствием перевел бы. ß - ss, ä - e, ö - oe, ü - y. Когда-то у англичан были свои буквы - упразднили, оставили только классические латинские + j, v, w.

~~Bagrov~~ ★★★★★
(06.07.12 04:57:59 MSK)

Ответ на: комментарий от anonymous 06.07.12 03:09:43 MSK

лучше иметь один относительно логичный язык, который можно нормально парсить и делать проверки на валидность.

А иероглифы не очень.

Так английский тоже не очень, по вашим требованиям нужен логлан.

loz ★★★★★
(06.07.12 05:25:05 MSK)

Минорщина.

~~Quasar~~ ★★★★★
(06.07.12 05:33:03 MSK)

Ссылка

Ответ на: комментарий от loz 06.07.12 05:25:05 MSK

Почему не очень? Строгий порядок следования — есть. Фиксированный набор букв и их простота — есть. Распространенность среди большинства прямоходящих — есть. Что ещё вам надо-то всем?

anonymous
(06.07.12 06:41:14 MSK)

Ссылка

Ответ на: комментарий от Hertz 06.07.12 00:08:05 MSK

Hertz
Идиотская азиатская письменность подлежит захоронению.

Эта письменность - единственный способ общения у много общинного китайского народа. Иероглифы не несут фонетику. А разные общины в Китае говорят на совершенно разных языках, которые хоть у нас и называют диалектами, но не являются родственными и отличаются друг от друга не меньше чем ацтекский и русский. Иероглифы читаются на всех этих языках одинаково, так как передают не произношение конкретного языка, а смысл написанного. Стыдно этого не знать. На Китайские народы нужно смотреть не свысока, а со снисхождением. Учитывая все эти трудности - они все же процветают как единая «нация» (чего к сожалению не скажешь о Россиянах).

anonymous
(06.07.12 06:53:51 MSK)