Perl 5.8.8

0

0

Основные изменения:

- обновлена база поддержки юникода

- устранена пара дыр в suidperl

- скрипт "подгонки под сайт" по умолчанию не включен

- config.pm похудел

- обновление модулей

- find2perl обзавелся новыми опциями -iname, -path и -ipath

- улучшения в производительности, инсталяции и конфигурации

- багфиксы

К сожалению все еще остались проблемы с юникодом.

Source: ftp://ftp.cpan.org/pub/CPAN/authors/i...

Размер 10 Mb

>>> Подробности

Ссылка

←	Военный джип под управлением Linux

Вышел iptables 1.3.5

→

А ссылочка к подробностям на 5.8.7!Поправьте!

sws ★
(03.02.06 09:30:01 MSK)

> К сожалению все еще остались проблемы с юникодом.
И это в 21 веке. Мдя, грустно.

Korwin ★★★
(03.02.06 09:55:08 MSK)

>К сожалению все еще остались проблемы с юникодом.

Ну, сайт юникодный с юникодной базой у меня работает - и это главное. :)

~~suser~~
(03.02.06 10:07:55 MSK)

Ссылка

>К сожалению все еще остались проблемы с юникодом.

Одна из причин почему я перешел на Java

anonymous
(03.02.06 10:26:47 MSK)

Ссылка

Под проблемами с юникодом имеется ввиду это?

> It had been reported that running under perl's debugger when

> processing Unicode data could cause unexpectedly large slowdowns.

> The most likely cause of this was identified and fixed by Nicholas Clark.

Или что-то есть посерьезней?

anonymous
(03.02.06 10:39:03 MSK)

Ответ на: комментарий от anonymous 03.02.06 10:39:03 MSK

это достаточто серьезно - невозможность отладки объемного кода. например perl -d -mencoding=utf-8 -e '' - простейший вариант, так же есть варианты с use utf-8, однако в свете косяков utf8 в питоне - перл просто рулит. Ява конечно вне конкуренции в этом плане, utf там почти что идеален, но она порой немного ресурсоемка...

anonymous
(03.02.06 10:47:00 MSK)

Ответ на: комментарий от anonymous 03.02.06 10:47:00 MSK

фигня всё это PHP круче

anonymous
(03.02.06 10:56:55 MSK)

Ответ на: комментарий от anonymous 03.02.06 10:47:00 MSK

По-моему "use utf-8" в Perl 5.8 уже не нужно использовать.

anonymous
(03.02.06 11:16:14 MSK)

Ссылка

Ответ на: комментарий от anonymous 03.02.06 10:47:00 MSK

> однако в свете косяков utf8 в питоне

каких косяков?

anonymous
(03.02.06 11:18:42 MSK)

Ответ на: комментарий от anonymous 03.02.06 10:56:55 MSK

а бейсик, как здесь недавно кто-то доказывал, еще кручастее!

anonymous
(03.02.06 11:20:08 MSK)

Ссылка

Ответ на: комментарий от anonymous 03.02.06 11:18:42 MSK

мне тоже интересно, какие косяки с utf-8 в питоне.

smartly ★★★
(03.02.06 11:30:55 MSK)

Ссылка

Ответ на: комментарий от anonymous 03.02.06 10:56:55 MSK

>>фигня всё это PHP круче
Тут смеялсо!

~~sabonez~~ ★☆☆☆
(03.02.06 11:51:24 MSK)

Ссылка

Ответ на: комментарий от sws 03.02.06 09:30:01 MSK

> А ссылочка к подробностям на 5.8.7! Не только ссылочка к подробностям, но и список изменений в тексте новости относятся к 5.8.7! И про проблемы с юникодом в 5.8.8 ничего не говорится.

anonymous
(03.02.06 11:53:22 MSK)

Ответ на: комментарий от anonymous 03.02.06 11:53:22 MSK

Вот правильная ссылка:

http://search.cpan.org/~nwclark/perl-5.8.8/pod/perl588delta.pod

anonymous
(03.02.06 11:58:56 MSK)

Ссылка

Ответ на: комментарий от Korwin 03.02.06 09:55:08 MSK

> И это в 21 веке. Мдя, грустно.

Unicode in package/class and subroutine names does not work

One can have Unicode in identifier names, but not in package/class or subroutine names. While some limited functionality towards this does exist as of Perl 5.8.0, that is more accidental than designed; use of Unicode for the said purposes is unsupported.

One reason of this unfinishedness is its (currently) inherent unportability: since both package names and subroutine names may need to be mapped to file and directory names, the Unicode capability of the filesystem becomes important-- and there unfortunately aren't portable answers.

Очевидно, что проблема тут "как сделать переносимо и не выстрелить себе и соседу в ногу".

Casus ★★★★★
(03.02.06 12:03:47 MSK)

Ответ на: комментарий от Casus 03.02.06 12:03:47 MSK

А нафига имена подпрограмм в unicode?

Davidov ★★★★
(03.02.06 14:57:01 MSK)

Ответ на: комментарий от Davidov 03.02.06 14:57:01 MSK

наверное для того, чтобы вместо

main {}
...
sub DESTROY {}

можно было написать

главное {}
...
суб УБИТЬ {]

и т.д
;-)

papazol
(03.02.06 15:02:36 MSK)

Ответ на: комментарий от papazol 03.02.06 15:02:36 MSK

например в питоне итераторы для uft 8 regexp обрабатывают выражение побайтово, а не посимвольно, что вызывает порой довольно смешные результаты;

[^A-Z]* для utf строки - смех и слезы. вообщем, несмотря на наличие unicode флага для регулярных выражений - там все очень запущено. Да можно почитать архивы питоновские - как там народ с utf радость испытывает...

это для Python 2.4.2 (#1, Nov 14 2005, 21:21:11)

anonymous
(03.02.06 15:18:33 MSK)

Ответ на: комментарий от Davidov 03.02.06 14:57:01 MSK

> А нафига имена подпрограмм в unicode?

Это Korwin'у вопрос, ему было грустно от того, что не работает пока. Я пока достаточно вменяем, чтобы не грустить по такому поводу :)

Casus ★★★★★
(03.02.06 16:02:22 MSK)

Ссылка

Ответ на: комментарий от papazol 03.02.06 15:02:36 MSK

а кому вообше такое извращение нада?

чем плохо когда прога написана на энглише?

anonymous
(03.02.06 16:08:23 MSK)

Ответ на: комментарий от anonymous 03.02.06 16:08:23 MSK

> а кому вообше такое извращение нада?

> чем плохо когда прога написана на энглише?

Вы не поверите - Perl6 умеет (уже сейчас) уникодные идентификаторы. Более того, некоторые из встроенных операторов записываются уникодным (non-ASCII) символами (¥, например; еще какие-то есть). Нет, у них, конечно, есть многосимвольные ASCII-эквиваленты.

anonymous
(03.02.06 18:14:16 MSK)

Ссылка

Ответ на: комментарий от anonymous 03.02.06 15:18:33 MSK

utf problems in python

> например в питоне итераторы для uft 8 regexp обрабатывают выражение побайтово, а не посимвольно, что вызывает порой довольно смешные результаты

если не очень напрягает -- напишите подробный багрепорт, люди будут благодарны.

anonymous
(03.02.06 19:15:55 MSK)

Ссылка

Ответ на: комментарий от anonymous 03.02.06 15:18:33 MSK

>например в питоне итераторы для uft 8 regexp обрабатывают выражение побайтово, а не посимвольно, что вызывает порой довольно смешные результаты;

Так и должно быть. Для обработки юникода в питоне есть соответствующий тип строк.

>Да можно почитать архивы питоновские - как там народ с utf радость испытывает...

конверируешь в тип unicode - и наступает радость.

smartly ★★★
(04.02.06 12:20:24 MSK)

Ответ на: комментарий от smartly 04.02.06 12:20:24 MSK

перл остой на нём нельзя быстро сайты клепать - пхп круче

anonymous
(04.02.06 14:46:29 MSK)

Ответ на: комментарий от anonymous 04.02.06 14:46:29 MSK

мда, видать из всего Perl'a только название и видел

vadiml ★★★★★
(04.02.06 15:19:44 MSK)

Ссылка

Восхищен.
Интересно, когда заработает perlcc наконец-то?

anonymous
(04.02.06 15:46:10 MSK)

Ссылка

Ответ на: комментарий от anonymous 03.02.06 15:18:33 MSK

Должен заметить, что если хочется посимвольной обработки, то в питоне, вообще-то, есть unicode. В смысле, строки в некотором внутреннем многобайтном представлении (грубо говоря, wchar'ах). Обрабатывать текст в транспортных кодировках, вообще-то, непроизводительно (точнее, или неполнофункционально, или непроизводительно).

Оставьте транспортным кодировкам транспортировку данных :-).

AlexM ★★★★★
(04.02.06 23:58:39 MSK)

Ссылка

Ответ на: комментарий от papazol 03.02.06 15:02:36 MSK

> наверное для того, чтобы вместо
> main {}
>...
>sub DESTROY {}
>
>можно было написать

>главное {}
>...
>суб УБИТЬ {]

это все прекрасно реализуется с помощью фильтров.

anonymous
(05.02.06 14:56:37 MSK)

Ссылка

Ответ на: комментарий от smartly 04.02.06 12:20:24 MSK

LANG=ru_RU.utf8
LC_CTYPE="ru_RU.utf8"
LC_NUMERIC="ru_RU.utf8"
LC_TIME="ru_RU.utf8"
LC_COLLATE="ru_RU.utf8"
LC_MONETARY="ru_RU.utf8"
LC_MESSAGES="ru_RU.utf8"
LC_PAPER="ru_RU.utf8"
LC_NAME="ru_RU.utf8"
LC_ADDRESS="ru_RU.utf8"
LC_TELEPHONE="ru_RU.utf8"
LC_MEASUREMENT="ru_RU.utf8"
LC_IDENTIFICATION="ru_RU.utf8"
LC_ALL=
ezh@obelisk ~/workspace/Ezh.engine $ python
Python 2.4.2 (#1, Nov 22 2005, 11:52:25)
[GCC 3.3.6 (Gentoo 3.3.6, ssp-3.3.6-1.0, pie-8.7.8)] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import re
>>> print re.match('<[^ABC]*>', '<DEF>', re.UNICODE).group()
<DEF>
>>> print re.match('<[^АБВГ]*>', '<123ДЕЁЖ>', re.UNICODE).group()
Traceback (most recent call last):
  File "<stdin>", line 1, in ?
AttributeError: 'NoneType' object has no attribute 'group'
>>>
где тут что в unicode конвертировать????
я хочу чтоб заработало выражение re.match('<[^АБВГ]*>', '<123ДЕЁЖ>', re.UNICODE) smartly - подскажи плз

anonymous
(05.02.06 19:30:28 MSK)

Ответ на: комментарий от anonymous 05.02.06 19:30:28 MSK

print re.match(u'<[^АБВГ]*>', u'<123ДЕЁЖ>').group()

Только что проверил, работает, как и ожидалось.

AlexM ★★★★★
(05.02.06 20:56:15 MSK)

Ответ на: комментарий от AlexM 05.02.06 20:56:15 MSK

А, ну, если уже есть байт-стринг, то ничего не мешает сделать decode:

bs = file("some.utf").read()
us = bs.decode("utf-8")

us теперь имеет тип unicode.

AlexM ★★★★★
(05.02.06 21:01:06 MSK)

Ссылка

Ответ на: комментарий от AlexM 05.02.06 20:56:15 MSK

>print re.match(u'<[^АБВГ]*>', u'<123ДЕЁЖ>').group()

Только еще, желательно, проставить в начале файла кодировку файла.

smartly ★★★
(06.02.06 00:41:50 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Военный джип под управлением Linux

Open Source

Вышел iptables 1.3.5

→

utf problems in python

Похожие темы