LINUX.ORG.RU

Ответ на: комментарий от opensuse

Убивать всех, кто еще не перешел на юникод :)

boombick ★★★★★
()
Ответ на: комментарий от opensuse

> и православная ISO-8859-5 :)

8859-1 же. остальное - ересь :)

isden ★★★★★
()
Ответ на: комментарий от isden

>а PHP уже умеет нормально и без костылей работать с UTF-8? :)

Да, вроде, много лет уже как :)

KRoN73 ★★★★★
()
Ответ на: комментарий от isden

>а PHP уже умеет нормально и без костылей работать с UTF-8? :)

есть mb_ereg_match и прочее

nu11 ★★★★★
()
Ответ на: комментарий от opensuse

Не вполне понятно, зачем транслитерировать текст из неверной кодировки в латиницу.

Если же стоит задача определить, если в тексте русские буквы в неправильной кодировке… Тут не всё просто.

Например, если в тексте есть буква i — как определить, латинская ли это буква i или русская ё в КОИ-8?

Ritz
()

Упустил.

Чтобы потом можно было сделать транслитерацию


В этом случае достаточно проверить наличие символов более 0x7F

KRoN73 ★★★★★
()
Ответ на: комментарий от isden

> а PHP уже умеет нормально и без костылей работать с UTF-8? :)

Все еще 3-й версией пользуетесь с расширением .php3?)

mobile
()
Ответ на: комментарий от mobile

а здесь - http://www.php.net/manual/en/unicode.configuration.php - говорят что

Available since PHP 6.0.0.
а здесь - http://www.php.net/manual/en/function.preg-replace.php#89471 говорят что Be carefull with utf-8, even with unicode and utf-8 support enabled, a pretty odd bug occurs depending on your operating system

isden ★★★★★
()
Ответ на: комментарий от isden

> mb_* - это из модуля mbstring же, да? как по мне - так костыль.

preg_match('/.../u', ...);

sjinks ★★★
()
Ответ на: комментарий от isden

> mb_* - это из модуля mbstring же, да? как по мне - так костыль.

Есть setlocale, но слабо переносимо.

Pavel_7c0
()
Ответ на: комментарий от Pavel_7c0

>/[а-яё]+/ui

Сцуко. Всю жизнь считал, что в utf-8 буква «ё» на своём законном месте. Облом :)

KRoN73 ★★★★★
()
Ответ на: комментарий от KRoN73

> И что там костыльного? :)

ты в нормальном ЯП тоже используешь внешний модуль для поддержки юникода? :)

isden ★★★★★
()
Ответ на: комментарий от isden

>ты в нормальном ЯП тоже используешь внешний модуль для поддержки юникода? :)

Какой ещё внешний модуль, когда это компонент PHP?

Ты когда пишешь в Perl «use utf8;» - это тоже костыль?

А когда в шапке Питоновской программы «# -*- coding:utf-8 -*-»?

А если в Питоне curl какой-нибудь импортируешь, а в PHP нет - это признак костыля в Питоне или нет? :)

KRoN73 ★★★★★
()
Ответ на: комментарий от isden

А, разве, mb_string не в PHP4 появился? Я не помню уже. В PHP4 - там свои заморочки были, типа довольно ужасной объектной модели :)

KRoN73 ★★★★★
()
Ответ на: комментарий от KRoN73

в четверке с юникодом было плохо, особенно в ранних версиях.

isden ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.