Форум — Web-development php preg_match 0 0 как узнать через preg_match что в строке есть кирилица? Чтобы потом можно было сделать транслитерацию. Спасибо. Ссылка
Ответ на: комментарий от anonymous 15.03.10 15:25:40 MSK а кодировки? opensuse ★ (15.03.10 15:33:24 MSK) Показать ответы Ссылка
Ответ на: комментарий от opensuse 15.03.10 15:33:24 MSK >а кодировки? А есть что-то, отличное от utf-8? :) KRoN73 ★★★★★ (15.03.10 15:40:41 MSK) Показать ответы Ссылка
Ответ на: комментарий от KRoN73 15.03.10 15:40:41 MSK увы, есть еще богомерзкая CP1251 :( opensuse ★ (15.03.10 17:32:59 MSK) Показать ответы Ссылка
Ответ на: комментарий от opensuse 15.03.10 17:32:59 MSK и православная ISO-8859-5 :) opensuse ★ (15.03.10 17:33:23 MSK) Показать ответ Ссылка
Ответ на: комментарий от opensuse 15.03.10 17:32:59 MSK Убивать всех, кто еще не перешел на юникод :) boombick ★★★★★ (15.03.10 20:14:58 MSK) Ссылка
Ответ на: комментарий от KRoN73 15.03.10 15:40:41 MSK > А есть что-то, отличное от utf-8? :) а PHP уже умеет нормально и без костылей работать с UTF-8? :) isden ★★★★★ (15.03.10 20:17:06 MSK) Показать ответы Ссылка
Ответ на: комментарий от opensuse 15.03.10 17:33:23 MSK > и православная ISO-8859-5 :) 8859-1 же. остальное - ересь :) isden ★★★★★ (15.03.10 20:17:35 MSK) Ссылка
Ответ на: комментарий от isden 15.03.10 20:17:06 MSK >а PHP уже умеет нормально и без костылей работать с UTF-8? :) Да, вроде, много лет уже как :) KRoN73 ★★★★★ (15.03.10 23:05:06 MSK) Ссылка
Ответ на: комментарий от isden 15.03.10 20:17:06 MSK >а PHP уже умеет нормально и без костылей работать с UTF-8? :) есть mb_ereg_match и прочее nu11 ★★★★★ (16.03.10 20:34:47 MSK) Ссылка
Ответ на: комментарий от opensuse 15.03.10 15:33:24 MSK Не вполне понятно, зачем транслитерировать текст из неверной кодировки в латиницу.Если же стоит задача определить, если в тексте русские буквы в неправильной кодировке… Тут не всё просто.Например, если в тексте есть буква i — как определить, латинская ли это буква i или русская ё в КОИ-8? Ritz (16.03.10 21:02:15 MSK) Ссылка
Упустил. Чтобы потом можно было сделать транслитерацию В этом случае достаточно проверить наличие символов более 0x7F KRoN73 ★★★★★ (16.03.10 21:06:58 MSK) Ссылка
Ответ на: комментарий от isden 15.03.10 20:17:06 MSK > а PHP уже умеет нормально и без костылей работать с UTF-8? :) Все еще 3-й версией пользуетесь с расширением .php3?) mobile (16.03.10 21:09:42 MSK) Показать ответ Ссылка
Ответ на: комментарий от mobile 16.03.10 21:09:42 MSK а здесь - http://www.php.net/manual/en/unicode.configuration.php - говорят что Available since PHP 6.0.0. а здесь - http://www.php.net/manual/en/function.preg-replace.php#89471 говорят что Be carefull with utf-8, even with unicode and utf-8 support enabled, a pretty odd bug occurs depending on your operating system isden ★★★★★ (16.03.10 21:21:00 MSK) Показать ответ Ссылка
Ответ на: комментарий от isden 16.03.10 21:21:00 MSK Есть mb_ функции, можно использовать eregi mobile (16.03.10 21:25:29 MSK) Показать ответ Ссылка
Ответ на: комментарий от mobile 16.03.10 21:25:29 MSK mb_* - это из модуля mbstring же, да? как по мне - так костыль. isden ★★★★★ (16.03.10 21:27:30 MSK) Показать ответы Ссылка
Ответ на: комментарий от isden 16.03.10 21:27:30 MSK > mb_* - это из модуля mbstring же, да? как по мне - так костыль. preg_match('/.../u', ...); sjinks ★★★ (17.03.10 21:13:24 MSK) Ссылка
Ответ на: комментарий от anonymous 15.03.10 15:25:40 MSK > *[а-яА-Я]* ? Почти. Правильный вариант такой: /[а-яё]+/uiP.S. Да, я быдло. Pavel_7c0 (20.03.10 11:58:20 MSK) Показать ответ Ссылка
Ответ на: комментарий от isden 16.03.10 21:27:30 MSK > mb_* - это из модуля mbstring же, да? как по мне - так костыль. Есть setlocale, но слабо переносимо. Pavel_7c0 (20.03.10 11:59:46 MSK) Ссылка
Ответ на: комментарий от isden 16.03.10 21:27:30 MSK >как по мне - так костыль. И что там костыльного? :) KRoN73 ★★★★★ (20.03.10 15:21:34 MSK) Показать ответ Ссылка
Ответ на: комментарий от Pavel_7c0 20.03.10 11:58:20 MSK >/[а-яё]+/ui Сцуко. Всю жизнь считал, что в utf-8 буква «ё» на своём законном месте. Облом :) KRoN73 ★★★★★ (20.03.10 15:23:21 MSK) Ссылка
Ответ на: комментарий от KRoN73 20.03.10 15:21:34 MSK > И что там костыльного? :) ты в нормальном ЯП тоже используешь внешний модуль для поддержки юникода? :) isden ★★★★★ (20.03.10 21:40:17 MSK) Показать ответ Ссылка
Ответ на: комментарий от isden 20.03.10 21:40:17 MSK >ты в нормальном ЯП тоже используешь внешний модуль для поддержки юникода? :) Какой ещё внешний модуль, когда это компонент PHP? Ты когда пишешь в Perl «use utf8;» - это тоже костыль? А когда в шапке Питоновской программы «# -*- coding:utf-8 -*-»? А если в Питоне curl какой-нибудь импортируешь, а в PHP нет - это признак костыля в Питоне или нет? :) KRoN73 ★★★★★ (20.03.10 21:48:03 MSK) Показать ответ Ссылка
Ответ на: комментарий от KRoN73 20.03.10 21:48:03 MSK ну ок, уболтал. у меня тяжкое наследие ранних версий PHP4. isden ★★★★★ (20.03.10 21:50:29 MSK) Показать ответ Ссылка
Ответ на: комментарий от isden 20.03.10 21:50:29 MSK А, разве, mb_string не в PHP4 появился? Я не помню уже. В PHP4 - там свои заморочки были, типа довольно ужасной объектной модели :) KRoN73 ★★★★★ (20.03.10 21:55:33 MSK) Показать ответ Ссылка
Ответ на: комментарий от KRoN73 20.03.10 21:55:33 MSK в четверке с юникодом было плохо, особенно в ранних версиях. isden ★★★★★ (20.03.10 22:24:28 MSK) Ссылка