> Черт побери, вот когда начинаешь искренне радоваться совершенно простым, очевидным вещам, таким, как наличие юникода...
В такие моменты как никогда вспоминается заявление из ранних рекламных проспектов, что Java, для обеспечения широчайшей интернационализации, изначально реализована насквозь уникодной. Но нет ничего такого, что не моглибы сделать программисты. :)
Ужас, сначала опрос, потом забаненый Ирси, теперь это... Мы теряем ЛОР! А если завтра начнёт падать процент визинозависимых?
А сам подумал, смакуя на всяческий манер эту мысль:
«Ну наконец-то двадцать первый век наступил и на ЛОРе. Теперь новости и комментарии можно писать, не похабя кривыми аппроксимациями символов. Нет, не выпить здесь совершенно нельзя.» И я выпил чашку крепчайшего черного кофе, от которого мои добрые глаза налились огненно-красным.
____________
¹ Что было, как и «жжош», выражением ни с чем не сравнимого восторга.
Неужто??? Теперь мы будем избавлены от необходимости читать новости уважаемого news bot'a на английском! Даешь японский! Правда лучше бы ЛОР и страницы в юникоде бы отдавал... :(
Меня слово "прежде всего" настораживает. То есть может и написанный ручками что ли показаться? А если это кусок из текста программы, и должен быть виден именно как сущность, а не как символ?
Тьфу, блин, а я было обрадовался... Тупая подмена html-сущности. Соответственно, теперь, чтобы написать &171; нужно вписывать &171; Ужоснах.
Хотя, всё равно спасибо, но в XXI веке, в _Java_ юзать KOI8-R...
А что делать, если KOI8-R. По другому, извиняйте, не получится.
На самом деле, прежде всего это сделано для того, чтобы скопированный (например, с других сайтов) текст не выглядел как &;#171; как раньше. Возможность вводить символы по коду &#xxxxx; - как side-effect. И действует только для числовых кодов, потому что, например, введённый значок '«' во внутреннем представлении преобразуется именно в &;#171;, приходя на сторону сервера.
Поэтому, кстати, и не работают мнемонические представления & и т.д.
Так что пока чем богаты. С перенесением базы в UTF-8 всё поменяется ).
Всё-таки не понимаю проблемы. Вот кусок вполне юникодного файла -
русский, английский, немецкий. Вставляю.
/* Datei öffnen*/
if (!(inf_h=fopen(inf_name,"r"))){
fprintf (stderr, "Невозможно открыть файл \"%s\" для чтения.\n", inf_name);
error=ERR_FOPEN;
goto error_handle;
}
error=cpmd_file_parse( inf_h, &s_data );
if (error != CPMD_OK) {
goto error_handle;
}
sh_write (stdout, &s_data, inf_name);
Вы же куски программы потом не из исходного текста html, а с экрана
копируете, правда?