какой аналог fopen или open для юникод имен?

Нету такого. В линуксе имена файлов хранятся в 8-битной кодировке. Если нужно, то преобразовывай имена вручную через wcstombs.

Хотя почему таких врапперов не сделали в glibc - непонятно.

smartly ★★★
(30.03.05 01:19:39 MSK)

Ответ на: комментарий от smartly 30.03.05 01:19:39 MSK

хмм, так что, получается, если я не знаю в какой кодировке сохранено имя файла то хрен я его открою?

anonymous
(30.03.05 01:26:55 MSK)

Ответ на: комментарий от anonymous 30.03.05 01:26:55 MSK

Вообще - да. Ну еще можно предположить, что в кодировке текущей локали.

anonymous
(30.03.05 01:43:43 MSK)

Ссылка

Ответ на: комментарий от anonymous 30.03.05 01:26:55 MSK

2anonymous (*) (30.03.2005 1:26:55):

>хмм, так что, получается, если я не знаю в какой кодировке сохранено имя файла то хрен я его открою?

Чой-то, даже, сложнее...

А если ты, допустим, на дискетку файл сбросил -- все, не открыть? (ты ж локаль при этом на дискетку не спасаешь?)

Die-Hard ★★★★★
(30.03.05 02:18:27 MSK)

Ответ на: комментарий от Die-Hard 30.03.05 02:18:27 MSK

> А если ты, допустим, на дискетку файл сбросил

Ну, по-хорошему, в mountе дискеты должно быть всё прописано...

С уважением -- Смоляное Чучелко

anonymous
(30.03.05 03:04:22 MSK)

Ссылка

Ответ на: комментарий от smartly 30.03.05 01:19:39 MSK

>Нету такого. В линуксе имена файлов хранятся в 8-битной кодировке.

Одна из таких кодировок - UTF8.

anonymous
(30.03.05 09:40:08 MSK)

Ответ на: комментарий от anonymous 30.03.05 09:40:08 MSK

так и как оно тогда хранится в utf-8 ?

у меня локаль utf 8 к примеру

И решиля создать файл cafe'.txt где апостроф это к e относится, т.е. французское название кафе. А файловая система у меня reiserfs, примонтированая без всяких опций кодировки. И в каком виде запишется это слово? А потом я перенес этот файл на другую систему, и у меня там есть файл cafе, где последняя буква e это русская прописная е. Или же тот анналог e' который после преобразования в 8битную строчку французского слова произойдет. И что, получится что у меня один файл затрет другой?

Плиз кто-нибудь набросайте тогда путь работы с локализованными файлами? Причем реально у меня может такая ситуация встречаться очень часто, т.е. когда много разных языков используются для поименования файлов. И причем даже те которые не могут быть в ansi, а именно китайский и вьетнамский.

anonymous
(30.03.05 11:23:12 MSK)

Ответ на: комментарий от anonymous 30.03.05 11:23:12 MSK

и правильно ли я понял что имена файлов записываются в фаловую систему в текущей локали, т.е. если у меня utf-8 и записал слово cafe' то оно запишется в 5 байт. И потом если я читаю его под не utf-8 то увижу caf[билиберда из 2 букв], а если в utf-8 локали то все будет нормально? И как тогда мне перед открытием файлов конвертить имена туда и обратно??? Что бы нормально открывать такие вот утф8 файлы и сохранять их правильно без потери национальных символов?

Заранее спасибо.

anonymous
(30.03.05 11:28:48 MSK)

Ответ на: комментарий от anonymous 30.03.05 11:28:48 MSK

Может я чего-то не понял, но open() и fopen() все равно какая локаль в данный момент установлена. Они получают указатель const char * на строку, которая должна заканчиваться нулем '\0' . UTF-8 гарантирует, что посередине строки не будет этого нулевого символа.

Dead ★★★★
(30.03.05 12:48:23 MSK)

Ответ на: комментарий от Dead 30.03.05 12:48:23 MSK

это да, но в utf8 приведеная в примере строчка будет не 4 байта а 5

и что на диск запишется?

anonymous
(30.03.05 14:17:21 MSK)

Ответ на: комментарий от anonymous 30.03.05 14:17:21 MSK

пять и запишется. И считается. А как на терминале будет выглядеть, зависит от кодировки терминала и опций монтирования.

~~bugmaker~~ ★★★★☆
(30.03.05 15:07:34 MSK)

Ответ на: комментарий от bugmaker 30.03.05 15:07:34 MSK

Тогда кто-нибудь может мне привести пример кода конвертирования wchar_t* строчки в char* строчку в utf-8, и обратно. (Не то что я ленивый, но чтобы сэкономить время на рисерче))

anonymous
(30.03.05 15:16:16 MSK)

Ответ на: комментарий от anonymous 30.03.05 15:16:16 MSK

кто-то может. примерно так:

#include <iconv.h>

wchar_t src [1024] = ...;
char dst [1024];
size_t il = скоко нужно, ol = 1024 /*скоко лезет*/;
char * ib = src;
char * ob = (char *) dst;
iconv_t ic = iconv_open ("UTF8", "WCHAR_T");
iconv (ic, &ib, &il, &ob, &ol);

voila! это из wchar_t в utf8. значения указателей ib, ob и il, оl в процессе преобразования меняются. man iconv короче.

~~bugmaker~~ ★★★★☆
(30.03.05 15:28:50 MSK)

Ответ на: комментарий от bugmaker 30.03.05 15:28:50 MSK

большое спасибо

anonymous
(30.03.05 15:34:49 MSK)

Ссылка

Ответ на: комментарий от anonymous 30.03.05 11:28:48 MSK

Я думаю, что ты и сам все понял, но еще раз на всякий случай.

Имя файла с точки зрения API OS и с точки зрения файловой системы есть завершенный нулем набор байт и не более того. Тот факт, что некоторые наборы символов при их визуализации или другой обработке специально обученными тулзами могут преобразовываться во французское кофе, с файловой системой связан довольно слабо.

>правильно ли я понял что имена файлов записываются в фаловую систему в текущей локали, т.е. если у меня utf-8 и записал слово cafe' то оно запишется в 5 байт

Смотря какой смысл в это вкладывать. Если твой терминал сможет трансформировать французской кофе в utf-8, то дальше с этой строчкой никто, скорее всего, никаких специальных действий производить не будет.

>потом если я читаю его под не utf-8 то увижу caf[билиберда из 2 букв]

А что значит "читаю не под utf-8? Да, просматривая каталог, ты увидешь строку в utf-8. Смогут ли ее праильно отобразить - отдельный вопрос.

anonymous
(30.03.05 16:27:56 MSK)

Ссылка

Ответ на: комментарий от anonymous 30.03.05 15:16:16 MSK

>Тогда кто-нибудь может мне привести пример кода конвертирования wchar_t* строчки в char* строчку в utf-8, и обратно. (Не то что я ленивый, но чтобы сэкономить время на рисерче))

Я же сразу написал. wcstombs. Только это не в UTF-8, а в текущую локаль, что лучше. (В начале программы не забыть setlocale(LC_ALL, ""); )

smartly ★★★
(30.03.05 22:02:24 MSK)

Ответ на: комментарий от smartly 30.03.05 22:02:24 MSK

всем спасибо

anonymous
(01.04.05 13:16:44 MSK)

Ссылка

Похожие темы