LINUX.ORG.RU

[C++]UTF-8 посимвольное обращение

 


0

1

Сабж, как это можно реализовать без использования сторонних библиотек?
К примеру, пользователь ввел строку «Привет, мир». Требуется посимвольно (побуквенно?) её обработать, и если символ отвечает некоторым условиям, то выполнить соответствующие действие.

★★★★★

Ответ на: комментарий от m0rph

В том-то и дело, тянуть данную библиотеку совсем не хочется, ибо получится забивание гвоздей микроскопом.

joy4eg ★★★★★
() автор топика
Ответ на: комментарий от Reset

Не спорю, сложного нет, но думалось мне, есть некие «стандартные» способы для работы с ним.

joy4eg ★★★★★
() автор топика
Ответ на: комментарий от joy4eg

нормальных стандртных способов нет

Reset ★★★★★
()

все предельно просто


Bits 	Last code point 	Byte 1		Byte 2		Byte 3		Byte 4		Byte 5		Byte 6
7 	U+007F			0xxxxxxx
11 	U+07FF			110xxxxx 	10xxxxxx
16 	U+FFFF			1110xxxx 	10xxxxxx 	10xxxxxx
21 	U+1FFFFF		11110xxx 	10xxxxxx 	10xxxxxx 	10xxxxxx
26 	U+3FFFFFF		111110xx 	10xxxxxx 	10xxxxxx 	10xxxxxx 	10xxxxxx
31 	U+7FFFFFFF		1111110x 	10xxxxxx 	10xxxxxx 	10xxxxxx 	10xxxxxx 	10xxxxxx

s0L
()
Ответ на: комментарий от joy4eg

Можно :)

google://glib utf8 - первые две ссылки (больше внимания на вторую).

bk_ ★★
()
Ответ на: комментарий от anonymous

>#include <glibmm/ustring.h>
/usr/include/glibmm/ustring.h:24:26: фатальная ошибка: glibmmconfig.h: Нет такого файла или каталога
Смотрим...
#include <glibmmconfig.h>
Это опечатка? Так как файла config.h в glibmm тоже банально нету.
И такой инклуд почти во всех файлах.
P.S. Arch linux

joy4eg ★★★★★
() автор топика
Ответ на: комментарий от joy4eg

>А можно пинок в нужную сторону? :)

Да - glib не нужен.

madcore ★★★★★
()
Ответ на: комментарий от joy4eg

А можно пинок в нужную сторону? :)

int main()
{
    Glib::ustring s = L"नमस्ते";
    cout << s.size();
}
stevejobs ★★★★☆
()

man utf-8, там описано как Юникод кодируется в UTF-8. Перекодируем последовательность байт в wchar_t согласно ману, а дальше делаем с ним что надо.

Relan ★★★★★
()
Ответ на: комментарий от SSZB

>А как же быть с модифицирующими символами и лигатурами?

мне почему то кажется, что в данной задаче это можно проигнорировать. но если уж очень надо в вики есть соответствующие таблички.

s0L
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.