LINUX.ORG.RU

История изменений

Исправление annulen, (текущая версия) :

Но это задача на звёздочку, для русского хватит перейти на u32.

Для русского (как и для всех остальных живых языков) за глаза хватит u16

Хотя вообще да, там есть ещё combining characters, которые тоже по-хорошему нужно считать одним символом с родителем, либо нормализовывать.

ICU в помощь.

Исходная версия annulen, :

Но это задача на звёздочку, для русского хватит перейти на u32.

Для русского (как и для всех не-CJK языков) за глаза хватит u16

Хотя вообще да, там есть ещё combining characters, которые тоже по-хорошему нужно считать одним символом с родителем, либо нормализовывать.

ICU в помощь.