История изменений
Исправление annulen, (текущая версия) :
Но это задача на звёздочку, для русского хватит перейти на u32.
Для русского (как и для всех остальных живых языков) за глаза хватит u16
Хотя вообще да, там есть ещё combining characters, которые тоже по-хорошему нужно считать одним символом с родителем, либо нормализовывать.
ICU в помощь.
Исходная версия annulen, :
Но это задача на звёздочку, для русского хватит перейти на u32.
Для русского (как и для всех не-CJK языков) за глаза хватит u16
Хотя вообще да, там есть ещё combining characters, которые тоже по-хорошему нужно считать одним символом с родителем, либо нормализовывать.
ICU в помощь.