LINUX.ORG.RU

История изменений

Исправление firkax, (текущая версия) :

Корректная и эффективная обработка UTF (UTF-8) строк в языке Си» …

Корректная обработка их весьма простая, а вот насчёт эффективной - это невозможно, и язык тут ни при чём. Виноват сам utf-8, что в нём для вычисления индекса символа надо сканировать всю строку до него. Это на любом языке будет уродливый оверхед (хотя на некоторых он может быть и спрятан от кодера внутрь библиотеки, но он от этого не исчезает).

Исходная версия firkax, :

Корректная и эффективная обработка UTF (UTF-8) строк в языке Си» …

Корректная обработка их весьма простая, а вот насчёт эффективной - это невозможно, и язык тут ни при чём. Виноват сам utf-8, что в нём для вычисления индекса символа надо сканировать всю строку до него.