LINUX.ORG.RU

История изменений

Исправление gaylord, (текущая версия) :

нет, буквы, даже в мультибайт и UTF-16 кодировках - это байты или их последовательности. и комп работает с байтами. ну и отсюда надо и плясать. так работают лексеры и парсеры, так работают регекспы и много чего ещё. и все трансформации и прочее - это тоже байты и их последовательности. где-то это будет проще, где-то это будет какая-то лукап-таблица, но это всё одно и то же.

Он тонко намекает на то что любимая сишниками индексация по массиву со строками работает не очень. А как только появляются структуры данных, сишка начинает сосать за обе щеки, да ещё и причмокивать.

Исходная версия gaylord, :

нет, буквы, даже в мультибайт и UTF-16 кодировках - это байты или их последовательности. и комп работает с байтами. ну и отсюда надо и плясать. так работают лексеры и парсеры, так работают регекспы и много чего ещё. и все трансформации и прочее - это тоже байты и их последовательности. где-то это будет проще, где-то это будет какая-то лукап-таблица, но это всё одно и то же.

Он тонко намекает на то что любимая сишниками индексация по массиву со строками работает не очень.