История изменений
Исправление
gaylord,
(текущая версия)
:
нет, буквы, даже в мультибайт и UTF-16 кодировках - это байты или их последовательности. и комп работает с байтами. ну и отсюда надо и плясать. так работают лексеры и парсеры, так работают регекспы и много чего ещё. и все трансформации и прочее - это тоже байты и их последовательности. где-то это будет проще, где-то это будет какая-то лукап-таблица, но это всё одно и то же.
Он тонко намекает на то что любимая сишниками индексация по массиву со строками работает не очень. А как только появляются структуры данных, сишка начинает сосать за обе щеки, да ещё и причмокивать.
Исходная версия
gaylord,
:
нет, буквы, даже в мультибайт и UTF-16 кодировках - это байты или их последовательности. и комп работает с байтами. ну и отсюда надо и плясать. так работают лексеры и парсеры, так работают регекспы и много чего ещё. и все трансформации и прочее - это тоже байты и их последовательности. где-то это будет проще, где-то это будет какая-то лукап-таблица, но это всё одно и то же.
Он тонко намекает на то что любимая сишниками индексация по массиву со строками работает не очень.