История изменений
Исправление saahriktu, (текущая версия) :
Напоминаю, что UTF-8 для строк по дефолту ввели только в 3-ей версии Python'а. В те времена, когда Гвидо ван Россум вводил функцию len() в Python, она работала именно так, как говорю я, т.е. она не кодепоинты считала, а именно символы. То, что сегодня она именно кодепоинты считает, - это минус UTF-8. В общем, ждём перехода на UTF-32, а до этого приходится довольствоваться такой точностью, поскольку лучше нормального варианта нет.
Исходная версия saahriktu, :
Напоминаю, что UTF-8 для строк по дефолту ввели только в 3-ей версии Python'а. В те времена, когда Гвидо ван Россум, вводил функцию len() в Python, она работала именно так, как говорю я, т.е. она не кодепоинты считала, а именно символы. То, что сегодня она именно кодепоинты считает, - это минус UTF-8. В общем, ждём перехода на UTF-32, а до этого приходится довольствоваться такой точностью, поскольку лучше нормального варианта нет.