История изменений
Исправление gatsu, (текущая версия) :
А, ты же преобразуешь Unicode в UTF-8, тут всё элементарно.
Добавь игнорирование суррогатных пар UTF-16 (область 0xD800—0xDFFF).
https://github.com/gatsu/UTF8/blob/master/lib/utf8/base.php#L176
И вот это тебе может быть когда-нибудь пригодится: ftp://ftp.unicode.org/Public/UNIDATA/UnicodeData.txt
Исходная версия gatsu, :
А, ты же преобразуешь Unicode в UTF-8, тут всё элементарно.
Добавь игнорирование суррогатных пар UTF-16 (область 0xD800—0xDFFF).
https://github.com/gatsu/UTF8/blob/master/lib/utf8/base.php#L176
И вот это тебе может быть когда-нибудь понадобится: ftp://ftp.unicode.org/Public/UNIDATA/UnicodeData.txt