А как комфортно работать со строками в современном C++?

Привет, ЛОР.

Старый добрый std::string, как мы знаем, это по сути char* на стероидах. А во многих случаях надо работать со строками именно как со строками текста.

К примеру, в библиотеке QtCore, входящей во фреймворк Qt, есть класс QString. Её часто ругают за изобретение велосипедов. Но именно благодаря этой «фабрике велосипедов» я могу написать, например, так:

QString s;
QStringList sl;
...
if (sl.contains(s, Qt::CaseInsensitive)) {
    ...
}

И оно мне проверит наличие строки в списке, причём регистронечувствительным (второй параметр) способом. И не только для латинских символов. То есть если в списке есть «Капибара», в строке подойдёт как «Капибара», так и «капибара». Ещё есть split(), join() и дофига полезного.

А как такое сделать без QtCore, на голом STL? В C++20 появился некий std::u8string, он мне поможет, например?

Ссылка

← Govim, youcompleteme — предотвратить открытие split при автозаполнении

Существуют ли реальные примеры, где использование [[likely]] и [[unlikely]] приводит к улучшению производительности? →

← 1 2 3 4 5 →

Ответ на: комментарий от PPP328 22.02.25 11:56:12 MSK

По-моему, красиво. Этот ваш ascii так умеет?

anonymous
(22.02.25 12:11:35 MSK)

Ссылка

Ответ на: комментарий от anonymous 22.02.25 07:57:50 MSK

в ублюдочном Юникоде, который превратился из 2х байтового чара в ICU

Если бы юникод оставался двухбайтовым, мы бы имели обиженных китайцев, чьи иероглифы в первой версии юникода унифицировали с японскими. Поэтому переход на 4 байта был обусловлен объективно.

Вот отказ от фиксированной длины это уже был неоправданный перебор, который всё попутал. Эмодзи, символы фекалий и всё такое – это дискредитация юникода как способа записи текста и типографских символов разных языков. Пусть разными алфавитами, пусть с вымершими языками, но всё-таки текста. Насколько я понимаю, 4 байт на символ бы для этого хватило с запасом.

hobbit ★★★★★
(22.02.25 12:18:05 MSK) автор топика
Последнее исправление: hobbit 22.02.25 12:20:25 MSK (всего исправлений: 1)

Ответ на: комментарий от basename 21.02.25 13:26:59 MSK

пока не выйдет C++26

Ждать не устанешь?

anonymous
(22.02.25 12:18:51 MSK)

Ссылка

Ответ на: комментарий от PPP328 22.02.25 11:56:12 MSK

И тут возникает вопрос, не превратился ли современный юникод в тьюринг-полный язык…

Как тут не вспомнить вечнозелёный рассказ про топологию…

hobbit ★★★★★
(22.02.25 12:24:51 MSK) автор топика

Ответ на: комментарий от anonymous 22.02.25 11:34:21 MSK

«таков путь»

других комитетов(а это реально один из лучших способов согласования явно взаимно противоречивых стремлений) у нас для нас нет

«отверстие для дефекации» в стандарте объективное отражение реальности

идеализм не панацея

qulinxao3 ★☆
(22.02.25 12:28:15 MSK)

Ссылка

Ответ на: комментарий от PPP328 22.02.25 11:56:12 MSK

дык не для всех аксиома что все системы письма при взаимосовмещении получают не пустое

qulinxao3 ★☆
(22.02.25 12:31:00 MSK)

Ссылка

Ответ на: комментарий от static_lab 22.02.25 12:09:23 MSK

неа - там проблема имхо именно в том что хоть языки и обусловленны Хомско лаконичностью

но сама запись не факт что не протеворичива промеж нотаций

т/е универсальность vs самосогласованность

qulinxao3 ★☆
(22.02.25 12:32:39 MSK)

Ответ на: комментарий от hobbit 22.02.25 12:18:05 MSK

Дело не в конкретном кол-ве байт, а возможности формировать глифы путём комбинации кодпоинтов, и я сейчас не про ударения всякие, а про возможность написать условную букву «А» несколькими способами. А как такое случилось? А случилось это из-за этих самых иероглифов, которые не алфавит и их колечество бесконечно, надо формировать комбинациями. Всё это породило то, что имеем.

Иероглифы - это отсталая форма передачи информации, которая должна была отмереть вместе с австралопитеками, в 21 веке возможен только алфавит, который имеет постоянное и фиксированное количество символов. При всей любви к дорогим китайцам, но им или переходить на алфавит, или пользоваться какой-то другой кодировкой, которая никака несовместима с алфавитами.

Такой подход сохранил бы чистую, простую и понятную систему. Пусть это было всё в ASCII совместимом utf-8, никаких проблем. Но всё пошло по неправильному пути. Не знаю, его нужно сжечь и сделать нормально

anonymous
(22.02.25 12:33:32 MSK)

Ответ на: комментарий от hobbit 22.02.25 12:18:05 MSK

э не а если бустрафедрон?

qulinxao3 ★☆
(22.02.25 12:33:53 MSK)

Ссылка

Ответ на: комментарий от anonymous 22.02.25 12:33:32 MSK

иеоглифы нужны для коммуникации не с хомо сапинс сапинс (без рассизмы)

qulinxao3 ★☆
(22.02.25 12:35:24 MSK)

Ссылка

Ответ на: комментарий от hobbit 22.02.25 12:24:51 MSK

Читается на одном дыхании.

basename
(22.02.25 13:13:43 MSK)

Ответ на: комментарий от basename 22.02.25 13:13:43 MSK

Ото ж… Помню, его публиковали в журнале «Наука и жизнь» ещё тех времён, когда меня на свете не было, от деда достались.

Название перевели немножко скучно, «Лист Мебиуса». В оригинале было «A Subway Named Moebius», правильнее было бы, наверное, «метро имени Мёбиуса» или «подземка имени Мёбиуса».

hobbit ★★★★★
(22.02.25 13:27:28 MSK) автор топика

Ссылка

Современный С++ концептуально не отличается от С++ 89 года разлива или даже раньше. Это все тот же С с классами — читай язык про двигание чисел в регистрах и байт в памяти с попыткой в zero-cost абстракции по типу ООП. Это макро ассемблер на стероидах, эдакий конструктор. Именно поэтому только в плюсах (и сишке) ты найдешь миллиард реализаций строк и прочих контейнеров и алгоритмов — потому что это язык про это, про абстракции вокруг байтодрочки, а не решение скучных повседневных задач.

Ну а юникод — это просто позорище. Если utf-8 кодировку еще можно назвать вменяемым ответом на проблему экономной пересылки символов разных алфавитов, но сам юникод с его сраной компоновкой глифов… Зато с вишенкой 🍒 говна 💩 на торте 🎂.

anonymous
(22.02.25 13:41:15 MSK)

Ссылка

Ответ на: комментарий от qulinxao3 22.02.25 12:32:39 MSK

А при чём тут языки, если проблема в рендеринге глифов, которые заведомо не встретятся на практике иначе как в целях вот таких залго-извращений? Тут ещё нужно смотреть, как в самих шрифтах запрограммирована обработка сочетаний глифов. Даже в твоём примере можно заметить, что отдельные последовательности глифов шрифт пытается выстроить в удобочитаемом порядке, но в общем случае такое он не решит. И тут никакая кодировка не поможет: мы же хотим сделать отдельный глиф для буквы и отдельные глифы для акцентных знаков. А если оставить только буквы с акцентами (как в Win-1252), то несколько глифов для буквы в принципе не получится добавить.

static_lab ★★★★★
(22.02.25 16:09:13 MSK)

Ссылка

(на правах троллинга с элементами реальности)

«Современным C++», вообще, тяжело пользоваться, не то, что строками. Это все таки не Rust какой-нибудь, который прост как три копейки.

А ты попробуй разберись во всех этих многоэтажных конспектах… Без той печально известной книги Александреску по-моему так нечего даже и подходить к современному C++.

Поэтому люди обычно ограничиваются C++11 с элементами из C++14 и C++17.

anonymous
(22.02.25 16:37:18 MSK)

Ссылка

Ответ на: комментарий от hobbit 22.02.25 12:18:05 MSK

Если бы юникод оставался двухбайтовым, мы бы имели обиженных китайцев, чьи иероглифы в первой версии юникода унифицировали с японскими. Поэтому переход на 4 байта был обусловлен объективно.

Да, только китайцы до сих пор обижены, а иероглифы до сих пор унифицированы. Хуже того, что один и тот же набор символов будет рисоваться по-разному в зависимости от локали текста. То есть, иметь просто набор байт с валидным юникодом – недостаточно, нужны метаданные, чтобы его отрендерить. Это просто мрак, ад и холокост на ровном месте, мать его. Как можно было так обосраться, я даже не представляю.

Кстати, кириллица тоже совмещена. Текст на русском и на болгарском будет храниться одинаково в памяти, но буквы будут рендериться по-разному.

~~hateyoufeel~~ ★★★★★
(22.02.25 22:57:58 MSK)

Ответ на: комментарий от hateyoufeel 22.02.25 22:57:58 MSK

Да, только китайцы до сих пор обижены, а иероглифы до сих пор унифицированы

Кстати, кириллица тоже совмещена.

Гм, так ведь и латиница совмещена. Там тоже все друг на друга обижены? :))

MirandaUser2 ★★
(22.02.25 23:30:30 MSK)

Ответ на: комментарий от MirandaUser2 22.02.25 23:30:30 MSK

Гм, так ведь и латиница совмещена.

Латиница хотя бы одинаково рисуется. А вот русские и болгарские буквы – не всегда.

Там тоже все друг на друга обижены? :))

Не друг на друга, а юникодовцами.

~~hateyoufeel~~ ★★★★★
(23.02.25 00:22:38 MSK)

Ссылка

Ответ на: комментарий от hobbit 22.02.25 12:18:05 MSK

Просто создатели юникода не понимают, что кодировка и способ её компактного хранения это разные вещи, поэтому смешали всё вместе и получили самую удодскую кодировку из всех.

ya-betmen ★★★★★
(23.02.25 00:28:04 MSK)

Ссылка

Ответ на: комментарий от hateyoufeel 22.02.25 22:57:58 MSK

Да, только китайцы до сих пор обижены,

Да ладно, шрифтами всю разницу в написании глифов можно устранить. Да и их 1.5 миллиарда, наверняка все что нужно уже запили.

Aber ★★★★★
(23.02.25 00:38:25 MSK)

Ответ на: комментарий от Aber 23.02.25 00:38:25 MSK

Да ладно, шрифтами всю разницу в написании глифов можно устранить.

Проблема не в шрифтах. Шрифты как раз часто включают в себя все возможные варианты написания. Но как ты одним только шрифтом устранишь разницу в тексте, где языки совмещены? У тебя есть текст на китайском о Японии с цитатами на японском. Или наоборот. Херли ты в этом-то случае будешь делать без метаданных?

~~hateyoufeel~~ ★★★★★
(23.02.25 01:11:12 MSK)
Последнее исправление: hateyoufeel 23.02.25 01:11:22 MSK (всего исправлений: 1)

Ответ на: комментарий от hateyoufeel 23.02.25 01:11:12 MSK

В прокаченом текстовом процессоре наверное можно перехватывать смену языка и автоматом переключать фонт, т.е. почти как обычный word документы с разными стилями для разных фрагментов текста, а тут будет для японского включаться какой-нибудь шрифт Pretty Japan, для китайского шрифт Grate China.
Для делопроизводства где нужно мешать разные языки я бы сделал так, это первое что пришло мне в голову. Не знаком как это реализовано на практике.

Aber ★★★★★
(23.02.25 01:22:51 MSK)

Ответ на: комментарий от basename 22.02.25 13:13:43 MSK

Читается на одном дыхании.

А я, вот, что-то не оценил. Мне вообще литературные таланты автора показались спорными.

anonymous
(23.02.25 01:27:59 MSK)

Ссылка

Ответ на: комментарий от Aber 23.02.25 01:22:51 MSK

В прокаченом текстовом процессоре наверное можно перехватывать смену языка и автоматом переключать фонт, т.е. почти как обычный word документы с разными стилями для разных фрагментов текста, а тут будет для японского включаться какой-нибудь шрифт Pretty Japan, для китайского шрифт Grate China.

Ещё раз: нормальные шрифты имеют варианты для обоих языков. Проблема не в шрифте, проблема в хранении метаданных. Потому что сами по себе байты текста нифига не говорят о том, какой это язык. Хотя могли бы, но юникодники здесь обосрались.

Для делопроизводства где нужно мешать разные языки я бы сделал так, это первое что пришло мне в голову. Не знаком как это реализовано на практике.

На практике это реализовано метаданными. Например, тегом в HTML.

<p lang="en-GB">This paragraph is defined as British English.</p>

<p lang="fr">Ce paragraphe est défini en français.</p>

А теперь сценарий: тебе друг Вася пишет в чат строчку текста иероглифами. Как именно их нужно отрендерить? Вот именно: хер знает.

~~hateyoufeel~~ ★★★★★
(23.02.25 01:31:50 MSK)
Последнее исправление: hateyoufeel 23.02.25 01:34:28 MSK (всего исправлений: 3)

Ответ на: комментарий от hateyoufeel 23.02.25 01:31:50 MSK

Потому что сами по себе байты текста нифига не говорят о том, какой это язык.

Ты говоришь документ с кучей языков, я извиняюсь конечно, но такие вещи пишут в текстовых процессорах, не в текстовых редакторах.

В текстовых редакторах пишут кодеры, обычные люди нет.

друг Вася пишет в чат

Учитывая что китайцы пользуются своими мессенджерами, а не обычными, не удивлюсь если они это учли и пихают метаинфомрацию прямо в потоке байт с текстом.

Aber ★★★★★
(23.02.25 01:45:04 MSK)

Ответ на: комментарий от Aber 23.02.25 01:45:04 MSK

Ты говоришь документ с кучей языков, я извиняюсь конечно, но такие вещи пишут в текстовых процессорах, не в текстовых редакторах.

Я ничего не готовлю. У меня просто есть кусок байтов, которые представляют собой текст и который я хочу вывести на экран.

друг Вася пишет в чат

Учитывая что китайцы пользуются своими мессенджерами, а не обычными, не удивлюсь если они это учли и пихают метаинфомрацию прямо в потоке байт с текстом.

Какие-такие китайцы? Повторюсь: мой друг Вася скопировал из сабов любимого аниму строчку и кинул мне в чат. Как эту строчку рендерить?

~~hateyoufeel~~ ★★★★★
(23.02.25 02:12:22 MSK)

Ответ на: комментарий от hateyoufeel 23.02.25 02:12:22 MSK

Хорошо что «просто и привычно» слева направо, а не сверху вниз: https://president.mn/mng/.

gag ★★★★★
(23.02.25 04:36:55 MSK)

Ссылка

Ответ на: комментарий от PPP328 22.02.25 11:13:51 MSK

А если для нубов - в чем проблема посчитать?

LightDiver ★★★★★
(23.02.25 09:43:46 MSK)

Ответ на: комментарий от hateyoufeel 23.02.25 02:12:22 MSK

Повторюсь: мой друг Вася скопировал из сабов любимого аниму строчку и кинул мне в чат. Как эту строчку рендерить?

проблема решается просто: не дружить с анимешниками

anonymous
(23.02.25 09:47:36 MSK)

Ссылка

Ответ на: комментарий от hobbit 22.02.25 12:18:05 MSK

Да какая тебе разница чего туда напихали? Главное чтобы была спецификация нормальная, чтобы можно было глянуть что и как. А там с этим уже работай, не?

LightDiver ★★★★★
(23.02.25 09:48:18 MSK)

Ссылка

И оно мне проверит наличие строки в списке, причём регистронечувствительным

man wcscasecmp

saahriktu ★★★★★
(23.02.25 11:31:49 MSK)

Ссылка

Ответ на: комментарий от hobbit 22.02.25 12:18:05 MSK

Вот отказ от фиксированной длины это уже был неоправданный перебор, который всё попутал. Эмодзи, символы фекалий и всё такое – это дискредитация юникода как способа записи текста и типографских символов разных языков. Пусть разными алфавитами, пусть с вымершими языками, но всё-таки текста. Насколько я понимаю, 4 байт на символ бы для этого хватило с запасом.

О чём речь вообще? Конкатенация кодепоинтов в юникоде была тыщу лет, до всяких эмодзи. Всякие двоеточия над символами, вот это вот всё. Эмодзи вообще ничего не изменили. 4 байт на кодепоинт и сейчас хватает с запасом.

vbr ★★★★★
(23.02.25 11:35:23 MSK)

Ссылка

Ответ на: комментарий от hobbit 22.02.25 12:18:05 MSK

Насколько я понимаю, 4 байт на символ бы для этого хватило с запасом.

UTF-32 хватит всем! Остальные utf-* запретить!

Но история интересная: https://ru.wikipedia.org/wiki/Юникод.

dataman ★★★★★
(23.02.25 12:17:40 MSK)

Ссылка

Ответ на: комментарий от hobbit 22.02.25 12:18:05 MSK

Эмодзи, символы фекалий и всё такое – это дискредитация юникода как способа записи текста и типографских символов разных языков.

Как известно сумма разума на Земле постоянна, а население растет. Причем в сумме разума надо учитывать интеллект носимых гаджетов. Это кстати объясняет парадокс Ферми (почему мы не видим на небе следов деятельности высокоразвитых цивилизаций) - цивилизация в какой то момент открывает для себя IT, смартфоны/планшеты а дальше все.

Сейчас мы вживую наблюдаем формирование нового универсального языка из эмодзи. Скажем в аэропортах ты можешь спокойно ориентироваться по пиктограммам (эмодзи) не читая надписей. Этот общепринятый набор будет расти и в какой то момент вообще вытеснит слова для сапиенсов. В конце концов Эллочка-людоедка обходилась 30-ю словами - эмодзи примерно столько же.

Хорошая новость - после формирования такого словаря эмодзи юникод снова станет однобайтовым, причем с большим запасом;-)

~~AntonI~~ ★★★★★
(23.02.25 12:20:35 MSK)

Ссылка

Ответ на: комментарий от hateyoufeel 22.02.25 22:57:58 MSK

А можно пример кириллической буквы, которую в болгарском и русском языке принято изображать по разному?

iliyap ★★★★★
(23.02.25 12:55:16 MSK)

Ссылка

Ответ на: комментарий от hateyoufeel 23.02.25 02:12:22 MSK

Повторюсь: мой друг Вася скопировал из сабов любимого аниму строчку и кинул мне в чат. Как эту строчку рендерить?

а в UTF8 разве нельзя определить алфавит по символу(то есть мультибайту этого символа)?

alysnix ★★★
(23.02.25 13:02:56 MSK)

Ответ на: комментарий от hateyoufeel 22.02.25 22:57:58 MSK

Юникод хранит текст. Шрифты для его отображения указываются отдельно.

pasquale ★
(23.02.25 13:11:59 MSK)

Ссылка

Ответ на: комментарий от hobbit 22.02.25 12:18:05 MSK

Неверно. Под «символами» обычно понимаются графемы, многие из которых невозможно выразить одним код-пойнтом.

pasquale ★
(23.02.25 13:17:32 MSK)

Ссылка

Ответ на: комментарий от alysnix 23.02.25 13:02:56 MSK

Нет. Читай выше, в юникоде символы разных языков обозначаются одним кодпоинтом. Даже если в этих языках они рисуются по-разному.

~~hateyoufeel~~ ★★★★★
(23.02.25 13:19:04 MSK)
Последнее исправление: hateyoufeel 23.02.25 13:19:14 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от alysnix 23.02.25 13:02:56 MSK

В общем случае нет. Невозможно сказать, является ли символ болгарским, сербским или русским; китайским, корейским, вьетнамским или японским; польским или испанским.

pasquale ★
(23.02.25 13:19:08 MSK)

Ответ на: комментарий от LightDiver 23.02.25 09:43:46 MSK

В том, что там много тысяч правил конкатенации набора юникод-символов в символ. Из разряда акут + а = а́. Добавление всего нескольких сотен емоджи вообще привело к добавлению более десяти тысяч (!) комбинаций того, как надо рендерить. Там вообще теперь нужно не шрифт использовать, а детектить эмоджи, останавливать рендер шрифта, делать там пробел нужного размера, потом рендерить отдельно рисуя там графический эмоджи. Причем эта херня может быть сконкатенирована из комбинации 8 обычных эмоджи.

Это не говоря о том, что в строке могут быть модификаторы направления (из-за чего сегодняшние редакторы ни один не могут корректно такой случай обработать), можификаторы сдвига буквы, превращающий ее в надстрок/подстрок, при этом эти надстроки/подстроки по стандарту должны накапливаться неограниченно, но при попытке нарисовать такую zalgo-херню 99.99% редакторов не может определить высоту рендера и ломает нахер отображалку или делает графические артефакты при выделении текста.

Это я еще на упомянул, что нет нормального способа поделить шрифты на группы, чтобы использовать согласно вот текущей языковой группе, из-за чего вот вы выбрали шрифт, а все символы, которых у него нет будут браться не из какого-то другого который ВЫ указали, а какой он первый найдет. Например рисую я этикетку для товара и мне надо руками искать шрифт, в котором будут символы всех алфавитов и не сильно уебищные или самому из нескольких шрифтов собирать один Франкенштейн. Потому что ни в одной библиотеке рендера нельзя сказать «для группы 0х50000-0х70000 используй шрифт А», потому что тык тык, композитные символы, херак, и группа совсем другая. Китайцы вообще не парятся, всё что не китайский язык рендерится первым попавшимся говном.

И это всё не говоря о том, что просто так найти правила рендера в инете не получится, потому что всё это делалось кусками аппендиксами к стандартам, какими-то договоренностями и в итоге если вы напишете всё верно у вас будет вообще не так как у других, даже если у вас правильней.

PPP328 ★★★★★
(23.02.25 13:19:45 MSK)

Ответ на: комментарий от pasquale 23.02.25 13:19:08 MSK

а это что?

https://symbl.cc/en/unicode-table

alysnix ★★★
(23.02.25 13:21:31 MSK)
Последнее исправление: alysnix 23.02.25 13:22:39 MSK (всего исправлений: 2)

Ответ на: комментарий от PPP328 23.02.25 13:19:45 MSK

Причем эта херня может быть сконкатенирована из комбинации 8 обычных эмоджи.

На самом деле, всё хуже. Ты можешь сконкатенировать буквально три мегабайта говна в один эмоджи.

Неплохой пример по ссылке: https://paulbutler.org/2025/smuggling-arbitrary-data-through-an-emoji/, и это не единственный способ.

~~hateyoufeel~~ ★★★★★
(23.02.25 13:22:44 MSK)

Ссылка

Ответ на: комментарий от alysnix 23.02.25 13:21:31 MSK

Например, U+00F3 - это испанский или польский символ?

pasquale ★
(23.02.25 13:29:43 MSK)

Ответ на: комментарий от pasquale 23.02.25 13:29:43 MSK

Например, U+00F3 - это испанский или польский символ?

Latin Small Letter O with acute

какая разница-то? просто нужен фонт с таким символом. тебе ж рендерить, а не грамматику проверять.

alysnix ★★★
(23.02.25 13:36:13 MSK)
Последнее исправление: alysnix 23.02.25 13:37:02 MSK (всего исправлений: 1)

Ответ на: комментарий от alysnix 23.02.25 13:36:13 MSK

Потому что в зависимости от того, текст на каком именно языке рендерится, символ будет нарисован по-разному. Я об этом выше писал же уже.

Вот пример для иероглифов, где разница достаточно существенная. В юникоде это всё один и тот же символ U+8FD4. Больше примеров есть в педивикии.

~~hateyoufeel~~ ★★★★★
(23.02.25 13:38:13 MSK)
Последнее исправление: hateyoufeel 23.02.25 13:40:08 MSK (всего исправлений: 2)

Ответ на: комментарий от EXL 21.02.25 14:03:28 MSK

Интересно, как так получилось что за почти 40 лет разработки STL в C++ сосёт

Это плата за скорость. Не лысый, а аэродинамическая форма головы (с)

~~Obezyan~~ ☆
(23.02.25 13:48:23 MSK)

Ссылка

Ответ на: комментарий от hateyoufeel 23.02.25 13:38:13 MSK

забить вообще на эти иероглифы. это не наша проблема. и даже обсуждать не стоит. а то еще придется делать коды для узелкового письма майа, и черточек на палочках.

если у них там проблемы с иероглифами, они должны выкатить телегу в комитет, с предложениями о разносе каких-то символов по разным кодам.

за иероглифы кстати пора карать. в 21 веке живем. пора это камменоугольные кракозябры отправить на свалку истории.

alysnix ★★★
(23.02.25 13:56:46 MSK)
Последнее исправление: alysnix 23.02.25 13:59:09 MSK (всего исправлений: 1)

Ответ на: комментарий от basename 21.02.25 14:34:51 MSK

Требования к обратной совместимости.

Это все отговорки. Ничего не мешает завезти Traversable => Iterator/IteratorAggregate интерфейсы и на их базе добавить функции по работе со строками так как это есть уже во всех остальных языках в базе.

Но этого не произойдет пока не исчезнет догма двадцатилетней давности: char хватит для всего.

~~Obezyan~~ ☆
(23.02.25 14:06:55 MSK)

Ссылка

Ответ на: комментарий от PPP328 23.02.25 13:19:45 MSK

Оно умеет комбинироваться, создавая новые символы?! Шта?! А я тут на луа написал пару функций для работы с ютф8 и такой: «Как просто, ты смотри и чего все возмущаются?».

А если реально не париться и юзать конкретное?

LightDiver ★★★★★
(23.02.25 14:26:10 MSK)

Ссылка

Для того чтобы оставить комментарий войдите или зарегистрируйтесь.

← 1 2 3 4 5 →

← Govim, youcompleteme — предотвратить открытие split при автозаполнении

Development

Похожие темы