Typo ellipsis, или роботы на защите многоточий

Добрый день, Лор.

С неделю назад ко мне в гитхаб постучалось нечто с ником leela52452 и оставило пуллреквест. Предлагает все сочетания из трёх точек заменить на юникодные многоточия.

Посмотрел в профиль пришельца — 36 реп, все форкнутые. Кроме сиплюсплюснутых, есть проекты на яве, питоне, перле и даже Vala. Роботы нынче пошли с широким кругозором. :)

Собственно вопрос: а насколько это принято и безопасно? Сейчас, хвала Qt Linguist, у меня почти все файлы в ASCII. А тут уже юникодный спецсимвол, хоть и более-менее общепринятый. Есть примеры известных опенсорсных проектов, где такое лепят прямо в исходники?

Ссылка

← Клонировать репу

Отладка и просмотр объектов в памяти (python) →

← 1 2 →

Ответ на: комментарий от Iron_Bug 17.09.19 09:28:44 MSK

компост какбэ не нужен ни в русском, ни в английском. такие вещи используются в языках типа санскрита или тибетского, когда не хватает раскладки клавиатуры для ввода символов.

~~Eddy_Em~~, saahriktu, Lavos, принимайте пополнение в свои ряды.

dexpl ★★★★★
(17.09.19 10:10:36 MSK)

Ссылка

Только полный дебил будет в исходники хрюникод лепить!

~~Eddy_Em~~ ☆☆☆☆☆
(17.09.19 10:47:56 MSK)

Ответ на: комментарий от anonymous 13.09.19 15:44:44 MSK

Нормальный приятный код: https://www.stackage.org/haddock/lts-8.11/configuration-tools-0.2.15/src/Conf...

Нет, ненормальный.

Это и не традиционная «математическая» запись, и не традиционный «код». И для математика, и для программмиста читать это мучительно.

Если бы формулы в коде записывались в обычном виде, типа https://files.catbox.moe/f7ly90.png или там https://files.catbox.moe/5qfp03.png - было бы гораздо нагляднее

То есть нужно или отходить от линейной записи, или уже мучаться с ASCII-подмножеством, чтоб всех устраивало. Просто использовать буквы других алфавитов и заменять некоторые слова и символы на пиктограммы - ну такое

Deleted
(17.09.19 11:39:37 MSK)

Ссылка

Ответ на: комментарий от Iron_Bug 17.09.19 09:28:44 MSK

в программировании русский язык не нужен

http://программирование-по-русски.рф/static/для-ИА/содержание.яргт

anonymous
(17.09.19 11:48:09 MSK)

Ответ на: комментарий от anonymous 17.09.19 11:48:09 MSK

http://

В топку сразу.

anonymous
(17.09.19 11:51:14 MSK)

Ответ на: комментарий от anonymous 17.09.19 11:48:09 MSK

да, юникод и всякая национальная маргинальщина в url'ах тоже ненужны. не пользуюсь принципиально.

Iron_Bug ★★★★★
(17.09.19 11:59:49 MSK)
Последнее исправление: Iron_Bug 17.09.19 12:00:23 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Eddy_Em 17.09.19 10:47:56 MSK

Только полный дебил будет в исходники хрюникод лепить!

Ну я вот в одном месте исходников привёл список контрибуторов, и фамилию автора норвежского перевода (букмол, да) написал так, как он сам себя пишет (Allan Nordhøy). Как видим, присутствует юникодный символ. Я полный дебил или проявил уважение к человеку?

Или мне стоило отдельный файл ресурса заводить для этого списка контрибуторов? (По сути, тоже исходник, только не на C++.) Оверхедно как-то...

hobbit ★★★★★
(17.09.19 13:37:24 MSK) автор топика
Последнее исправление: hobbit 17.09.19 13:39:32 MSK (всего исправлений: 1)

Ответ на: комментарий от hobbit 17.09.19 13:37:24 MSK

Заведи что-нибудь вроде Readme.utf32, туда и пиши всякую непотребность...

а фамилии можно операторами латеха записывать: Nordh{\o}y.

~~Eddy_Em~~ ☆☆☆☆☆
(17.09.19 14:10:59 MSK)

Ссылка

Ответ на: комментарий от EXL 10.09.19 18:31:05 MSK

потому что несколько человек пишут всё в проекте на ASCII, а другое сексуальное меньшинство – покрывают всё свистопердящими стрелочками и emoji из Unicode

По-хорошему редактор сам должен заменять <= на ≤, ибо логически одна сущность и она прекрасно отображается в виде одного символа.

Через неделю он забудет про эти ellipsis’ы и в коде снова появятся ASCII-многоточия

Автозамена, опять же, или ворнинги, чтобы автор сам запилил.

если скормить такие исходные тексты компиляторам с некоторых не особо популярных платформ

Автор не исходники лялиха пилит, чтобы запускать их на кофеварках.

~~beaver~~ ☆
(17.09.19 14:25:22 MSK)

Ответ на: комментарий от beaver 17.09.19 14:25:22 MSK

Ну кофеварка не кофеварка, а вот под какой-нибудь Raspberry Pi мне в будущем хотелось бы свой проект собрать (впрочем, на ней, подозреваю, проблем быть не должно).

hobbit ★★★★★
(17.09.19 14:38:01 MSK) автор топика

Ответ на: комментарий от hobbit 17.09.19 14:38:01 MSK

под какой-нибудь Raspberry Pi

Под RPi или на RPi? Вопрос — тонкий намек на кросс-компиляцию.

dexpl ★★★★★
(17.09.19 15:10:46 MSK)

Ответ на: комментарий от dexpl 17.09.19 15:10:46 MSK

Эм, а есть принципиальная разница в свежести инструментария?

hobbit ★★★★★
(17.09.19 15:18:44 MSK) автор топика

Ссылка

Ответ на: комментарий от hobbit 17.09.19 13:37:24 MSK

Ну я вот в одном месте исходников привёл список контрибуторов, и фамилию автора норвежского перевода (букмол, да) написал так, как он сам себя пишет (Allan Nordhøy).

А должен был написать в исходниках Allan Nordhoy, а в файле перевода en_US.ts или подобном – Allan Nordhøy. Для этого они и созданы. Аналогично с копирайтами – В исходных текстах – (c), в файле перевода – Ⓒ.

~~EXL~~ ★★★★★
(17.09.19 18:05:44 MSK)

Ответ на: комментарий от beaver 17.09.19 14:25:22 MSK

По-хорошему редактор сам должен заменять <= на ≤, ибо логически одна сущность и она прекрасно отображается в виде одного символа.

Это если у проекта ровно один контрибьютор. А если их множество, то у кучи человек разные редакторы и разные настройки. В итоге в кодовой базе получается каша из ..., … и прочее непотребство из-за которого поиск по коду будет сильно затруднён.

Одно дело лигатуры шрифта, которые отображают <= как ≤, против них ничего не имею, другое дело – засирать исходники как символами <=, так и ≤.

Автозамена, опять же, или ворнинги, чтобы автор сам запилил.

Автозамена тут должна быть только в одну сторону – проверка файла на содержание Non-ASCII и приведение его к порядку.

~~EXL~~ ★★★★★
(17.09.19 18:13:52 MSK)

Ссылка

25 января 2020 г.

Ответ на: комментарий от EXL 17.09.19 18:05:44 MSK

Прошло 4 месяца. С тем же самым вопросом вылезло уже 2 человека. Причём на сей раз уже точно не боты и не скоронабиватели. Один пилит французский перевод, другой норвежский (тот самый Allan Nordhøy). От них отдача проекту точно есть, не отмахнёшься.

Мода, что ли по Европе пошла, что без многоточий жизнь не мила… Французу я ответил пока, что если я всё руками заменю, то во-первых, уйду от ASCII, во-вторых, что меня больше напрягает, подкину работу переводчикам. В lupdate ведь, как я понимаю, интеллектуальной замены нет, оно просто все старые переводы отметит как obsolete и добавит новые позиции, непереведённые от слова «совсем». И переводчикам их переводить с нуля. Или я чего-то про Лингвист не знаю?

Идея с en_US.ts выглядит многообещающе, кстати. Т.е. сырые строки из программы не показывать вообще, даже англоязычным, и сделать «перевод» и для них. Болванка для такового, кстати, в translations у меня валяется, только пустая пока…

Сижу, думаю грустно.

hobbit ★★★★★
(25.01.20 14:53:23 MSK) автор топика

Ответ на: комментарий от hobbit 25.01.20 14:53:23 MSK

И поскольку у большинства в трекере темы отсортированы по первому сообщению, а не по последнему, кастую ещё @alex-w и @DarthVadimius.

hobbit ★★★★★
(25.01.20 14:57:57 MSK) автор топика

Ответ на: комментарий от hobbit 25.01.20 14:57:57 MSK

И поскольку у большинства в трекере темы отсортированы по первому сообщению, а не по последнему, кастую ещё @alex-w и @DarthVadimius.

А я тут причём?

alex-w ★★★★★
(25.01.20 15:33:02 MSK)

Ответ на: комментарий от alex-w 25.01.20 15:33:02 MSK

При том, что участник очень известного Qt-проекта с кучей переводов. :)

hobbit ★★★★★
(25.01.20 16:50:16 MSK) автор топика

Ответ на: комментарий от hobbit 25.01.20 16:50:16 MSK

При том, что участник очень известного Qt-проекта с кучей переводов. :)

Для гуя мы используем юникод, да только в весьма ограниченном варианте (зачастую через QChar() что-то ставим) из-за того, что на разных платформах заявлено одинаковое представления юникода, а на деле оно разное и… не везде юникод есть в полном объёме. Сам код у нас ASCII, а вот комментарии и строки, которые отдаём пользователям - в юникоде. Ну и файлы в юникоде.

Что касается сборки, то GCC/Clang/MSVC/ICC собирают Stellarium без каких-либо проблем. LCC от МЦСТ тоже собирает без проблем, если грохнуть из исходников BOM, ну или в 23-й ветке lcc использовать ключик –ignore-utf8-bom

Другими компиляторами собирать планетарий не пробовал, но если кто-то желает проверить сборку с чем-то другим, то добро пожаловать (кстати, пока писал ответ, вспомнил, что у меня на дисках где-то официальная солярка есть с Sun Studio - надо бы найти диски и проверить там).

alex-w ★★★★★
(25.01.20 21:49:54 MSK)

Ответ на: комментарий от alex-w 25.01.20 21:49:54 MSK

Спасибо!

Сам код у нас ASCII, а вот комментарии и строки, которые отдаём пользователям - в юникоде. Ну и файлы в юникоде.

Наверное, в эту сторону и буду выруливать…

P.S. Только сейчас увидел, что в похожих темах ЛОР-ИИ предлагает различные «ЗАЩО». Да, действительно. :)

hobbit ★★★★★
(26.01.20 10:23:48 MSK) автор топика
Последнее исправление: hobbit 26.01.20 10:25:08 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от hobbit 25.01.20 14:53:23 MSK

Сижу, думаю грустно.

Найти все не ASCII-символы в кодовой базе можно с помощью чего-то вроде:

grep --color='auto' -P -n '[^\x00-\x7F]' -r src/main/

После чего планомерно их заменить.

~~EXL~~ ★★★★★
(27.01.20 12:13:46 MSK)

Ссылка

нафига в CPP/H то использовать юникод? .ui для того и существуют, что бы там. Код на c++ - это ascii < 127 , чо за фигню там пытаются насаждать в любимый с++

zendrz ★★
(27.01.20 15:00:44 MSK)

typo ellipsis, added
typo ellipsis, added
typo ellipsis, added
typo ellipsis, added
typo ellipsis, added

совсем с дуба рухнули не сквошить такое, пусть идет в сад - формальный повод не принимать такую срань.

zendrz ★★
(27.01.20 15:03:42 MSK)

Ссылка

Ответ на: комментарий от anonymous 17.09.19 11:51:14 MSK

В топку сразу.

смищно)

~~pyallnik~~
(27.01.20 15:04:03 MSK)

Ссылка

я бы прописал в меру собственных способностей а если кому то не понравилось бы и поступило бы личное обращение то обрисовал ситуацию что мол так и так я так делою, и если настаивания продолжатся сделол бы предложение смирится если не доходит то сказал бы давай альтернативу в таком то формате а не в том который ты прислал, а если итак не пройдет то пришлось бы распращться не смотря на то что трудно отмахнуться, сказал бы бери проект пели форк. трудно с людьми на мнение да ее и с притензией на оригинальность мутить темы вообщем.

~~pyallnik~~
(27.01.20 15:14:52 MSK)

Ссылка

но чисто по теме ты сам хочешь расширять сознание в сторону этого момента то видно потому наверное смысла нет отрицать этот момент (тафтология) который требует технического исключительно решения имха

~~pyallnik~~
(27.01.20 15:17:35 MSK)

Ссылка

Ответ на: комментарий от zendrz 27.01.20 15:00:44 MSK

чо за фигню там пытаются насаждать в любимый с++

Кто насаждает? Так-то пока на запилят нормальный метод ввода юникодных символов (аналог compose, но кроссплатформенный и современный), то я пока в ближайшем будущем не вижу места юникодным символам в исходниках. Лигатуры в некоторых шрифтах вполне годная альтернатива на данный момент

Unicode4all ★★★★★
(27.01.20 15:18:54 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

← Клонировать репу

Development

Отладка и просмотр объектов в памяти (python) →

Похожие темы