почему в языки программирования вводят искусственные ограничения для идентификаторов?

баттхёрт, жж, идиотизм, языки программирования

1

1

мой баттхёрт от мейнстримных языков программирования продолжается. сегодня я подумал о сабже и взбугуртил так, что мне совершенно расхотелось писать на C (но всё равно пришлось).
возьмем, к примеру, такой код:

int return; // переменная с именем return
int ;; // переменная с именем ;
int an int; // переменная с именем an int
return = 0; // error
; = 0; // error
an int = 0; // error

, который не является валидным. и тут появляется вопрос: а ПОЧЕМУ он не является валидным?
грамматика C в основном регулярна, в выражении ; = 0; ровным счётом никакого труда не составляет определить, что ; — это, блджад, имя переменной, просто по расположению этого символа. ошибка на return = 0; — это вообще позор, неужели так сложно отличить переменную от ключевого слова? ну а про идиотию с запретом пробела в идентификаторах даже и говорить не хочется, особенно учитывая, что в Алголе-58 это было разрешено, а в потомках выпилили — нинужна, видите ли!
точно такая же петрушка имеет место и в других популярных языках: C++, Java, педон и остальная пыхоплеяда... хорошо хоть запрет иметь идентификаторы с одинаковым именем, но разными типами потихоньку уходит в прошлое (и то в основном только для функций).

у меня, собственно, остаётся только два вопроса:

зачем так сделано?
существуют ли языки, не калькирующие этот маразм?

Ссылка

← Как огранизовать очередь на PostgreSQL ?

SQL case →

← 1 2 3 →

Ответ на: комментарий от Kuzy 10.09.15 21:49:16 MSK

А что конкретно не устраивает?

Вот мы пишем сначала по предикату на каждое выражение

self-evaluating?

lambda?

quoted?

application?

и так далее

в SICP, допустим, дается такое, типо, определение


(define (self-evaluating? expr)
  (cond ((number? expr) true)
        ((string? expr) true)
        (else false)))

Но это ведь в некотором роде демагогия:) number? и string? уже есть на уровне языка, а если нам нужен свой синтаксис? значит у нас должен этому предшествовать синтаксический разбор. Допустим, строка у нас будет не лисповская, а тиклевская, что мы будем делать? Можем например, по регулярке опрределить /\{[^}]\}/ строку. Дальше то же самое, только сложней. Соответственно, все начинается с разбора, от него идут предикаты, а дальше по предикатам мы определяем, во что мы будем транслировать каждое из выражений, и какова будет промежуточная обработка. Что не так?

~~newKingOfTheBlock~~
(10.09.15 22:57:34 MSK)

Ответ на: комментарий от lazyklimm 10.09.15 22:35:26 MSK

(define define ...) устроит?

Угу, почти что

(define mydefine define)
(define define 1)

(mydefine foo 'bar)

;ERROR: "/root/test/scm/test": Use of keyword as variable define
; in expression: (define)

~~newKingOfTheBlock~~
(10.09.15 23:49:16 MSK)

Ответ на: комментарий от newKingOfTheBlock 10.09.15 23:49:16 MSK

(define mydefine define)

Ну, во-первых это уже невалидно by design(special forms, вот это всё), и я подозреваю, что ты это знаешь. А (define define 1), тем не менее, работает как и просил ТС.

lazyklimm ★★★★★
(10.09.15 23:56:05 MSK)

Ответ на: комментарий от lazyklimm 10.09.15 23:56:05 MSK

хотя конечно, можно обойти использованием оставшихся sf, но тоже неспортивно (потому что все не обоидёшь)

lazyklimm ★★★★★
(11.09.15 00:02:25 MSK)

Ссылка

Чтобы Си не был похож на Перл

Ваш КО

d_Artagnan ★★
(11.09.15 00:35:42 MSK)

Ссылка

Ответ на: комментарий от newKingOfTheBlock 10.09.15 16:51:02 MSK

там помимо языковых ограничений еще и свои воодят, код стайлы и прочую парашу.

И правильно делают! Когда один погромист пишет в одном стиле, второй - во втором, а третий - вообще без стиля и т.д. - код становиться абсолютно нечитаемым.

Ты вообще кроме наколенных поделок что-то писал, в крупных проектах работал?

drull ★☆☆☆
(11.09.15 09:09:50 MSK)

Ссылка

Ответ на: комментарий от x3al 10.09.15 17:51:19 MSK

Я бы тоже не называл возможность вставить себе кляп в рот и избить себя кожанной плеткой по яйцам чем-то хорошим. А вот newKingOfTheBlock видимо такое нравится.

drull ★☆☆☆
(11.09.15 09:15:27 MSK)

Ответ на: комментарий от newKingOfTheBlock 10.09.15 22:57:34 MSK

Лол, в sicp нету синтаксиса вообще, там сразу s-expr-ы интерпретируются.

Штука, которая делает из строчки s-expr (в случае лиспа) называется парсер. Неважно, в каком виде была исходная строка, это может быть какой-нибудь json, например. На выходе парсера будет s-expr-а. Дальше, ты можешь делать с ней что угодно, но все это не будет относиться к синтаксису (вот это вот в sicp есть).

Kuzy ★★★
(11.09.15 11:24:21 MSK)

Ссылка

Ответ на: комментарий от drull 11.09.15 09:15:27 MSK

То есть черное == это белое, гибкий мощный яп == bdsm, а java/haskell == свобода. ок

~~newKingOfTheBlock~~
(11.09.15 11:53:42 MSK)

Ссылка

Код в непоследнюю очередь должен быть человекочитаемым.
В твоих примерах это не так. При попытке разобраться подобном коде, размером более одного экрана, разработчик психанёт не меньше.

blexey ★★★★★
(11.09.15 13:13:52 MSK)

Ссылка

грамматика C в основном регулярна

ахахах лол

anonymous
(11.09.15 14:29:16 MSK)

Ссылка

Я вот сейчас как раз разбираюсь с подходом к идентификаторам в языках программирования. Поддержка Юникода в идентификаторах тащит за собой ещё один вопрос, про который вообще часто забывают, но который приходится как-то решать: нормализация.

В плане, «й» (U+0439) и «й» (U+0438 U+0306), «ō̧» (U+006F U+0304 U+0327) и «о̧̄» (U+043E U+0327 U+0304), «ℋ» (U+210B) и «H» (U+0048), «f» (U+0066) и «ｆ» (U+FF46), а также куча других вариантов — это всё разные идентификаторы или одинаковые? А если они упоминаются в строке? А если из-за визуальной неразличимости или различимости будет дыра в безопасности? А если идентификатор используется для поиска по файловой системе?

Регистронезависимых ~~уродцев~~ языков это касается вдвойне и приносит ещё кучу специфичных проблем.

ilammy ★★★
(12.09.15 12:23:11 MSK)

Ответ на: комментарий от ilammy 12.09.15 12:23:11 MSK

man нормализация Unicode.

Lincor ☆
(12.09.15 12:24:31 MSK) автор топика

Ответ на: комментарий от Lincor 12.09.15 12:24:31 MSK

И что я там должен увидеть? Тот же UAX#31 предоставляет целый веер вариантов (включая вариант «делай что хочешь, только задокументируй»), из которых приходится выбирать.

ilammy ★★★
(12.09.15 12:31:32 MSK)

Ссылка

Ответ на: комментарий от ilammy 12.09.15 12:23:11 MSK

Непонятно, в чем проблема. Идентификаторы - это же слова, они для человека. «йуг» и «йуг» для читающего одно и то же?

Регистронезависимых уродцев

Различать переменные в разных регистрах вроде пришло из математики. Там все пытаются обозвать одной буквой, а их мало. Для обычных людей регистронезависимость более естественна

anonymous
(12.09.15 12:54:54 MSK)

Ответ на: комментарий от anonymous 12.09.15 12:54:54 MSK

Проблема в том, что сложно делать это правильно с минимальными ограничениями. Надо тащить таблицы данных, реализовывать дополнительные алгоритмы. Или находить подходящую библиотеку, где это уже сделано. И следить за обновлениями версий Юникод-стандарта. И, что самое важное, принимать сложно отменяемые решения по вопросам вроде того, какую форму нормализации использовать.

В общем, появляется соблазн просто забить, приняв или «нельзя ничего, кроме ASCII», или «если это не ASCII, то пиши что хочешь, я всё равно буду тупо сравнивать байтики».

Это всё к вопросу, почему разработчики языков программирования не позволяют называть идентификаторы как угодно. Если наплевать на корректность или обратную/прямую совместимость, то всё естественно и элементарно.

ilammy ★★★
(12.09.15 14:17:21 MSK)