статьи по системам типов?

свой яп, упорин, функциональное программирование

Хочу какой-нить ликбез написанный простыми словами про существующие системы типов. А то я вот мучаюсь что выбрать для своего яп (википедию читал).

Пока решил идти от простого: три базовых иммутабельных типа (str, int, double), массив однородных данных и ADT. Я не уверен что мне хочется сделать всё это совершенно иммутабельным, но хочу чтобы передача параметров функции была по значению. Т.е. чтобы in-place модификация вложенных структур данных работала, но при этом это никак не влияло на другие функции которые тоже работают с этими данными. Это позволит избежать горождения огорода с хаскелевыми линзами. Есть ли у такого подхода научное название? И как бы это в коде реализовать?

Пока на ум приходит версионность данных. Типа, мы делаем x= 0; x++ и у нас x уже равен 1, но это не тот x что был изначально. (по-моему, меня на это натолкнули статьи про llvm и SSA).

PS вопросов у меня много, я лучше разобью на несколько постов.

PPS всем добра :)

Ссылка

← setup.py и мусор в PROJECT_ROOT

Как из eclipse сделать конфетку? →

← 1 2 →

Нужно больше языков программирования.

~~pylin~~ ★★★★★
(14.09.14 15:37:07 MSK)

Ответ на: комментарий от pylin 14.09.14 15:37:07 MSK

чем бы дитя не тешилось...

true_admin ★★★★★
(14.09.14 15:38:21 MSK) автор топика

Ответ на: комментарий от true_admin 14.09.14 15:38:21 MSK

лишь бы до редхета не добиралось:)

~~pylin~~ ★★★★★
(14.09.14 15:40:54 MSK)

Ссылка

Ответ на: комментарий от true_admin 14.09.14 15:38:21 MSK

По сабжу, вроде классикой считают этот учебник: Типы в языках программирования Б. Пирса, если в русском переводе.

~~pylin~~ ★★★★★
(14.09.14 15:42:23 MSK)

Ответ на: комментарий от pylin 14.09.14 15:42:23 MSK

О, точно, спасибо.

true_admin ★★★★★
(14.09.14 15:44:19 MSK) автор топика

Ссылка

Ответ на: комментарий от pylin 14.09.14 15:42:23 MSK

Плюсую данную книжку. Еще можно посмотреть мануал для какого-нибудь ЯП с годной системой типов. Standard ML или ATS (если хочется узнать что-то о зависимых типах и линейности).

buddhist ★★★★★
(14.09.14 15:44:26 MSK)

чтобы in-place модификация вложенных структур данных работала, но при этом это никак не влияло на другие функции которые тоже работают с этими данными

Не совсем понял, что ты хочешь

buddhist ★★★★★
(14.09.14 15:45:58 MSK)

Хочу какой-нить ликбез написанный простыми словами про существующие системы типов

Простыми словами - нет, но Википедия послужит хорошей точкой входа. Еще классика от Карделли: http://lucacardelli.name/Papers/OnUnderstanding.pdf

Пока на ум приходит версионность данных

Все в машину...

tailgunner ★★★★★
(14.09.14 15:47:51 MSK)

Ответ на: комментарий от buddhist 14.09.14 15:44:26 MSK

Именно так и делаю :). Конкретно, мануал по ocaml и сейчас читаю про hope.

На счёт зависимых типов. Читал статью по agda. Но т.к. материала слишком много то я для себя решил что зависимые типы это когда ты, например, принципиально не можешь выйти за пределы границы массива т.к. ЯП заставит тебя сделать constrains на значения переменной которая используется для индексирования. На сколько примитивно моё видение зависимых типов?

true_admin ★★★★★
(14.09.14 15:49:20 MSK) автор топика

Ответ на: комментарий от tailgunner 14.09.14 15:47:51 MSK

Все в машину...

А что так? :( Я ещё ничего не сделал, ещё не поздно всё исправить...

true_admin ★★★★★
(14.09.14 15:50:17 MSK) автор топика

Ответ на: комментарий от buddhist 14.09.14 15:45:58 MSK

Не совсем понял, что ты хочешь

CoW он хочет

~~mashina~~ ★★★★★
(14.09.14 15:51:06 MSK)

Ссылка

str, int, double

int и double давно пора объединить, если у тебя язык высокого уровня

чтобы in-place модификация вложенных структур данных работала
но при этом это никак не влияло на другие функции которые тоже работают с этими данными

зависит от этих функций.

Пока на ум приходит версионность данных

лучше сделай ис(з?)коробочную transactional memory как базовый элемент языка

MyTrooName ★★★★★
(14.09.14 15:52:32 MSK)
Последнее исправление: MyTrooName 14.09.14 15:52:49 MSK (всего исправлений: 1)

Ответ на: комментарий от buddhist 14.09.14 15:45:58 MSK

Допустим, у нас есть массив [1,2,3]. Мы его передаём в другой поток исполнения который работает паралельно. Теперь я меняю некоторый элемент массива. Я не хочу чтобы другой поток увидел эти изменения. Пусть он работает со своей локальной «копией».

true_admin ★★★★★
(14.09.14 15:53:04 MSK) автор топика

Ответ на: комментарий от true_admin 14.09.14 15:49:20 MSK

Зависимый тип — это, грубо говоря, вычисляемый тип. Процедура проверки типа при этом является некоторой программой (доказательством), которую пишет сам программист.

buddhist ★★★★★
(14.09.14 15:54:41 MSK)

Ссылка

Ответ на: комментарий от true_admin 14.09.14 15:53:04 MSK

Да, уже понял. Ну тогда либо линзы, либо простое навязывание иммутабельного стиля, как это любят в схемке, к примеру.

С copy-on-write может вылезти куча самых разных проблем, но попробовать можно

buddhist ★★★★★
(14.09.14 15:56:08 MSK)
Последнее исправление: buddhist 14.09.14 15:56:32 MSK (всего исправлений: 1)

Ответ на: комментарий от MyTrooName 14.09.14 15:52:32 MSK

int и double давно пора объединить

Ой, не, не надо :) В int можно, например, играться отдельными битиками, делать сдвиги и использовать как индекс массива. Индексировать по double... Потом, на больших значениях double становится неточным даже для целых чисел. Попробуй перевести 99999999999999999 в double и обратно.

transactional memory как базовый элемент языка

Моя давняя мечта, но у меня даже проца нет который это поддерживает.

true_admin ★★★★★
(14.09.14 15:56:38 MSK) автор топика

Ответ на: комментарий от MyTrooName 14.09.14 15:52:32 MSK

int и double давно пора объединить, если у тебя язык высокого уровня

расскажи как взять 1.0001(1) элемент из массива. И как это будет связанно с «уровнем» яп.

~~mashina~~ ★★★★★
(14.09.14 15:56:48 MSK)

Ссылка

Ответ на: комментарий от true_admin 14.09.14 15:50:17 MSK

А что так? :(

SSA - это внутреннее представление кода. Предлагать писать это человеку - кхм... неразумно.

Возможно, ты хочешь линейные типы или еще какую-то экзотику, но зачем? Хотя, с другой стороны, зачем тебе вообще свой язык...

tailgunner ★★★★★
(14.09.14 15:57:47 MSK)

Ответ на: комментарий от buddhist 14.09.14 15:56:08 MSK

С copy-on-write может вылезти куча самых разных проблем, но попробовать можно

Понял, лучше отложу на отдалённое будущее.

Спасибо за помощь.

true_admin ★★★★★
(14.09.14 15:58:04 MSK) автор топика

Ссылка

Ответ на: комментарий от true_admin 14.09.14 15:56:38 MSK

есть софтварные эмуляции, в том же хаскеле.

возьми какое-нить STM API и пиши на базе него

MyTrooName ★★★★★
(14.09.14 16:00:50 MSK)

Ссылка

Ответ на: комментарий от true_admin 14.09.14 15:56:38 MSK

Моя давняя мечта, но у меня даже проца нет который это поддерживает

Это же просто абстракция, которая может быть реализована и на обычной памяти.

К слову об интересных манипуляциях с памятью, советую посмотреть на region inference в MLKit.

buddhist ★★★★★
(14.09.14 16:04:00 MSK)

Ответ на: комментарий от true_admin 14.09.14 15:56:38 MSK

В int можно, например, играться отдельными битиками

не очень-то высокоуровневое действие. в ЯВУ ненужно

Индексировать по double

индексируй. в чем проблема?

на больших значениях double

для этих целей все равно должен быть BigInteger и BigDecimal

MyTrooName ★★★★★
(14.09.14 16:04:51 MSK)

Ответ на: комментарий от tailgunner 14.09.14 15:57:47 MSK

SSA - это внутреннее представление кода.

Всё верно, человек не должен над этим вообще думать.

ты хочешь линейные типы или еще какую-то экзотику, но зачем?

Чтобы сделать ЯП лучше :). Возможно, я плохо объяснил зачем это нужно. Это нужно для бОльшей потокобезопасности (статьи по системам типов? (комментарий))

зачем тебе вообще свой язык...

На то две причины:

1) помогает отвлечься на выходных от работы и переключиться на что-то другое.

2) Проснулся азарт. Хочу довести дело до конца.

ЗЫ вилдродень таки зарелизил свою игру или нет? Или зарелизил, а вышла какашка?

true_admin ★★★★★
(14.09.14 16:05:57 MSK) автор топика

Ответ на: комментарий от MyTrooName 14.09.14 16:04:51 MSK

для этих целей все равно должен быть BigInteger и BigDecimal

Да, я планирую сделать int резиновым через libgmp. По крайней мере для первого релиза.

true_admin ★★★★★
(14.09.14 16:07:26 MSK) автор топика

Ответ на: комментарий от true_admin 14.09.14 16:07:26 MSK

тогда и double замени на decimal и сделай резиновым, с заданной точностью

а еще лучше на float с заданным числом значимых цифр и основанием системы счисления, чтобы избежать ошибок округления :) мантисса будет массивом цифр, показатель - твой резиновый int. а в частных случаях можно использовать и машинные типы (2-ичная сс, 23 или 52 цифры) до первого overflow показателя.

MyTrooName ★★★★★
(14.09.14 16:09:41 MSK)
Последнее исправление: MyTrooName 14.09.14 16:16:57 MSK (всего исправлений: 3)

Ссылка

Ответ на: комментарий от true_admin 14.09.14 16:05:57 MSK

Возможно, я плохо объяснил зачем это нужно. Это нужно для бОльшей потокобезопасности (статьи по системам типов? (комментарий))

Единственная приличная потокобезопасность - это CSP. Если Хоар (другой Хоар) прав, для этого хватит линейных типов.

Проснулся азарт. Хочу довести дело до конца.

«От ненужных побед остается усталость» (ц)

И спроектировать юзабельный ЯП очень трудно.

ЗЫ вилдродень таки зарелизил свою игру или нет?

Он ее не сделал.

tailgunner ★★★★★
(14.09.14 16:10:46 MSK)
Последнее исправление: tailgunner 14.09.14 16:12:22 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от true_admin 14.09.14 15:56:38 MSK

Индексировать по double

насчет индексации я таки погорячился, для Haskel-подобного языка целочисленные типы однозначно лучше оставить. но тогда не нужно останавливаться на int, а сделать еще и uint. возможно

MyTrooName ★★★★★
(14.09.14 16:12:53 MSK)
Последнее исправление: MyTrooName 14.09.14 16:14:14 MSK (всего исправлений: 1)

Ссылка

Читай про систему типов Rust. Там можно мутировать при желании данные, но мутирующая ссылка может быть только одна. Соответственно проблем с разделяемым состоянием нет.

dizza ★★★★★
(14.09.14 16:15:52 MSK)

Ссылка

Ответ на: комментарий от buddhist 14.09.14 16:04:00 MSK

Это же просто абстракция, которая может быть реализована и на обычной памяти.

Кишка у меня тонка :). Я пару лет назад интересовался этим вопросом, мне результаты не понравились. PyPy пытается такое сделать, по состоянию на год назад получилось не очень.

Я не помню что я тогда накопал, но для себя решил что время STM придёт только когда это будет в железе, на уровне кода это слишком сложно. К сожалению, если не путаю, последнее поколение интеловых процов идёт с отключённым STM из-за бага. Собстно, вот: http://techreport.com/news/26911/errata-prompts-intel-to-disable-tsx-in-haswe...

region inference

Ееее, очень хочу поближе присмотреться к этой фишке. Если не ошибаюсь, это есть в rust.

true_admin ★★★★★
(14.09.14 16:16:38 MSK) автор топика

Ссылка

Ответ на: комментарий от true_admin 14.09.14 15:49:20 MSK

На сколько примитивно моё видение зависимых типов?

на уровне одного простого примера

jtootf ★★★★★
(14.09.14 17:19:54 MSK)

Пока на ум приходит версионность данных. Типа, мы делаем x= 0; x++ и у нас x уже равен 1, но это не тот x что был изначально

Если я правильно понял, то в Clojure есть коллекции с подобными свойствами: http://clojure.org/data_structures#Data Structures-Collections. И более общая ифа в вики: http://en.wikipedia.org/wiki/Persistent_data_structure .

hatefu1_dead ★
(14.09.14 17:40:39 MSK)

Ссылка

Меня как-то давно показались интересными замечания Дейта о типах в «Введении в СУБД». Он там писал что в СУБД для некоторых типов очень желательно держать и физическую размерность, множества это важный тип и т.п. Непонятно насколько это пригодилось бы в ЯП общего назначения, но вот с принудительными проверками размерностей и единиц измерения наверное можно было бы избежать некоторых факапов

версионность данных

Это что-то типа MVCC в тех же СУБД?

Deleted
(14.09.14 17:43:38 MSK)

Ответ на: комментарий от Deleted 14.09.14 17:43:38 MSK

но вот с принудительными проверками размерностей и единиц измерения наверное можно было бы избежать некоторых факапов

Я согласен и это сейчас решается с двух сторон.

1) ADT. Это канонический путь.

2) Планирую разрешить свои постфиксы к данным. Конкретный синтаксис пока не придумал. Можно как-то так:

# введёт тип данны время. Это часы или минуты
data Time = Hours Int | Minutes Int

# укажем что, скажем, 1h это (Hours 1)
::postfix h -> Hours
::postfix m -> Minutes

# зададим функцию для сложения
(+) left:Time, right:Time ->
    ...

# вот теперь их можно складывать
time = 1h + 2m

В общем, это пока не проработано потому что я не умею в функторы.

true_admin ★★★★★
(14.09.14 22:23:40 MSK) автор топика

Ответ на: комментарий от Deleted 14.09.14 17:43:38 MSK

Это что-то типа MVCC в тех же СУБД?

Про версионность это я наобум выпалил. Нужен был CoW и я предположил что его можно достичь через версионность (как именно — хз). Я думаю тут я фигню сморозил.

true_admin ★★★★★
(14.09.14 22:28:00 MSK) автор топика

Ссылка

Ответ на: комментарий от jtootf 14.09.14 17:19:54 MSK

на уровне одного простого примера

приведи ещё один

true_admin ★★★★★
(14.09.14 22:30:19 MSK) автор топика

Ответ на: комментарий от true_admin 14.09.14 22:23:40 MSK

Планирую разрешить свои постфиксы к данным

емнип scala что-то такое умеет.

MyTrooName ★★★★★
(14.09.14 22:55:58 MSK)

Ответ на: комментарий от true_admin 14.09.14 22:23:40 MSK

->

а можно заменить эту долбаную стрелочку на что-то более легко печатаемое? например, "::" или «//»

MyTrooName ★★★★★
(14.09.14 22:58:38 MSK)

Ответ на: комментарий от pylin 14.09.14 15:37:07 MSK

Как теоретическая задача «для себя» — неплохой способ размять голову. Лишь бы в продакшен оно не выпускалось!

comp00 ★★★★
(14.09.14 22:58:49 MSK)

Ссылка

Ответ на: комментарий от MyTrooName 14.09.14 22:55:58 MSK

это в фортране есть

basp ★
(14.09.14 22:59:09 MSK)

Ссылка

Ответ на: комментарий от MyTrooName 14.09.14 22:58:38 MSK

Чем стрелочка не угодила? :(

true_admin ★★★★★
(14.09.14 23:18:43 MSK) автор топика

Ответ на: комментарий от true_admin 14.09.14 23:18:43 MSK

печатать неудобно очень) оба знака одним и тем же пальцем набираю

MyTrooName ★★★★★
(15.09.14 00:02:38 MSK)

Ссылка

совершенно иммутабельным

модификация

Э-э-э... чего?

То есть, я, в принципе, могу понять это как «функция может менять свои параметры, но не может менять более ничего, и изменение ею своих параметров ни на что более не влияет», но смысл подобного от меня ускользает.

Miguel ★★★★★
(15.09.14 02:44:44 MSK)

Ссылка

Пока решил идти от простого: три базовых иммутабельных типа (str, int, double), массив однородных данных и ADT.

три базовых иммутабельных типа

Тогда делай уж 2: «А когда на кухне дежурит Гитлер, Сталин ест серпом и молотом.»(ц)

~~Napilnik~~ ★★★★★
(15.09.14 04:35:22 MSK)

Ссылка

Ответ на: комментарий от MyTrooName 14.09.14 15:52:32 MSK

int и double давно пора объединить, если у тебя язык высокого уровня

В языке высокого уровня типа int не под капотом вообще быть не должно - это такая дрянь, размер которой зависит от платформы и компилятора и которой заставляют пользоваться сишные библиотеки. Нужны типы неизменяемого размера: целочисленный и для дробных чисел.

Размер типа int не определяется стандартом, а зависит от компьютера и компилятора. Для 16-разрядного процессора под величины этого типа отводится 2 байта, для 32-разрядного – 4 байта.
Для точного определения количества байт следует написать тестовую программу и включить в нее операцию:

s=sizeof(int);

~~Napilnik~~ ★★★★★
(15.09.14 04:45:59 MSK)

Ответ на: комментарий от MyTrooName 14.09.14 22:55:58 MSK

И С++ ещё

Begemoth ★★★★★
(15.09.14 08:21:47 MSK)

Классика: Пирс TAPL/ATTAPL + любая книжка по SML.

Ну и более навороченные статьи тут (synrc.com).

Алсо годная библиотечка.

ymn ★★★★★
(15.09.14 09:12:59 MSK)

Ссылка

Ответ на: комментарий от true_admin 14.09.14 22:30:19 MSK

приведи ещё один

функция, гарантированно принимающая (возвращающая) сортированный массив. taint check. функция, гарантированно вызываемая в синхронизированном контексте. генератор, возвращающий n значений без коллизий

с проверкой гарантий во время компиляции

jtootf ★★★★★
(15.09.14 13:20:26 MSK)