Ленивость и многопоточность

c++, haskell, multithreading, функциональное программирование

1

7

Говорят люди в интернете, мол используй функциональное программирование, отсутствие состояния, и никаких data race'ов не будет, и соответственно многопоточность будет достигаться легко.

Но тут я подумал о хаскелле и о его ленивости - а ведь ленивость приносит состояние. Допустим мы одну и ту же функцию вызываем из двух разных потоков. Вроде как в хаскелле ленивость кэшируется, и благодадря этому если вызвать одну и ту же функцию 2 раза, результат 2 раза считаться не будет. Но как с этим в многопоточных приложениях? Вдруг функция уже считается в одном потоке, а я ее вызову из другого потока? Чтобы это работало нормально, уже нужны какие-то механизмы синхронизации. А механизмы синхронизации это уже состояние.

Вот например в плюсах я ведь такого без изменяемого состояния сделать не смогу - там механизм синхронизации будет включать в себя что-то с состоянием, а в хаскелле значит тоже состояние есть, просто оно спрятано языком, и к нему нельзя получить доступ вручную.

Ссылка

←	Один файл glade для несколько элементов. Или как правильно делать?

память в линукс

→

И еще одна мораль басни - в хаскелле можно сделать memoization, не используя изменяемого состояния, а в нормальных языках нельзя. Ну вот никак ты memoization в плюсах чисто на фп не реализуешь.

hlebushek ★★
(26.07.15 17:40:17 MSK) автор топика

Ссылка

Я подписался на этот бред, вечером почитаю смешные коменты.

true_admin ★★★★★
(26.07.15 17:46:22 MSK)

Ссылка

А что thread-local?

~~arturpub~~ ★★
(26.07.15 17:53:22 MSK)

Ссылка

Тебе ссылки на статьи или тут на потроллить?

qnikst ★★★★★
(26.07.15 18:04:44 MSK)

Ссылка

http://www.amazon.com/Parallel-Concurrent-Programming-Haskell-Multithreaded/d...

mix_mix ★★★★★
(26.07.15 18:05:03 MSK)

Ответ на: комментарий от mix_mix 26.07.15 18:05:03 MSK

Не, тут нужно SPJ и SM статьи, по поводу того как все устроено и все эти наши gray/black holes. Заодно про unsafe/unsafeDupablePerformIO и прочих друзей.

qnikst ★★★★★
(26.07.15 18:08:16 MSK)

Ссылка

Всего этого не происходит. Он работает тупо в лоб

~~vertexua~~ ★★★★★
(26.07.15 18:23:39 MSK)

Ответ на: комментарий от vertexua 26.07.15 18:23:39 MSK

Чтобы знать, вычислен thunk или нет, надо хранить состояние. А к состоянию могут быть data race'ы.

hlebushek ★★
(26.07.15 18:35:50 MSK) автор топика

Ссылка

Ответ на: комментарий от vertexua 26.07.15 18:23:39 MSK

Это настолько же неверное утверждение как и предположение ТС.

qnikst ★★★★★
(26.07.15 18:38:44 MSK)

Ответ на: комментарий от qnikst 26.07.15 18:38:44 MSK

Lazyness есть, а куча остальной магии - отсебятина ТСа

~~vertexua~~ ★★★★★
(26.07.15 18:54:11 MSK)

Ответ на: комментарий от vertexua 26.07.15 18:54:11 MSK

Отсебятина ТС'а это что-то странное, но для работы с линивыми значениями в многопоточной среде всеж используются действия позволяющие обрабатывать случаи если двое тредов решили одновременно вычислить значение (что безопасно, но хочется избежать если вычисления большие). К сожалению я забыл название конкретной статьи, где это было хорошо расписано. А с телефона быстро пересмотреть похожие статьи чтобы найт и неудобно.

qnikst ★★★★★
(26.07.15 19:03:01 MSK)

Ссылка

В Хаскеле, емнип, используется STM.
В Эрланге эта проблема зарыта достаточно глубоко в недра BEAM, чтобы о ней париться разработчику. Для него у каждого процесса существует своё собственное «состояние», изолированное от других.

blexey ★★★★★
(26.07.15 19:48:22 MSK)

Главный ключевой термин для гугления qnikst уже назвал: black holes (есть и другие, но это самое важное). Когда один тред обёртку форсирует, он ставит на неё пометку, чтобы другой тред ждал его (если этому другому треду вдруг помеченное замыкание понадобится). Возможные при этом состояния гонки роли не играют, поскольку они на результат выполнения программы в целом влияния не оказывают.

nezamudich ★★
(26.07.15 20:14:06 MSK)

Ответ на: комментарий от blexey 26.07.15 19:48:22 MSK

STM к обсуждаемой теме отношения не имеет, скорее всего.

nezamudich ★★
(26.07.15 20:17:45 MSK)

Ссылка

Вдруг функция уже считается в одном потоке, а я ее вызову из другого потока? Чтобы это работало нормально, уже нужны какие-то механизмы синхронизации.

Для чистой функции?

t184256 ★★★★★
(26.07.15 20:19:33 MSK)

Ссылка

http://ezyang.com/jfp-ghc-rts-draft.pdf, а именно:

4.2 Synchronization
We now turn our attention to how thunks are updated. Updating a thunk with its new value constitutes mutation on shared state, thus, thunks up date is an important obstacle on the way to thread-safety.
A naıve approach is to synchronize all of the updates. This is extremely costly: Haskell programs do a lot of thunk updates! Once again, our saving grace is purity: as thunks represent p ure computation, evaluating a thunk twice has no observable effect: both evaluations are guaranteed to come up with the same result. Thus, we should be able to keep updates to thu nk unsynchronized, at the cost of occasional duplication of work when two threads race to evaluate the same thunk
[...]
4.3 Black holes
Some thunks take a long time to evaluate: we’d like to avoid du plicating their work. What we would like is for threads to notice when someone is working on a thunk, and wait for the result to become available. The mechanism by which this is implemented is a black hole , which represents a thunk that is currently being evaluated. A thunk can be claimed by overwriting it with a black hole. Black holes were originally proposed as a solution for a space leak that occured in some cases of tail calls (Jones, 2008), but they have found th eir utility in a multithreaded setting. Recall that a thread wishing to evaluate a thunk jum ps to the entry code; the entry code of a black hole places a thread on the blocked queue of the owner the black hole, to be woken up when the thunk has been evaluated.
There are two times when a black hole can be written: it can be eagerly written as soon as a thunk is evaluated, or it can be lazily deferred for when a thread has gotten descheduled (and thus the thunk was taking a long time to evaluate.) If a bl ack hole is written eagerly, it is on the fast path of thunk updates, and we cannot use synch ronization. We call these eager black holes (also known as grey holes ), which do not guarantee exclusivity. Lazy blackholing is done more infrequently, and thus we can affor d to use a CAS to implement them.
The upshot is that GHC is able to implement lazy evaluation wi thout any synchroniza- tion for most thunk updates, applying synchronization only when it is specifically neces- sary. The cost of this scheme is low: a single extra field in thu nk and a (rare) duplication of work upon a race [...]

sf ★★★
(26.07.15 21:04:30 MSK)

нужны какие-то механизмы синхронизации. А механизмы синхронизации это уже состояние

я тебе больше скажу: чтобы программа работала, ей нужна оперативная память, а память - это уже состояние

и каждый pthread_create внутри ядра обращается к единой для процесса таблице потоков (или единой для системы таблице задач, в зав-ти от реализации), которые тоже суть состояние

MyTrooName ★★★★★
(26.07.15 21:59:12 MSK)

Ссылка

в хаскелле значит тоже состояние есть, просто оно спрятано языком, и к нему нельзя получить доступ вручную

Всё так. Конкретно по твоему вопросу: когда тред начинает вычислять санк, infoPtr санка перезаписывается и при повторном заходе в него из другого треда, тред лочится. На самом деле немного хитрее, но суть примерно такая.

KblCb ★★★★★
(26.07.15 22:07:02 MSK)

Ссылка

Ответ на: комментарий от sf 26.07.15 21:04:30 MSK

А почему не написано, когда происходит это «specifically necessary» в

applying synchronization only when it is specifically neces- sary

hlebushek ★★
(27.07.15 05:51:51 MSK) автор топика

Ссылка

Ссылочная прозрачность. Ну, вычислишь ты один и тот же thunk дважды или трижды. Разве от этого результат изменится, хотя как тут подсказывают, существует некий механизм от повторных вычислений. Это уровень thunk'ов.

Побочные эффекты, изменяемое состояние и императивные вычисления идут уровнем выше. Там что-то похожее на монаду состояния.

~~dave~~ ★★★★★
(27.07.15 08:33:21 MSK)

Ссылка

Ответ на: комментарий от nezamudich 26.07.15 20:14:06 MSK

Возможные при этом состояния гонки роли не играют, поскольку они на результат выполнения программы в целом влияния не оказывают.

Чего? Такой тупизны ни разу еще не слышал, ты реально чемпион.

~~lennykravits2015~~
(01.08.15 13:14:40 MSK)

Ответ на: комментарий от lennykravits2015 01.08.15 13:14:40 MSK

Хотел сперва тебя отправить в статьи СПЖ, СМ или хотя бы в бложек к Янгу. Но потом подумал, а чем ты такое снисхождение заслужил?

nezamudich ★★
(01.08.15 16:10:49 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Один файл glade для несколько элементов. Или как правильно делать?

Development

память в линукс

→

Похожие темы