Реализация PyPy языка Python избавляется от глобальных блокировок

gil, pypy, python

Глобальные блокировки в CPython (стандартная реализация языка python) долгое время были камнем преткновения и предметом многочисленных споров. В реализации PyPy, до недавнего времени, была применена схожая техника разграничения доступа к общим данным.

В настоящее время команда разработчиков проекта PyPy работает над альтернативным алгоритмом разграничения доступа к общим данным. Вместо блокировок предлагается использовать транзакции по аналогии с базами данных.

Вместо прямого изменения содержимого оперативной памяти программа работает со специальной областью (транзакционной памятью), в которую вносятся все изменения. По завершению обработки эти изменения атомарно вносятся в память программы. В случае обнаружения коллизии с другими транзакциями, изменения вносятся только от первой транзакции; остальные транзакции отменяются и отправляются на повторное выполнение.

Это оптимистичный алгоритм, каждая нить выполняют код без учёта того что делают другие нити.

Несмотря на то, что алгоритм может давать значительные потери производительности при высокой конкуренции за данные, он выглядит очень перспективным. Во-первых, он позволяет работать нескольким нитям независимо над разными частями одного объекта в памяти (при использовании блокировок пришлось бы ставить блокировку на весь объект целиком). Во-вторых, при возникновении многочисленных коллизий при доступе к одному объекту, менеджер транзакций может упорядочить выполнение кода (это будет аналогично наличию блокировки на этот объект).

В целом, хотя новый подход и имеет недостатки, он позволяет радикально улучшить производительность многих устоявшихся шаблонов проектирования. Например, в ситуации, когда каждая нить работает только со своими данными. В частности, это позволит эффективно масштабировать на многопроцессорных системах большинство серверных приложений.

>>> Подробности

Ссылка

← Линус Торвальдс не видит для ФС пространства пользователя серьезного применения

GNU awk 4.0.0 →

← 1 2 →

что-то он темнит

So, when will it be done? I cannot say yet. It is still at the idea stage, but I think that it can work. How long would it take us to write it? Again no clue, but we are looking at many months rather than many days. This is the sort of thing that I would like to be able to work on full time after the Eurostars funding runs out on September 1.

anonymous
(01.07.11 15:47:02 MSK)

А как они будут помечать начало и конец транзакции?

Manhunt ★★★★★
(01.07.11 15:55:03 MSK)

Ответ на: комментарий от Manhunt 01.07.11 15:55:03 MSK

> А как они будут помечать начало и конец транзакции?

В смысле? Там идея в том чтобы производить изменения не в реальной памяти а в буфере. После внесения изменений данные из буфера накатываются на память.

Или вопрос в том как оно узнает что другая транзакция не была накатана? Есть несколько способов, обо всех них я узнал из википедии. Лучше я своими словами это пересказывать не буду и отправлю к оригиналу: http://en.wikipedia.org/wiki/Software_transactional_memory

Кстати, там сказано что уже для питона что-то реализовали, но я не разбирался что.

true_admin ★★★★★
(01.07.11 15:58:49 MSK) автор топика

Ответ на: комментарий от anonymous 01.07.11 15:47:02 MSK

что-то он темнит

почему же, наоборот намекает что ему нужен грант т.к. старый скоро заканчивается :)

true_admin ★★★★★
(01.07.11 16:12:43 MSK) автор топика

Ссылка

>В настоящее время комманда разработчиков проекта PyPy работает над альтернативным алгоритмом разграничения доступа к общим данным

Когда сделают, тогда и постите новость.

elverion
(01.07.11 16:19:00 MSK)

Ссылка

the translation step «insert STM logic» is never going to be mandatory. You will get either a regular pypy-c-gil or a pypy-c-stm, as two different executables, and you will choose the one most suited for your particular program

Не взлетит.

tailgunner ★★★★★
(01.07.11 16:27:44 MSK)

Ответ на: комментарий от true_admin 01.07.11 15:58:49 MSK

> В смысле?

Ок, перефразирую вопрос. Допустим, в одном из потоков выполняется некий участок кода. Начало и конец очередной транзакции в этом коде должны быть отмечены вручную? Или оно само решает, на сколько и каких транзакций выполнение этого кода нужно разбить?

Manhunt ★★★★★
(01.07.11 16:30:05 MSK)

Ответ на: комментарий от Manhunt 01.07.11 16:30:05 MSK

STM монада в хаскеле - там оно уже реализовано.

anonymous
(01.07.11 16:47:12 MSK)

Ответ на: комментарий от Manhunt 01.07.11 16:30:05 MSK

> Начало и конец очередной транзакции в этом коде должны быть отмечены вручную?

Да.

Или оно само решает, на сколько и каких транзакций выполнение этого кода нужно разбить?

Транзакция в коде задана четко, но может выполнится несколько раз, прежде чем закоммитится. Это конечно же в случае, если происходят коллизии с другими транзакциями.

sanuda
(01.07.11 17:05:09 MSK)

Ответ на: комментарий от sanuda 01.07.11 17:05:09 MSK

> Да.

Ок, спасибо.

Manhunt ★★★★★
(01.07.11 17:07:54 MSK)

Ссылка

Ответ на: комментарий от tailgunner 01.07.11 16:27:44 MSK

Не взлетит.

наоборот. Там же оверхед гигантский для однопоточных приложений. Поэтому лучше иметь два варианта. Как раз с коллегами обсуждали это.

true_admin ★★★★★
(01.07.11 17:17:40 MSK) автор топика

Ответ на: комментарий от true_admin 01.07.11 17:17:40 MSK

> лучше иметь два варианта.

При «гигантском оверхеде» оно вообще не нужно; а с двумя вариантами оно еще и останется неотлаженным (поскольку все будут пользоваться вариантом без STM).

tailgunner ★★★★★
(01.07.11 17:19:33 MSK)

Ссылка

Всё прекрасно, вот только сделали бы поддержку уже полную твистеда да джанго, цены бы не было. (А вообще, последнее время наслаждаюсь ерлангом)

Binary ★★★★★
(01.07.11 21:30:15 MSK)

Ссылка

Ответ на: комментарий от anonymous 01.07.11 16:47:12 MSK

Я думал, что тролли, которые скажут, что в хаскеле это было уже давно, прибегут попозже :)

buddhist ★★★★★
(01.07.11 23:22:56 MSK)

А для Debian есть? А то что-то его в репозитории не видно.

~~terminator~~
(01.07.11 23:25:52 MSK)

Ссылка

Не новость это. Если о каждой идее, которую еще никто даже не начал планировать реализовывать, писать на ЛОРе, то через неделю жесткий диск переполнится!

provaton ★★★★★
(01.07.11 23:33:41 MSK)

Ссылка

и когда же

они надеяться избавиться от блокировок окончательно ?

argin ★★★★★
(01.07.11 23:35:10 MSK)

Ответ на: и когда же от argin 01.07.11 23:35:10 MSK

Без блокировок не бывает многопоточных приложений. Главное, чтоб не было глобального лока.

provaton ★★★★★
(01.07.11 23:37:18 MSK)

Можно поправить новость, написав в чердаке что в PyPy хотят сделать STM? Ну и в метки поставить, событие довольно важное.

tensai_cirno ★★★★★
(01.07.11 23:41:33 MSK)

Ответ на: комментарий от provaton 01.07.11 23:37:18 MSK

Без блокировок не бывает многопоточных приложений.

man erlang

shahid ★★★★★
(01.07.11 23:43:34 MSK)

Ответ на: комментарий от provaton 01.07.11 23:37:18 MSK

ну это понятно

просто у нас тут сейчас жарко :-)

важно когда они намерены эту работу завершить и как это будет в конце концов реализовано

argin ★★★★★
(01.07.11 23:43:48 MSK)

Ссылка

Ответ на: комментарий от shahid 01.07.11 23:43:34 MSK

В эрланге процессы никогда не ждут сообщения чтоб продолжить работу?

provaton ★★★★★
(01.07.11 23:44:31 MSK)

Ссылка

Ответ на: комментарий от shahid 01.07.11 23:43:34 MSK

>> Без блокировок не бывает многопоточных приложений.

man erlang

Ты правда думаешь, что в Erlang нет блокировок?

tailgunner ★★★★★
(01.07.11 23:44:36 MSK)

написал большой пост о том, почему не взлетит, и упал Фокс. так вот, не взлетит, инфа 100%

val-amart ★★★★★
(01.07.11 23:48:12 MSK)

Ответ на: комментарий от val-amart 01.07.11 23:48:12 MSK

юзай лазарус форм рековери.

provaton ★★★★★
(01.07.11 23:49:17 MSK)

Ссылка

Ответ на: комментарий от tailgunner 01.07.11 23:44:36 MSK

Ты правда думаешь, что в Erlang нет блокировок?

Увы нет, но я этого и не утверждал. При отказе от прямой изменяемости данных, отсутсвии каких-либо глобальных переменных и высокой изолированности процессов, разделяемые объекты и блокировки к ним не становятся головной болью, как это сейчас происходит в питоне/жабе/итд.

shahid ★★★★★
(01.07.11 23:53:32 MSK)

Ответ на: комментарий от shahid 01.07.11 23:53:32 MSK

> При отказе от прямой изменяемости данных, отсутсвии каких-либо глобальных переменных и высокой изолированности процессов, разделяемые объекты и блокировки к ним не становятся головной болью, как это сейчас происходит в питоне/жабе/итд

За исключением «прямой изменяемости данных», всё это реализуемо и в Питоне/Жабе/Си. А в топике речь идет вообще о другом - о реализации исполняющей системы для Питона.

tailgunner ★★★★★
(01.07.11 23:56:00 MSK)

Ответ на: комментарий от tailgunner 01.07.11 23:56:00 MSK

За исключением «прямой изменяемости данных», всё это реализуемо и в Питоне/Жабе/Си. А в топике речь идет вообще о другом - о реализации исполняющей системы для Питона.

Всё реализуемо. Всё и везде. А в топике речь вообще о другом - о реализации системы костылей к инвалиду от рождения.

shahid ★★★★★
(02.07.11 00:00:16 MSK)

Ответ на: комментарий от shahid 02.07.11 00:00:16 MSK

> речь вообще о другом - о реализации системы костылей к инвалиду от рождения.

В то, что ты специалист по инвалидам от рождения, я верю сразу :D

tailgunner ★★★★★
(02.07.11 00:03:28 MSK)

Ссылка

Ответ на: комментарий от provaton 01.07.11 23:37:18 MSK

Посмотрите на Erlang. там все приложения многопоточные и без блокировок.

anonymous
(02.07.11 00:15:03 MSK)

Ответ на: комментарий от anonymous 02.07.11 00:15:03 MSK

многопоточные и без блокировок.

хаха.

Неужели вы думаете, что если один процесс ждет сообщения от другого процесса, то это принципиально отличается от ожидания освобождения мютекса в сишной программе?

Мне безусловно намного больше импонирует реализация многопоточности в эрланге, но говорить что в ней отстутствуют блокировки это нечестно и унизительно, потому что многопоточность без блокировок (без возможности остановить другой процесс, грубо говоря) зачастую просто бесполезна.

provaton ★★★★★
(02.07.11 00:27:28 MSK)

Ссылка

Ответ на: комментарий от anonymous 02.07.11 00:15:03 MSK

> Посмотрите на Erlang. там все приложения многопоточные и без блокировок.

Еще один... Просто атака экспертоты какая-то.

~~rtvd~~ ★★★★★
(02.07.11 00:37:18 MSK)

Ссылка

Ну вот, уже MESI протокол в пистон лепят... Ну дятлы...

anonymous
(02.07.11 00:37:49 MSK)

Ссылка

Ответ на: комментарий от buddhist 01.07.11 23:22:56 MSK

> Я думал, что тролли, которые скажут, что в хаскеле это было уже давно, прибегут попозже :)

<troll>И кстати, в хаскеле STM таки работает. Причем чудесно. В отличии от ...</troll>

~~rtvd~~ ★★★★★
(02.07.11 00:38:24 MSK)

Ссылка

Ответ на: комментарий от tensai_cirno 01.07.11 23:41:33 MSK

Можно поправить новость

после утверждения править не могу :(

что в PyPy хотят сделать STM?

Слово pypy там есть, ну а stm пало жертвой литературной адаптации :(. Да, надо было куда-нить воткнуть для тех кто в теме.

Кстати, про менеджер транзакций это была отсебятина :). Но идея в первом приближении неплохая. Надо будет написать авторам pypy.

true_admin ★★★★★
(02.07.11 01:01:34 MSK) автор топика

Ответ на: комментарий от true_admin 02.07.11 01:01:34 MSK

> Слово pypy там есть, ну а stm пало жертвой литературной адаптации

Не стоит увлекаться адаптацией, а то PyPy в ПиПи превратиться таким образом может ;)

tensai_cirno ★★★★★
(02.07.11 01:39:21 MSK)

Ответ на: комментарий от shahid 01.07.11 23:43:34 MSK

> man erlang

erlang не многопоточный

Joe_Bishop ★
(02.07.11 01:42:36 MSK)

Ссылка

Забыл добавить, мну стыдно за пунктуацию :(. Но теперь я уже исправить её не могу.

true_admin ★★★★★
(02.07.11 02:05:58 MSK) автор топика

Ссылка

Ответ на: комментарий от tensai_cirno 02.07.11 01:39:21 MSK

PyPy в ПиПи превратиться таким образом может ;)

Это уже не адаптация, это кривое заимствование :).

true_admin ★★★★★
(02.07.11 02:07:08 MSK) автор топика

Ссылка

А кто-нибудь понял, как оно будет перезапускать транзакции с сайд эффекатами?

dizza ★★★★★
(02.07.11 02:52:34 MSK)

Ответ на: комментарий от dizza 02.07.11 02:52:34 MSK

Там не будет сайд-эффектов.

tailgunner ★★★★★
(02.07.11 02:58:55 MSK)

Ссылка

пусть напишут, поговорим.

t184256 ★★★★★
(02.07.11 04:08:48 MSK)

Ссылка

А я не верю в STM. Ведь по сути это тот же мютекс, только вид сбоку. Да. тут отсутствует явный лок и анлок, который приводит к дедлокам, но по прежнему два треда бьющиеся за один участок памяти могут делать это с солидным оверхедом. И чем больше этот участок памяти, тем больше шанс коллизий и тем больше оверхед.

Ну авторам PyPy виднее чо, посмотрим что сделают.

nsf
(02.07.11 05:30:12 MSK)

>транзакционной памятью

Неизбежен отсос по всем фронтам, как и во всех остальных попытках реализовать STM на императивных выблевах.

anonymous
(02.07.11 09:56:17 MSK)

Ссылка

Ответ на: комментарий от dizza 02.07.11 02:52:34 MSK

> А кто-нибудь понял, как оно будет перезапускать транзакции с сайд эффекатами?

Читаем что такое STM. Транзакция не может быть с сайд эффектом.

tensai_cirno ★★★★★
(02.07.11 11:19:37 MSK)

Ответ на: комментарий от nsf 02.07.11 05:30:12 MSK

по сути это тот же мютекс, только вид сбоку

Нуу, тут есть нюансы. Я бы назвал это мютексом на страницу памяти, а это многое может поменять.

В общем, очень хочется видеть эту технику в действии(хотя бы в прототипе) чтобы понять на сколько оно нужно.

А лучше видеть аппаратную поддержку такого в процах :).

true_admin ★★★★★
(02.07.11 12:23:13 MSK) автор топика

Ссылка

Ответ на: комментарий от tensai_cirno 02.07.11 11:19:37 MSK

Транзакция не может быть с сайд эффектом.

Ну а что, если они есть? Как выкручиваться?

dizza ★★★★★
(02.07.11 12:49:39 MSK)

Ответ на: комментарий от dizza 02.07.11 12:49:39 MSK

По определению транзакции можно откатывать. Если транзакцию невозможно откатить — это уже не транзакция. Сайд-эффекты делать после коммита.

tensai_cirno ★★★★★
(02.07.11 13:29:32 MSK)

Ответ на: комментарий от dizza 02.07.11 12:49:39 MSK

Ну а что, если они есть? Как выкручиваться?

Тогда будут проблемы. И такая ситуация вполне возможна. Где-то я читал про это вчера, но не всомню :(. Возможно на википедии.

true_admin ★★★★★
(02.07.11 13:35:47 MSK) автор топика

Ссылка

Ответ на: комментарий от tensai_cirno 02.07.11 13:29:32 MSK

По определению транзакции можно откатывать.

STM это software transactional memory. Оно касается только памяти. А вот io оно не касается. Поэтому если есть сайд-эффекты то будут проблемы при откате.

Сайд-эффекты делать после коммита.

Вот тогда придём к тому что сейчас уже есть. И, похоже, те вещи что нельзя откатывать должны исполнятся в один поток. Это значит что PyPy будет должен определять какие участки кода можно отдать под STM а какие придётся по старинке с локами организовывать. Пока я вижу только такое решение.

true_admin ★★★★★
(02.07.11 13:41:31 MSK) автор топика

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

← Линус Торвальдс не видит для ФС пространства пользователя серьезного применения

Open Source

GNU awk 4.0.0 →

и когда же

ну это понятно

Похожие темы