PyPy 1.7

0

1

Вышла очередная версия PyPy — интерпретатора языка программирования Python, который написан на Python и может компилировать сам себя. Основным изменением этого выпуска является значительный прирост производительности. В среднем на тестовом пакете, прирост производительности PyPy 1.7 составляет около 30%, по сравнению с PyPy 1.6 и до 20 раз быстрее на некоторых тестах.

Основные изменения:

исправление ошибок, совместимость исправлений с CPython;
исправления в Windows-версии;
в PyPy 1.7 по умолчанию включен stackless;
NumPy был переименован в numpypy;
JSON encoder заменен на новый, написанный на чистом Python, превосходящий по скорости CPython с расширениями на С в 2 раза;
уменьшено потребление памяти некоторыми RPython модулями.

Ссылка для загрузки.

>>> Подробности

Ссылка

← The Journal: жизнь после syslog

GTK+ 3.3.4 →

← 1 2 3 4 5 6 7 8 →

Ответ на: комментарий от namezys 22.11.11 15:01:31 MSK

Объясните мне, чем вам не угодил multiprocessing?
Лишняя память, это раз. Невозможность разделять адрессное пространство - это два.
Вот мы пишем сервер, который грузит в память около 3 Гб данных. Так на все 24 ядра на машиен сколько надо памяти?

Для такого объёма данных, пожалуй. Я не специалист в web. При решении чисто вычислительных задач одновременно грузить в память более 100Mb приходится ооочень редко. Как следствие, памяти действительно уходит больше, но это некритично.

Адресное пространство разделять можно частично. Можно объявить часть переменных общими, кроме того, есть процессы созданы внутри метода класса, они знают все его поля и методы.

Vudod ★★★★★
(22.11.11 15:10:14 MSK)

Ответ на: комментарий от anonymous 22.11.11 15:09:59 MSK

А ты не улыбайся, а просто цифру назови.

А ты угадай с трех раз. И еще на досуге подумай, почему это не важно.

~~baverman~~ ★★★
(22.11.11 15:12:38 MSK)

Ссылка

Ответ на: комментарий от anonymous 22.11.11 14:43:45 MSK

worker - это отдельный процесс в смысле процесса ОС?

Именно. Для веб-задач это стандартный паттерн.

Если нужно IPC между процессами то multiprocessing с очередями итп. Работает через shmem.

true_admin ★★★★★
(22.11.11 15:14:31 MSK)

Ссылка

Ответ на: комментарий от anonymous 22.11.11 14:55:06 MSK

эти гринлеты - это какие-то костыли

Наоборот избавление от тех костылей что навязываются aio(всякие коллбэки итп).

сколько гринлетов можно исполнять параллельно на потоках ОС?

Ммм, gevent.fork() и вперёд :)

true_admin ★★★★★
(22.11.11 15:17:49 MSK)

Ссылка

Ответ на: комментарий от namezys 22.11.11 14:45:59 MSK

обгон может быть получен за счет другого принципа реализации

И так в каждой версии!

Casus ★★★★★
(22.11.11 15:19:43 MSK)

Ответ на: комментарий от baverman 22.11.11 14:52:30 MSK

А теперь представь, что интерпретатор начал исполнение долгоиграющего запроса к базе, все остальные 1000 потоков тупо заблокированы

Nope. man select.

Про базу может был и не удачный пример, но что делать с файловым I/O? Я вот не припомню, чтобы там была польза от select. Переходить на AIO? Это уже весело может получиться.

Casus ★★★★★
(22.11.11 15:23:04 MSK)

Ответ на: комментарий от Vudod 22.11.11 15:10:14 MSK

> Адресное пространство разделять можно частично.

Что-то я слабо представляю, как в питоне это работает. Данные объекта еще можно разделить. А вот структуру? Счетчики поддерживать когюретно по всем потокам? Сомнительно это.

namezys ★★★★
(22.11.11 15:23:08 MSK)

Ответ на: комментарий от Casus 22.11.11 15:19:43 MSK

> И так в каждой версии!

Я вообще про json говорил. А то что каждая версия быстрее, говорит лишь об одном - классчиеский питон очень медленный.

namezys ★★★★
(22.11.11 15:23:56 MSK)

Ответ на: комментарий от matumba 22.11.11 12:37:33 MSK

Разработчики на Django слушают тебя с недоумением)))))

anonymous
(22.11.11 15:26:51 MSK)

Ссылка

Ответ на: комментарий от namezys 22.11.11 15:23:08 MSK

Что-то я слабо представляю, как в питоне это работает. Данные объекта еще можно разделить. А вот структуру? Счетчики поддерживать когюретно по всем потокам? Сомнительно это.

В руководстве написано, что можно разделять простые типы: массивы чисел и строки. Для этого их нужно соответствующим образом объявить.

Vudod ★★★★★
(22.11.11 15:27:07 MSK)

Ответ на: комментарий от Casus 22.11.11 15:23:04 MSK

Про базу может был и не удачный пример, но что делать с файловым I/O?

Я неудачно выразился. При любом IO питон переключает на другие потоки.

~~baverman~~ ★★★
(22.11.11 15:27:31 MSK)

Ответ на: комментарий от Vudod 22.11.11 15:27:07 MSK

> В руководстве написано, что можно разделять простые типы: массивы чисел и строки. Для этого их нужно соответствующим образом объявить.

Во, то есть разделение данных. В общем это все «костыль». Но часто это и не надо.

namezys ★★★★
(22.11.11 15:29:53 MSK)

Ответ на: комментарий от Vudod 22.11.11 15:10:14 MSK

Этим пользовались 15 лет назад, когда не было эффективной поддержки ядром SMP систем, поскольку такое железо было экзотикой. Использование процессов для эмуляции потоков сейчас выглядить редким идиотизмом, особенно для линукса и особенно для задач, требующих высокой производительности.

anonymous
(22.11.11 15:29:59 MSK)

Ответ на: комментарий от anonymous 22.11.11 14:38:43 MSK

> А теперь представь, что интерпретатор начал исполнение долгоиграющего запроса к базе, все остальные 1000 потоков тупо заблокированы, возникает вопрос о какой маштабируемости тут может идти речь?

При выполнении системных вызовов типа чтения-записи в файловый дескриптор GIL освобождается.

shimon ★★★★★
(22.11.11 15:32:11 MSK)

Ответ на: комментарий от shimon 22.11.11 15:32:11 MSK

При чем тут системный вызов? я имел ввиду, что помимо запроса к базе нужно обработать данные и для каждого клиента выдать уникальный контент, и вот это является узким местом, поскольку параллельно обрабатывать, отдавать контент и принимать новые запросы уже хрен получится. А скакать туда-сюда-обратно - это убьет всю производительность.

anonymous
(22.11.11 15:42:21 MSK)

Ответ на: комментарий от namezys 22.11.11 15:29:53 MSK

Во, то есть разделение данных. В общем это все «костыль». Но часто это и не надо.

Мне это особо не надо. Я действую достаточно просто: процесс создаётся, ещё выделяется функция на выполнение, туда передаётся очередь --- экземпляр класса Queue, из неё забираются нужные данные (часть данных общие для класса), расчёты производятся, результаты помещаются в очередь и возвращаются главному потоку. При времени выполнения такого потока в несколько секунд затраты на создание и обмен данными пренебрежимо малы.

Vudod ★★★★★
(22.11.11 15:44:06 MSK)

Ссылка

Ответ на: комментарий от anonymous 22.11.11 15:42:21 MSK

вот это является узким местом

В *большинстве* *веб* приложений узкое место — бд. Если ты хочешь выполнять тяжелые вычисления посреди реквеста, ты явно странный тип.

~~baverman~~ ★★★
(22.11.11 15:46:03 MSK)

Ответ на: комментарий от baverman 22.11.11 15:46:03 MSK

А где мне его выполнять? Если параметры следущего запроса зависят от этих вычислений? Но я хочу его выполнять параллельно, то есть запустил поток и забыл про него, когда данные становятся нужны - я их просто достаю из объекта.

anonymous
(22.11.11 16:01:20 MSK)

Ответ на: комментарий от baverman 22.11.11 15:27:31 MSK

И что он делает? То, о чём ты думаешь, возможно только если внутренний FIO сделан через AIO.

Casus ★★★★★
(22.11.11 16:14:37 MSK)

Ответ на: комментарий от namezys 22.11.11 15:23:56 MSK

Я вообще про json говорил. А то что каждая версия быстрее, говорит лишь об одном - классчиеский питон очень медленный.

Ну так изменение алгоритма никак не связано с языком реализации в данном случае то. Т.е. тот же изменённый алгоритм на CPython будет так же быстрее.

Casus ★★★★★
(22.11.11 16:15:59 MSK)

Ответ на: комментарий от baverman 22.11.11 15:46:03 MSK

В *большинстве* *веб* приложений узкое место — бд

Это если само приложение нифига толком не делает. БД как раз можно, зачастую, оптимизировать.

Casus ★★★★★
(22.11.11 16:17:47 MSK)

Ответ на: комментарий от anonymous 22.11.11 15:29:59 MSK

Использование процессов для эмуляции потоков сейчас выглядить редким идиотизмом, особенно для линукса и особенно для задач, требующих высокой производительности.

Расскажите это Брайту и Александреску. Они специально сделали потоки изолированными по пространству имён и велят в явном виде описывать, какие переменные общие.

Vudod ★★★★★
(22.11.11 16:18:57 MSK)

Ответ на: комментарий от Casus 22.11.11 16:15:59 MSK

> Ну так изменение алгоритма никак не связано с языком реализации в данном случае то. Т.е. тот же изменённый алгоритм на CPython будет так же быстрее.

CPythone медлененее PyPy. На нем реализация чего-то оказалась мделенее, чем аналогичные действия на С, но с другой релаизацией. А вот на PyPy оказалось быстрее.

namezys ★★★★
(22.11.11 16:20:35 MSK)

Ответ на: комментарий от Casus 22.11.11 16:14:37 MSK

То, о чём ты думаешь, возможно только если внутренний FIO сделан через AIO.

Shimon же дал верное пояснение. Перед началом блокирующего IO освобождается GIL. Так что AIO здесь не при делах.

~~baverman~~ ★★★
(22.11.11 16:21:55 MSK)

Ответ на: комментарий от anonymous 22.11.11 16:01:20 MSK

А где мне его выполнять?

В случае с питоном, в отдельном процессе, очевидно.

~~baverman~~ ★★★
(22.11.11 16:23:17 MSK)

Ответ на: комментарий от Casus 22.11.11 16:17:47 MSK

Это если само приложение нифига толком не делает.

Таких приложений большинство. Тупые мордочки по доставанию данных из бд и вкорячиванию переменных в шаблоны. О том и речь.

~~baverman~~ ★★★
(22.11.11 16:28:01 MSK)

Ответ на: комментарий от Vudod 22.11.11 15:06:09 MSK

>> Я указал, что multiprocessing к многопоточности отношения не имеет.

Это есть неверное суждение, либо вы используете специфичную терминологию.

Случай, что неправильную терминологию используешь ты, не рассматривается?

Multiprocessing повторяет функциональность threading почти полностью

Я не хуже тебя знаю, что такое multiprocessing. Он может сколько угодно повторять API модуля threading, но нити запускаются в едином адресном пространстве, а процессы - нет.

Поэтому я считаю, что вы совершенно напрасно вводите людей в заблуждение

А я считаю, что ты не освоил базовых понятий многозадачности и базовых навыков чтения.

tailgunner ★★★★★
(22.11.11 16:28:09 MSK)

Ответ на: комментарий от Vudod 22.11.11 16:18:57 MSK

>потоки изолированными по пространству имён

Не понял эту мысль. Все потоки в линуксе сделаны на базе pthreads, а там вроде нет пространства имен, или я чего то пропустил? И при чем тут Александреску?

anonymous
(22.11.11 16:33:20 MSK)

Ответ на: комментарий от matumba 22.11.11 12:37:33 MSK

>генерацию HTML из кода (т.е. не print «<BR>», а html->br()).

(response/xexpr '(html (head (title «My Blog»)) (body (h1 «Under construction»))))

Короче, Python — 1991, Perl — 1987. Вопросы?

Lisp - 1958, ну ты понял.

loz ★★★★★
(22.11.11 16:38:41 MSK)

Ответ на: комментарий от baverman 22.11.11 16:23:17 MSK

А как узнать, что данные готовы и передать указатель на объект содержащий результаты из одного процесса в другой, после смерти этого «отдельного» процесса?

anonymous
(22.11.11 16:40:39 MSK)

Ответ на: комментарий от tailgunner 22.11.11 16:28:09 MSK

Я не хуже тебя знаю, что такое multiprocessing.

Пока вы не подтвердили это суждение ни одним высказыванием.

Он может сколько угодно повторять API модуля threading, но нити запускаются в едином адресном пространстве, а процессы - нет.

Для программиста на Питоне это не существенно. Для него существенно, что нити --- в данном случае процессы, выполняются параллельно. Вопрос разделения адресного пространства обсуждался выше.

А я считаю, что ты не освоил базовых понятий многозадачности

Это ваше мнение мне безразлично, потому что у меня программы работают нужным мне способом и распараллеливание происходит.

и базовых навыков чтения.

Хамство может считаться признаком крутизны только в весьма специфических коллективах, я рад, что не работаю с вами в одном и том же.

Vudod ★★★★★
(22.11.11 16:43:26 MSK)

Привет Пёрл и Раби

Класс, скоро у Пистона будет JIT. Привет Пёрл и Раби.

mantar
(22.11.11 16:44:28 MSK)

Ссылка

Ответ на: комментарий от loz 22.11.11 16:38:41 MSK

> Lisp - 1958, ну ты понял

Ну то же LISP, а не «There's more than one way to screw it up»

anonymous
(22.11.11 16:45:04 MSK)

Ответ на: комментарий от anonymous 22.11.11 16:40:39 MSK

А как узнать, что данные готовы и передать указатель на объект содержащий результаты из одного процесса в другой, после смерти этого «отдельного» процесса?

Для этого есть тысяча способов. Тот же multiprocessing предоставляет удобные абстракции.

~~baverman~~ ★★★
(22.11.11 16:46:17 MSK)

Ответ на: комментарий от anonymous 22.11.11 16:33:20 MSK

Не понял эту мысль. Все потоки в линуксе сделаны на базе pthreads, а там вроде нет пространства имен, или я чего то пропустил? И при чем тут Александреску?

Я плохо выразился. При проектировании языка D по умолчанию они специально запретили обращение к переменным из разных потоков, если вы хотите использовать одну и ту же переменную в нескольких потоках, вы должны это декларировать явно. Хотя физическое разделение памяти не происходит, потоки работают в одном пространстве памяти, логическое разделение имеет место.

Vudod ★★★★★
(22.11.11 16:47:07 MSK)

Ответ на: комментарий от Vudod 22.11.11 16:43:26 MSK

> Для программиста на Питоне это не существенно.

Зависит от многих условий. Для тебя - может быть, и несущественно.

Хамство может считаться признаком крутизны только в весьма специфических коллективах

Ты это начал.

я рад, что не работаю с вами в одном и том же.

А тебе это было бы полезно.

tailgunner ★★★★★
(22.11.11 16:47:46 MSK)

Ссылка

Ответ на: комментарий от Vudod 22.11.11 16:43:26 MSK

Для программиста на Питоне это не существенно

Утиные истории. Сам таким был, понимаю. На практике, отличия multiprocessing от threading надо досконально знать. От деталей там никак не абстрагироваться.

~~baverman~~ ★★★
(22.11.11 16:50:11 MSK)

Ссылка

Ответ на: комментарий от baverman 22.11.11 16:46:17 MSK

Мне страшно интересно, а какой смысл имеет указатель на объект в другом адресном пространстве другого процесса?

anonymous
(22.11.11 16:52:06 MSK)

Ответ на: комментарий от anonymous 22.11.11 16:52:06 MSK

Мне страшно интересно, а какой смысл имеет указатель на объект в другом адресном пространстве другого процесса?

Дополнительного смысла, по сравнению с процессом родителем, не появляется.

~~baverman~~ ★★★
(22.11.11 16:54:01 MSK)

Ответ на: комментарий от anonymous 22.11.11 15:29:59 MSK

> Использование процессов для эмуляции потоков сейчас выглядить редким идиотизмом, особенно для линукса и особенно для задач, требующих высокой производительности.

Ну да, ну да. Особенно это видно по современным надежным программам....

~~demmsnt~~ ★
(22.11.11 17:00:25 MSK)

Ответ на: комментарий от namezys 22.11.11 15:23:56 MSK

классчиеский питон очень медленный

клинический тормоз - очень медленный

что до производительности питона, то её достаточно для решения широкого класса задач, только писать надо уметь

shty ★★★★★
(22.11.11 17:01:30 MSK)

Ответ на: комментарий от Vudod 22.11.11 16:47:07 MSK

>вы должны это декларировать явно

А зачем? Компилятор автоматически создаст примитив синхронизации и сделает доступ к переменной безопасным? Как-то я не вижу особого смысла в этом.

anonymous
(22.11.11 17:03:28 MSK)

Ответ на: комментарий от Vudod 22.11.11 16:18:57 MSK

Расскажите это Брайту и Александреску.

только после того как они допилят свою поделку, то есть - никогда

shty ★★★★★
(22.11.11 17:04:43 MSK)

Ссылка

Ответ на: комментарий от anonymous 22.11.11 17:03:28 MSK

> Компилятор автоматически создаст примитив синхронизации и сделает доступ к переменной безопасным?

Ровно наоборот. Если переменная не помечена как shared, она считается локальной для нити, и компилятор генерирует соотвествующий код. Если она помечена как shared, она, внезапно, shared :) И компилятор генерирует другой код.

tailgunner ★★★★★
(22.11.11 17:05:40 MSK)

Ссылка

Ответ на: комментарий от anonymous 22.11.11 16:45:04 MSK

Lisp - 1958, ну ты понял
Ну то же LISP, а не «There's more than one way to screw it up»

то есть LISP - это «One way to screw it up»?

shty ★★★★★
(22.11.11 17:07:36 MSK)

Ссылка

Ответ на: комментарий от baverman 22.11.11 16:54:01 MSK

Очень уклончивый ответ, я примерно представляю как передать объект из одного процесса в другой. Это сериализация?

anonymous
(22.11.11 17:08:02 MSK)

Ответ на: комментарий от shty 22.11.11 17:01:30 MSK

> то её достаточно для решения широкого класса задач, только писать надо уметь

PyPy быстрее

namezys ★★★★
(22.11.11 17:08:55 MSK)

Ответ на: комментарий от anonymous 22.11.11 16:40:39 MSK

Семафор или что, то подобное.

~~demmsnt~~ ★
(22.11.11 17:09:18 MSK)

Ссылка

Ответ на: комментарий от namezys 22.11.11 15:01:31 MSK

Вот мы пишем сервер, который грузит в память около 3 Гб данных. Так на все 24 ядра на машиен сколько надо памяти?

Тут стандартный пистон без стероидов не подходит. Правда, вменяемых стероидов я не знаю.

true_admin ★★★★★
(22.11.11 17:10:48 MSK)

Ответ на: комментарий от anonymous 22.11.11 17:08:02 MSK

В простейшем случае это сериализация через пайп. Но multiprocessing умеет shmem.

~~baverman~~ ★★★
(22.11.11 17:11:06 MSK)

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 4 5 6 7 8 →

← The Journal: жизнь после syslog

Open Source

GTK+ 3.3.4 →

Привет Пёрл и Раби

Похожие темы