Как быстро кидать много http запросов асинхронно?

1

3

Сейчас вот такой код используется:

from aiohttp import ClientSession

async def post(semaphore: asyncio.Semaphore, session: ClientSession, url: str, data: str):
    async with semaphore:
        try:
            async with session.post(url, data=data) as r:
                response_data = await r.read()

                class Response(object):
                    def __init__(self, status_code, text):
                        self.status_code = status_code
                        self.text = text

                return Response(r.status, response_data.decode('utf-8'))
        except Exception as e:
            print(e)
            return None


...................................
async with ClientSession() as session:
    semaphore = asyncio.Semaphore(256)
    coros = [post(semaphore, session, r[0], r[1]) for r in requests]
    requests = await asyncio.gather(*coros)

Но он показывает плохие результаты. Как можно ускорить и правильно ли я вообще делаю? Мне надо отправлять http запросы на сервер, но не более, чем 256 одновременно.

Ссылка

←	poll после send

Реинициализировать объект C++ в стеке

→

выбросить питон, взять жабу.

Rastafarra ★★★★
(27.01.17 13:34:57 MSK)

Ответ на: комментарий от Rastafarra 27.01.17 13:34:57 MSK

поверхностный гуглеж показал что тут применяются легкие потоки (или их имитация) которых в жабе нет, отакто

Deleted
(27.01.17 13:45:51 MSK)
Последнее исправление: Deleted 27.01.17 13:46:25 MSK (всего исправлений: 1)

Ответ на: комментарий от Deleted 27.01.17 13:45:51 MSK

а акторы?

Rastafarra ★★★★
(27.01.17 13:52:34 MSK)

Ответ на: комментарий от Rastafarra 27.01.17 13:34:57 MSK

Может, все на асме еще замутить? Есть действующий проект, нужна оптимизация, но не перевод на другой ЯП.

panter_dsd ★★★★★
(27.01.17 13:53:31 MSK) автор топика

Ссылка

Ответ на: комментарий от Rastafarra 27.01.17 13:52:34 MSK

акторы это концепция а не реализация, а каждая конкретная реализация имеет набор костылей который легко обламывается блокирующим вызовом

Deleted
(27.01.17 13:55:33 MSK)
Последнее исправление: Deleted 27.01.17 13:56:48 MSK (всего исправлений: 1)

Ссылка

Вроде всё ок, чем именно результаты плохи?

ei-grad ★★★★★
(27.01.17 14:08:18 MSK)

Ответ на: комментарий от Rastafarra 27.01.17 13:34:57 MSK

Жабы не в тренде уже, надо брать модного суслика.

ei-grad ★★★★★
(27.01.17 14:09:26 MSK)

Ответ на: комментарий от ei-grad 27.01.17 14:08:18 MSK

Просадка на отправке идет. Логика такая: я беру из БД очередные 5К записей, разбиваю их на запросы (по определенной логике), отправляю эти запросы и удаляю из БД те записи, которые корректно отправились. На сервере (куда я отправляю) в это время количество коннектов одновременных держится в районе 150. В итоге, у меня в БД очередь копится.

panter_dsd ★★★★★
(27.01.17 14:15:58 MSK) автор топика

Ответ на: комментарий от panter_dsd 27.01.17 14:15:58 MSK

Вот на локальной машине на локальный сервак, на сервере Elapsed держится в районе 14 secs.

2017-01-27 14:13:34,500 [DEBUG] root: Load events from database. Elapsed 0 sec (http_retranslator.py:69)
2017-01-27 14:13:34,500 [DEBUG] root: Begin retranslate (http_retranslator.py:70)
2017-01-27 14:13:34,962 [DEBUG] root: Send all prepared requests (http_retranslator.py:111)
2017-01-27 14:13:37,750 [DEBUG] root: Remove all sent events (http_retranslator.py:118)
2017-01-27 14:13:37,910 [DEBUG] root: Retranslated 5000 records. Elapsed 3 secs (http_retranslator.py:125)
2

panter_dsd ★★★★★
(27.01.17 14:18:55 MSK) автор топика

Ответ на: комментарий от panter_dsd 27.01.17 14:18:55 MSK

Почему ты считаешь что проблема в отправке? Для меня пока совсем не очевидно, из того что ты написал. Скорее в сеть где-то упирается, или просто сервак тормозит, не? Пробовал меньше / больше параллельных запросов разрешать?

ei-grad ★★★★★
(27.01.17 14:21:24 MSK)

Ответ на: комментарий от panter_dsd 27.01.17 14:18:55 MSK

Вот на локальной машине на локальный сервак, на сервере Elapsed держится в районе 14 secs.

Посмотри в сторону

исчерпания локальных портов (netstat -ntp | grep TIME_WAIT | wc -l)
conntrack-а, google тебе в помощь
проблем с резолвингом
возможно strace тебе что-то дельное покажет

kawaii_neko ★★★★
(27.01.17 14:23:33 MSK)

Ответ на: комментарий от ei-grad 27.01.17 14:21:24 MSK

Сделал

semaphore = asyncio.Semaphore(1000)

Улучшения мизерные.

panter_dsd ★★★★★
(27.01.17 14:29:52 MSK) автор топика

Ссылка

Ответ на: комментарий от kawaii_neko 27.01.17 14:23:33 MSK

netstat -ntp | grep TIME_WAIT | wc -l

Вывело 300.

panter_dsd ★★★★★
(27.01.17 14:30:43 MSK) автор топика

Ссылка

Ответ на: комментарий от kawaii_neko 27.01.17 14:23:33 MSK

Оба сервера в одной стойке в датацентре.

panter_dsd ★★★★★
(27.01.17 14:31:22 MSK) автор топика

Ссылка

Запускаешь Python 3.5 или 3.6? В последнем были оптимизации евентлупа.

BigAlex ★★★
(27.01.17 14:46:18 MSK)

Ответ на: комментарий от BigAlex 27.01.17 14:46:18 MSK

3.5 использую пока 3.6 не появится в репах.

panter_dsd ★★★★★
(27.01.17 14:47:50 MSK) автор топика

в код особо не вникал, но нахер тебе семафоры? почему не запускаешь 256 запросов просто? синхронизация всегда ботлнек в конкурентных алгоритмах.

anonymous
(27.01.17 15:12:39 MSK)

Ответ на: комментарий от Rastafarra 27.01.17 13:34:57 MSK

может наоборот?

~~darkenshvein~~ ★★★★★
(27.01.17 15:13:38 MSK)

Ссылка

Ответ на: комментарий от anonymous 27.01.17 15:12:39 MSK

У меня 5000 записей, из них формируется n реквестов, причем n около 4000-45000. Но сервак нельзя грузить, он принимает одновременно 256 подключений, не больше.

panter_dsd ★★★★★
(27.01.17 15:23:35 MSK) автор топика

Ссылка

Ответ на: комментарий от panter_dsd 27.01.17 14:47:50 MSK

Ну, ты его хотя бы так поставь и запусти, посмотри есть ли разница и насколько она значительна.

BigAlex ★★★
(27.01.17 15:40:37 MSK)

Ссылка

Ответ на: комментарий от anonymous 27.01.17 15:12:39 MSK

Убрал семафор, лучше не стало.

panter_dsd ★★★★★
(27.01.17 16:20:56 MSK) автор топика

Ссылка

Ужас какой :(

Perl5 и AnyEvent::HTTP делает это в миллиард раз удобнее и читабельнее.

DRVTiny ★★★★★
(27.01.17 16:32:00 MSK)

Ссылка

Так секундочку я не понимаю. Вроде тут сидят господы с присутствующим головным мозгом. Почему никто ещё не сказал об телепатах на курорте? Этож просто на лицо.

Трейс любого питоновского профайлера в студию. Трейс сетевых подключений тоже (можно закопипастить маленький кусок одного подключения), сними wireshark или любым другим удобным инструментом. Как лечить болезнь не делая анализов? А вообще я предполагаю что выполнив первые 2 пункта ты и сам разберёщся в проблеме.

novoxudonoser
(27.01.17 17:27:41 MSK)

Ссылка

Интереса ради попробуй взять в качестве eventloop'а uvloop (любопытная статейка).

grazor ★★
(27.01.17 19:47:07 MSK)
Последнее исправление: grazor 27.01.17 19:47:17 MSK (всего исправлений: 1)

Ответ на: комментарий от grazor 27.01.17 19:47:07 MSK

Кстати возможно реально поможет. Блин классная uvloop штука с ним и go ненужен.

novoxudonoser
(27.01.17 21:49:30 MSK)

Ответ на: комментарий от novoxudonoser 27.01.17 21:49:30 MSK

Блин классная uvloop штука

Похоже на то, всё никак не соберусь сам его погонять и потестировать. Кстати, если интересно, обрати внимание на sanic — это веб-фреймворк, который пытается копиррровать api flask'а, но построен поверх uvloop.

grazor ★★
(27.01.17 22:54:08 MSK)

Ответ на: комментарий от grazor 27.01.17 22:54:08 MSK

о, не мог название вспомнить. да забавная штука, но мимикрия с асинхронщиной хуе дружат. лучше торнадо или альбатрос как-то.

anonymous
(28.01.17 07:53:26 MSK)

Ссылка

Создать 250 pthread нитей, а потом, когда они уже будут созданы запустить в них запросы.

~~Dron~~ ★★★★★
(28.01.17 08:03:30 MSK)

так а во что упирается-то? Питон жрёт ~100%? Нет ли затыков на том сервере куда ты шлёшь запросы?

true_admin ★★★★★
(28.01.17 22:16:50 MSK)

Ответ на: комментарий от Dron 28.01.17 08:03:30 MSK

не на питоне, но я обычно создаю N воркер тредов а потом туда пулю задания. С таким нехитрым алгоритмом, я чуть не уложил большой коорпоративный биллинг со слабого сервачка :)

mrdeath ★★★★★
(29.01.17 04:50:08 MSK)

Ответ на: комментарий от mrdeath 29.01.17 04:50:08 MSK

Ну я имел в виду С, но не озвучил так как нет сомнений что на питоне тоже так можно.

~~Dron~~ ★★★★★
(29.01.17 04:55:51 MSK)

Ответ на: комментарий от Dron 29.01.17 04:55:51 MSK

+1 я делал даже на перле :)

mrdeath ★★★★★
(29.01.17 05:22:06 MSK)

Ссылка

Ответ на: комментарий от ei-grad 27.01.17 14:09:26 MSK

Жабы не в тренде уже, надо брать модного суслика.

Недавно модный суслик уже не модный. В топе теперь язык «Рога и Копыта», на втором месте «Бобер»)

anonymous
(29.01.17 11:23:09 MSK)

Ссылка

Как можно ускорить и правильно ли я вообще делаю?

Чо в питон профайлер не завезли что-ли? И да, выглядит просто ужасно, даже не пыхе было бы лучше.

no-such-file ★★★★★
(29.01.17 15:02:43 MSK)

Там либо ClientSession блокирует лишнего, либо сервер дохнет. Попробуй сначала запрсы на быстрый сервер поотсылать. Если будет быстро, тогда можно просто создавать новый ClientSession на каждый запрос.

redixin ★★★★
(29.01.17 20:31:35 MSK)

Ответ на: комментарий от grazor 27.01.17 19:47:07 MSK

Взял, не помогло.

panter_dsd ★★★★★
(30.01.17 09:39:06 MSK) автор топика

Ссылка

Ответ на: комментарий от true_admin 28.01.17 22:16:50 MSK

Жрет в районе 20%. С сервером все отлично, сервис на c++ засылает на него данные в районе 250 запросов в секунду, пайтоновский - 100 запросов.

panter_dsd ★★★★★
(30.01.17 09:40:24 MSK) автор топика

Ссылка

Ответ на: комментарий от no-such-file 29.01.17 15:02:43 MSK

Завезли, но профайлер показывает на просадку во внутрянке пайтона. Где-то на вэйапах.

panter_dsd ★★★★★
(30.01.17 09:44:13 MSK) автор топика

Ответ на: комментарий от redixin 29.01.17 20:31:35 MSK

Раньше создавал ClientSession на каждую пачку, теперь создаю один в самом начале, не знаю, как правильнее будет.

panter_dsd ★★★★★
(30.01.17 09:45:10 MSK) автор топика

Ссылка

Ответ на: комментарий от panter_dsd 30.01.17 09:44:13 MSK

Вот снял профайлер на сервере http://rgho.st/6lpbwXnNY

panter_dsd ★★★★★
(30.01.17 10:15:04 MSK) автор топика

Ссылка

Ответ на: комментарий от mrdeath 29.01.17 04:50:08 MSK

Ты не мог бы привести пример кода?

panter_dsd ★★★★★
(30.01.17 10:28:34 MSK) автор топика

Ссылка

netstat показывает, что при нагрузке много соединений висят в TIME_WAIT, что есть странно - ClientSession должен ведь держать соединения открытыми, не?

panter_dsd ★★★★★
(30.01.17 10:50:45 MSK) автор топика

Ссылка

Ответ на: комментарий от panter_dsd 30.01.17 09:44:13 MSK

Завезли, но профайлер показывает на просадку во внутрянке пайтона

ОМФГ, даже профайлер не могут нормальный сделать.

no-such-file ★★★★★
(30.01.17 13:00:42 MSK)

Ссылка

Отжешьбякакакая. Сегодня с утра копался, много всего перепробовал, полазал по нутрянкам и таки нашел ответ:

self.__session = ClientSession(connector=TCPConnector(limit=max_connections))

По-умолчанию, к одному эндпойнту создается максимум 10 подключений. Выставил сколько мне нужно и все взлетело.

panter_dsd ★★★★★
(30.01.17 14:38:37 MSK) автор топика

Ответ на: комментарий от panter_dsd 30.01.17 14:38:37 MSK

хаха. :) ну тогда код не требуется?

mrdeath ★★★★★
(30.01.17 18:48:35 MSK)

Ответ на: комментарий от mrdeath 30.01.17 18:48:35 MSK

Нет. Сам пул замутил на сокетах, увидел ощутимый прирост, вот и стал копаться.

panter_dsd ★★★★★
(30.01.17 19:00:01 MSK) автор топика
Последнее исправление: panter_dsd 30.01.17 19:00:17 MSK (всего исправлений: 1)

8 декабря 2018 г.

Ответ на: комментарий от panter_dsd 30.01.17 19:00:01 MSK

Какие стали результаты, когда ты подшевелил систему?

NetSurf
(08.12.18 16:27:11 MSK)

Ответ на: комментарий от NetSurf 08.12.18 16:27:11 MSK

Результаты стали достаточными для решения поставленной задачи. :)

panter_dsd ★★★★★
(09.12.18 09:00:07 MSK) автор топика

Ссылка

Ответ на: комментарий от panter_dsd 30.01.17 14:38:37 MSK

HTTP/2 не завезли?

deadNightTiger ★★★★★
(09.12.18 09:49:53 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	poll после send

Development

Реинициализировать объект C++ в стеке

→

Похожие темы