Посоветуйте стек технологий для задачи

1

3

Задача очень простая, вроде бы:

Нужно реализовать HTTP-сервер
На него будут приходить простые GET-запросы вида http://x.x.x.x/?a=1&b=2
В процессе обработки запроса нужно будет сделать ряд запросов к MySQL, обработать их результаты простой if{}else{} логикой и отдать ответ.
Язык не важен
Каждый запрос должен гарантированно выполниться за 1-2 секунды

Петрушка в том, что запросов одновременно может приходить много, на данный момент чуть меньше тысячи в секунду, потенциально - больше, поэтому хочется запас. И выполняться каждый запрос, потенциально, может 100-200мсек.

Что пробовал:

Банальный nginx + php-fpm. После долгого насилия над конфигами этих двух софтин, MySQL и sysctl.conf оно кое-как научилось держать 1000 одновременных коннектов, при этом php-fpm форкнул, соответственно, 1000 воркеров и сожрал 13Гб памяти. Как-то, мягко говоря, не оптимально. При этом при тестах через wrk и ab были таймауты в процессе получения URL, но они скорее всего связаны с MySQL. Тестил простым скриптом типа (подключиться к mysql, select столбец from table с двумя строками, print столбец, отключиться от mysql).
nodejs. Оно однопоточное, поэтому особого толку нет, плюс всякие непонятные глюки - в начале теста идёт ровно, под конец сервер дико напрягается ksoftirq и нода падает с ошибкой в духе «too many open files». Либо глючт mysql-модуль, коих там море в ноде и все разной степени кривзины, либо ещё что... разбираться лень. Скорость, в любом случае, достаточно низкая. Скрипт аналогичный.
Perl в виде PSGI приложения и разных серверов для его исполнения, как форкающихся (starman), так и на базе event loop (twiggy). Форкающиеся работали хорошо, но проблемы аналогичные php-fpm - каждый форк жрёт кучу памяти. event-овые опять таки однопоточные, да и доступ в SQL их блокирует.
Python + twisted. Оно event-овое, один поток. Проблемы аналогичные.

В результате пришёл к выводу, что мне нужно что-то тредовое т.к. каждый запрос к SQL выполняется какое-то время и если использовать event loop реализации - блокирует остальных. Форкающиеся сервера хороши, но памяти жрут мама не горюй.

Можно, конечно, написать свой HTTP-сервер с тредами и танцовщицами, на том же перле, но велосипед изобретать не хочется. Есть перл-модуль HTTP::Daemon::Threaded, но я его пока что-то не до конца осилил. Всякие apache+mpm_worker+mod_perl пока не смотрел, но выглядит достаточно вкусно.

Может я чего-то элементарного не вижу? Или просто дохрена хочу?

Ссылка

←	Как восстановить расшаренные папки в zimbra?

DNS Blackhole

→

Попробуй bottle.py - http://bottlepy.org/docs/dev/deployment.html

с разными серверами, рекомендую bjoern, без обращения к БД дает 20к запросов в секунду.

pi11 ★★★★★
(03.04.16 01:37:05 MSK)

Ссылка

event-овые опять таки однопоточные,

Кто мешает форкать event-driven сервер?

да и доступ в SQL их блокирует.

Ты видимо используешь синхронный драйвер для общения с базой. Попробуй http://search.cpan.org/~mlehmann/AnyEvent-DBI-2.3/DBI.pm

disarmer ★★★
(03.04.16 01:51:33 MSK)

Если не ошибаюсь, даже Джаннга умеет городить отдельные потоки для клиентов. Но если даже твистед не подошел, возможно стоит смотреть в сторону celery

Dred ★★★★★
(03.04.16 01:56:29 MSK)

Глянь в сторону cowboy на erlang.

ptah_alexs ★★★★★
(03.04.16 06:07:59 MSK)

Ссылка

Более каноничного юз-кейса для Go и не придумаешь.

anonymous
(03.04.16 09:57:16 MSK)

Ответ на: комментарий от disarmer 03.04.16 01:51:33 MSK

Кто мешает форкать event-driven сервер?

Да, в общем-то, никто не мешает, конечно. nginx это доказывает :) Но готовых event-driven серверов, которые нормально форкаются, я не нашёл, вероятно плохо искал.

Ты видимо используешь синхронный драйвер для общения с базой.

Да, синхронный. Этот модуль, конечно, видел, но callback-и для работы с базой, на мой взгляд, крайне не удобны. По крайней мере в моём алгоритме я не очень понимаю как их правильно применить. Поэтому мне был бы удобнее именно многопоточный сервер без этой асинхронной мороки :)

blind_oracle ★★★★★
(03.04.16 09:58:36 MSK) автор топика

Ответ на: комментарий от Dred 03.04.16 01:56:29 MSK

Я пробовал твистед в тредах, примерно такой:

#!/usr/bin/python

from BaseHTTPServer import HTTPServer, BaseHTTPRequestHandler
from SocketServer import ThreadingMixIn
import threading

class Handler(BaseHTTPRequestHandler):
    def do_GET(self):
        self.send_response(200)
        self.end_headers()
        self.wfile.write('Hello world!')
        return

    def log_message(self, format, *args):
        return

class ThreadedHTTPServer(ThreadingMixIn, HTTPServer):
    """ blah """

if __name__ == '__main__':
    server = ThreadedHTTPServer(('', 5001), Handler)
    server.serve_forever()

Но больше 140% CPU оно не скушало даже при 1000 коннектов, скорость всего около 1000 запросов в сек. Celery попробую, спасибо.

blind_oracle ★★★★★
(03.04.16 10:05:17 MSK) автор топика
Последнее исправление: blind_oracle 03.04.16 10:06:01 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от anonymous 03.04.16 09:57:16 MSK

Во, про Го забыл, гляну, сенкс!

blind_oracle ★★★★★
(03.04.16 10:06:48 MSK) автор топика

Ссылка

в новости про .Net была ссылка на бенчмарки: https://www.techempower.com/benchmarks/

borisych ★★★★★
(03.04.16 11:22:07 MSK)

Ответ на: комментарий от borisych 03.04.16 11:22:07 MSK

О какая красота, спасибо! Прям глаза разбегаются :)

blind_oracle ★★★★★
(03.04.16 11:42:16 MSK) автор топика

Ссылка

Конечно же OpenResty, к черту все эти мидлвари.

https://openresty.org/en/benchmark.html

https://github.com/openresty/lua-resty-mysql

nullb0t ★
(03.04.16 11:59:33 MSK)

Java /thread

r0ck3r ★★★★★
(03.04.16 12:07:40 MSK)

Ответ на: комментарий от blind_oracle 03.04.16 09:58:36 MSK

Поэтому мне был бы удобнее именно многопоточный сервер без этой асинхронной мороки :)

Даже если запросы будут приходить равномерно, при 1000rps*0.2s = 200 одновременно исполняющихся запросов в каждый момент времени. В реальности, с неравномерным распределением по времени можно ожидать и 400-500. Просто шедулить такое количество процессов/тредов - уже неплохая нагрузка и задержки. И это на первое время, без запаса и подтупливаний mysql

disarmer ★★★
(03.04.16 12:22:24 MSK)

Ответ на: комментарий от nullb0t 03.04.16 11:59:33 MSK

Да, уже положил в бенчмарке на него глаз вкупе с LuaJIT. Попробую.

blind_oracle ★★★★★
(03.04.16 12:29:44 MSK) автор топика

Ссылка

Ответ на: комментарий от r0ck3r 03.04.16 12:07:40 MSK

Вот с жабой связываться не очень хочется, уж лучше Go. Не люблю как-то ея, хотя плюсов у неё много.

blind_oracle ★★★★★
(03.04.16 12:30:26 MSK) автор топика

Ссылка

Ответ на: комментарий от disarmer 03.04.16 12:22:24 MSK

Это да, шедулинг оверхед будет приличный, но такие пики будут достаточно редко, да и сервер будет мощный. Просто для асинхронного программирования я, наверное, не готов, да и не программер йа, в общем :) Мускуль потенциально заменим на что-то более производительное типа Redis.

blind_oracle ★★★★★
(03.04.16 12:31:51 MSK) автор топика
Последнее исправление: blind_oracle 03.04.16 12:33:55 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от anonymous 03.04.16 09:57:16 MSK

В общем, попробовал Go с fasthttp-routing модулем - красота! 170к запросов в секунду хеллоуворолдовых выдал, 20 ядер занял на ура. Похоже это то, что нужно. Тут скорее СУБД загнётся, а не мидлварь.

blind_oracle ★★★★★
(03.04.16 12:33:38 MSK) автор топика

Ссылка

Ответ на: комментарий от nullb0t 03.04.16 11:59:33 MSK

OpenResty как-то не порадовал :( На hello-world-е:

worker_processes 6;

pid /tmp/nginx.pid;
error_log stderr error;

events {
    worker_connections  16384;
}

http {
    resolver 127.0.0.1;
    access_log off;

    server {
        listen 5001;

        location / {
            content_by_lua 'ngx.print("Hello!")';
        }
    }
}

выдал всего 10к запросов в секунду, при этом процессы nginx-а как-то не особо кушали ядра, при любом concurrency. Вероятно, я что-то не так делаю.

blind_oracle ★★★★★
(03.04.16 18:41:45 MSK) автор топика