justLegend Aug 2 at 16:14

История оптимизации Python сервиса: пара простых системных улучшений

Medium

9 min

3.8K

Конференции Олега Бунина (Онтико) corporate blogOkko corporate blogWebsite development*Python*

Retrospective

+24

Comments 6

Andrey_Solomatin Aug 4 at 00:36

Данные, предназначенные для Kafka, мы стали записывать в multiprocessing.Queue,

А какой объём данных?

При мягкой перезагрузке сервера данные успевают отправится?

Если процесс убьют, то получается пользователь получит ответ, а данные в кавку не уйдут.

KazakovDenis Aug 5 at 09:47

Тоже интересно как решали, при 5000 RPS выглядит как потенциально большая проблема. Кроме того, что будет с пишущим процессом, если читающий умер? Он блокируется полностью?

justLegend Aug 7 at 11:58

> Тоже интересно как решали, при 5000 RPS выглядит как потенциально большая проблема.

Воркеров суммарно немало. Процессов, пишущих в Kafka, тоже. Поэтому нагрузка на каждый отдельный процесс не такая большая.

Кроме того, что будет с пишущим процессом, если читающий умер? Он блокируется полностью?

Нет, пишущий процесс не блокируется. Он так же отдаёт ответ и пишет в очередь. Если что-то случится с читающим процессом, то мы его перезапускаем. Да, часть данных потеряется, но это не критично, т.к. на самих пользователях не скажется

justLegend Aug 7 at 11:41

А какой объём данных?

Сравним со входным объёмом данных. В среднем примерно 1-2 Кб

При мягкой перезагрузке сервера данные успевают отправится? Если процесс убьют, то получается пользователь получит ответ, а данные в кавку не уйдут.

У нас настроен graceful shutdown. Когда ловим сигнал о завершении процесса, то сперва отправляем все неотправленные данные и только потом выключаемся.

KazakovDenis Aug 5 at 10:04

то это +5 мс ко времени ответа

Это не совсем так. Интервал переключения по умолчанию действительно 5 мс, но активный поток может отпустить GIL и раньше. Та же `kafka-python` использует epoll/kqueue, поэтому не будет долго держать GIL.

При этом верно и обратное, если CPU-bound задача долгая, то GIL может удерживаться дольше 5 мс, потому что эта проверка происходит перед выполнением очередной инструкции байт-кода. В kafka-python (да и в любой другой клиентской библиотеке) такой задачей будет только сериализация данных перед отправкой.

justLegend Aug 7 at 11:59

Спасибо за уточнение. Но всё же захват и освобождение GIL весьма непредсказуемые вещи. Не хочется лишний раз рисковать временем ответа. Плюс перед самой отправкой в Kafka у нас имеется весьма тяжёлый конвертер в protobuf, который не хотелось бы вызывать в процессе, обрабатывающем входящие запросыю