avtozavodetz6 ноя 2021 в 12:39

Kafka, Python и золотая рыбка

10 мин

48K

Высоконагруженные системы * Python * Apache *

Из песочницы

Технотекст 2021

Комментарии 14

RPG18 6 ноя 2021 в 20:13

А как обрабатывается недоступность БД?

avtozavodetz 6 ноя 2021 в 21:27

В случае недоступности БД обработка запроса, предусматривающего обращение к БД, завершится ошибкой, о чём будет уведомлён инициатор запроса. Отправку запроса, конечно, через какое-то время придётся повторить.

RPG18 7 ноя 2021 в 09:29

А как долго продюсер ждет подтверждения и куда он их сохраняет, а обратная связь сделана через outbox?

avtozavodetz 7 ноя 2021 в 19:06

В нашем случае обратная связь реализована через Redis, куда продюсер записывает идентификатор и статус запроса. Консюмер должен обновить этот статус по завершении обработки. Если в течение часа (таймаут может отличаться для разных типов запросов) статус не поменяется, продюсер (или клиент, т.к. большинство запросов отслеживаются именно клиентами их отправившими) посчитает, что запрос завершился ошибкой, и клиент получит соответствующее уведомление. Поскольку Redis не связан напрямую с основной БД, говорить о том, что у нас поддерживается outbox, конечно, нельзя. Однако, замечу, что запись результатов обработки запроса в основную БД сопровождается записью в т.н. журнал запросов в этой же БД, что является дополнительным средством контроля повторной обработки запроса.

RPG18 8 ноя 2021 в 11:41

Просто запись в БД и запись в Redis не одна атомарная операция. Мы записали в БД, пишем в Redis и ловим ошибку от Redis.

avtozavodetz 8 ноя 2021 в 18:20

Согласен! Поэтому у нас и предусмотрен журнал запросов в основной БД. Клиент, не получив подтверждения об успешной обработке запроса по истечении таймаута, сочтёт такой запрос обработанным с ошибкой и может его повторить. Но поскольку данные этого запроса уже есть в журнале, консюмер не станет обрабатывать его повторно, а просто попытается ещё раз актуализировать информацию в Redis.

RPG18 8 ноя 2021 в 19:43

ааа, понятно своеобразный inbox pattern.

xpress 7 ноя 2021 в 08:56

Для таких случаев можно использовать DLQ (Dead Letter Queue). Физически это такой же топик в Kafka, куда направляются необработанные сообщения.

RPG18 7 ноя 2021 в 09:24

upd. перечитал статью и увидел обратную связь

avtozavodetz 7 ноя 2021 в 19:08

Да, как вариант) Но мы ограничились уведомлением об ошибке, фактически перенеся ответственность за дальнейшую судьбу необработанного сообщения туда, где это сообщение лучше всего сохранится до лучших времен (до последующей переотправки), а именно - на клиентскую часть.

Mel 7 ноя 2021 в 11:51

Спасибо за статью, как раз хотелось пощупать кафку. А почему использовался мультипроцессинг пул, вместо тред пула?

avtozavodetz 7 ноя 2021 в 19:10

У нас больший процент времени обработки запроса составляют именно вычисления, нежели обращения к БД. Поэтому и применили мы для оптимизации именно средства обеспечения параллелизма, а не конкурентности. И остановились на старом добром multiprocessing.Pool.

shabelski89 7 ноя 2021 в 19:04

Вот это было бы интересно подробнее, как реализовано в коде.

На этот случай у нас должна быть предусмотрена обратная связь по каждому сообщению в заявленный срок

avtozavodetz 7 ноя 2021 в 19:14

О, это очень просто:

redis_client.set(key, value)

где key - это id запроса, а value включает код и статус результата обработки:) Статус запроса в Redis отслеживается либо продюсером, либо клиентом (через отдельные запросы к тому же продюсеру).

Зарегистрируйтесь на Хабре, чтобы оставить комментарий