ipakeev May 24 2024 at 10:46

Фоновые асинхронные задачи в FastAPI и их мониторинг

19 min

25K

KTS corporate blogPython*Programming*API*

Tutorial

+50

Comments 32

Flosckow May 24 2024 at 12:51

Если мне память не изменяет, то фоновые задачи выполняются последовательно и если в какой-то из задач рейзится исключение - то следующие не выполнятся. Так что это можно тоже отметить как потенциальный минус

ipakeev May 24 2024 at 14:42

Это про какую библиотеку?

Flosckow May 27 2024 at 10:58

Прошу прощения, это про background task в fastapi/starlette

ipakeev May 27 2024 at 13:46

В background task задачи выполняются не последовательно: они стартуют сразу после ответа на запрос. Если задача синхронная, то выполняется в threadpool (anyio.to_thread.run_sync).

По исходному коду не нашел причины, почему следующие задачи бы не выполнялись.

Flosckow May 28 2024 at 08:47

Хм, дока starlette говорит об обратном, но там кейс немного другой и используется BackgroundTasks(который fastapi использует по дефолту). Ваш пример напрямую использует BackgrounTask из starlette. Стоит сделать ремарку на поведение в Fast API или указать напрямую, в заголовке что используется starlette BackgroundTask.

Propan671 May 28 2024 at 18:57

Ну, дока может говорить о чем угодно, но это не значит, что оно так работает
Вот, например, исходники starlette, в которых явно видно, что таска будет выполнена сразу после записи ответа в asgi (т.е. это обязательный этап запуска handler'а) - https://github.com/encode/starlette/blob/9f16bf5c25e126200701f6e04330864f4a91a898/starlette/responses.py#L161

Propan671 May 28 2024 at 21:04

Забавную штуку, кстати, буквально только что нашел - https://github.com/adriangb/asgi-background

Вот это как раз "те самые таски, что в фоне", причем, совместимые с любым ASGI

ThatSeemsLegit May 24 2024 at 16:22

Регулярно приходится сталкиваться с такими задачами и пришел к выводу, что лучше всего просто пульнуть таску в очередь, и оттуда уже сервисами их исполнять. Точно ничего не потеряется (nack на фейле) + легкий скейлинг и без спайков в нагрузке

Ryav May 24 2024 at 16:59

Спасибо за статью, неплохой обзор получился и открыл для себя FastStream.
Вопрос по воркерам FastStream: когда воркер забирает таску, разве он не должен сделать её недоступной для остальных, чтобы одну и ту же задачу не выполнили n раз?

ipakeev May 24 2024 at 21:12

Если у каждой библиотеки запустить по 5 воркеров, то результат будет таким: arq, saq и celery выполнят все 10к задач, а faststream - в 5 раз больше (потому что одна и та же задача будет выполняться на каждом воркере).

Думаю, у faststream такое поведение из-за того, что в первую очередь он создан для общения между микросервисами, а не для фоновых задач.

Ryav May 25 2024 at 07:39

Ну, собственно, я это и спрашиваю — почему все воркеры берут одну и ту же задачу? Либо её статус никак не меняется, либо не успевает поменяться (все 5 уже забрали до изменения статуса), либо что-то ещё.

evgenii_moriakhin May 25 2024 at 10:37

FastStream предполагает, что потребление только одним подписчиком нужно реализовать вручную: https://github.com/airtai/faststream/issues/693

И в целом модель применения FastStream отличается от arq/saq/celery - они нужны для фоновых\запланированных задач, а FastStream для управляемой событиями архитектуры сервисов

Но, конечно, никто не мешает вам начать применять их, как вам хочется

Propan671 May 28 2024 at 18:51

Это не так. Данный вопрос был имеено в том, что "как сделать так, чтобы на конкуретных воркерах конкретная таска могла работать только в одном экземпляре". Это как раз распределенный лок, о чем я человеку и сказал.

Бродкастинг сообщений по всем экземплярам сервиса - это логика, которую предоставляет брокер, а не фреймворк. В данном конкретном случае Redis Pub/Sub работает именно так. Тут уже нужно разбираться с тем, что вы хотите использовать и получить.

Но насчет отличий FastStream и celery-like инструментов - очень точное замечание. В качестве замены Celery я сам всегда советую взять taskiq

evgenii_moriakhin May 28 2024 at 20:38

Да, вы конечно правы, нужно выражаться правильно - обработка, а не потребление

ipakeev May 25 2024 at 12:14

При тестировании замечал, что иногда один из воркеров работает заметно медленнее остальных. Тем не менее, это не мешает ему обработать все 10к задач, даже если остальные воркеры завершили работу десятки секунд назад.

Как указал выше, faststream создан именно для общения между микросервисами. Это подразумевает, что все, кто подписан на топик, должны получить сообщение.

С другой стороны, для разных брокеров есть куча специфичных параметров, которые позволяют гранулированно настроить поведение публикации/обработки сообщений, в том числе отработку только один раз. Но этот момент не совсем очевидный и требует проверки, например встречал похожий issue для NATS.

Propan671 May 27 2024 at 22:49

Ну вообще, такое поведение потому что вы решили взять redis pub/sub в качестве транспорта. Для background тасок я бы предложил лучше взять redis list (если уж очень хочется redis) а еще лучше - NATS JetStream. Но вообще интересно почитать было, как люди используют) Спасибо за статью!

ipakeev May 28 2024 at 00:08

Спасибо за совет!

P.S. Приятно видеть в комментариях отца FastStream :)

Propan671 May 28 2024 at 18:47

Я просто искал причины аномального роста трафика из РУ сегмента)

А так меня не сложно найти - я во многих чатиках присутствую. А можно даже напрямую меня пинговать по любым вопросам, связанным с брокерами и/или FastStream в чате по фреймворку - https://t.me/python_faststream (мы там еще и фичи всей толпой проектируем)

Propan671 Mar 4 at 23:03

Как в итоге ваши эксперименты с FastStream?)

ipakeev Mar 27 at 11:07

Мне очень нравится, использую в своих проектах и всем советую)

Приятно видеть активное развитие FastStream.

lehshik May 24 2024 at 22:27

для каких задач применяются все эти технологии, для интернет магазинов это как будто избыточно, крупные проекты наверное испольуют самописные системы?

ipakeev May 25 2024 at 13:27

Если у вас CRUD'овый интернет магазин, то избыточно. Но как только появляются оплаты, интеграции, квитанции, задачи по расписанию, то без фоновых задач никак.

Даже если эти задачи находятся в отдельных микросервисах (как у крупных проектов), тот же faststream значительно упростит реализацию.

evgenii_moriakhin May 25 2024 at 07:51

А что скажете про бенчмарки автора saq?

В бенчмарках автора 1000 итераций, на моей машине итераций saq спокойно переносит 500к и обгоняет arq со 100к.

ARQ enqueue 100000 18.29077935218811
ARQ process 100000 noop 501.143620967865

SAQ enqueue 500000 39.770418882369995
SAQ process 500000 noop 209.9531545639038

arq же в свою очередь не смог пройти 300к и заставил стаймаутить редис

подозреваю тут тоже играет роль этот плюс saq:
>> Avoids polling by leveraging BLMOVE or RPOPLPUSH and NOTIFY

ipakeev May 26 2024 at 19:10

Бенчмарки действительно показывают, что saq работает значительно быстрее, чем arq. Локально цифры тоже подтверждаются.
Но чтобы это как-то отразилось в реальной практике, похоже, нужны бешеные нагрузки.

Почему при нагрузочном тестировании saq так странно себя ведет - загадка. Судя по логам, сервер периодически намертво зависает на 5-20 секунд в момент постановки задачи в очередь (в это время FastAPI не может обработать ни один запрос).

evgenii_moriakhin May 27 2024 at 11:00

это проявляется в обоих подходах к реализации ручки?

с FastAPI BackgroundTask и "прямым" вызовом queue.enqueue?

в реализации Queue.enqueue стоит семафор c таким описанием:

max_concurrent_ops: maximum concurrent operations. (default 20) This throttles calls to `enqueue`, `job`, and `abort` to prevent the Queue from consuming too many Redis connections.

если бенчмарки (от saq) с прямым вызовом queue.enqueue не зависают, может такое быть что зависает/заставляет зависать именно реализация BackgroundTask (как раз потенциально из за семафора)?

ipakeev May 27 2024 at 14:14

Пробовал на python 3.10 и 3.11, в разных комбинациях, в том числе с разным значением max_concurrent_ops.

Для варианта JSONResponse({}, background=BackgroundTask(...)) результат один и тот же. Как только убираю семафор, зависания исчезают, показатели становятся примерно как у arq, но всё равно ниже на 2-5%.

Теперь про прямой вызов queue.enqueue.

На первый взгляд как будто бы всё нормализуется. Но стоит учесть, что в этом случае искусственно занижается нагрузка от locust (т.к. сначала задача ставится в очередь, и только затем отдается ответ на запрос; через BackgroundTask происходит ровно наоборот).

Если увеличить количество пользователей до 5000, то у saq всё равно сохраняется тенденция к деградации сервиса. При этом у arq всё отлично: RPS выше почти на 30%.

evgenii_moriakhin May 27 2024 at 15:04

Спасибо, интересно. Хотя бы точно выяснили, что действительно семафор внутри влияет на BackgroundTask (это уже вопрос к реализации FastAPI - комментатор выше тоже писал о проблемах в BackgroundTask).

насчет остального нет предположений

evgenii_moriakhin May 25 2024 at 10:17

К минусам arq так же можно отнести, что достаточно долго над ним не велась работа, поэтому и появилcя saq, как его переработанный форк
(и интересно, что saq выбрали ребята из Litestar в своих примерах - https://github.com/litestar-org/litestar-pg-redis-docker/blob/main/app/lib/worker.py)

но у автора arq (он же автор pydantic'a, к слову) в планах целый роадмап по переработке arq - https://github.com/samuelcolvin/arq/issues/437

ipakeev May 25 2024 at 13:31

Да, изначально одним из минусов было то, что последний релиз arq был в конце 2022 года, но внезапно 1 мая этого года выкатили новую версию. Поэтому пришлось убрать)

AikoASMR May 25 2024 at 12:18

Терпим и ждём celery asyncio pool и django async db driver. Слишком больно по времени терять среду Джанги и собирать велосипеды из кучи разрозненных либ.

Insurgent2018 May 29 2024 at 00:30

Вопрос по асинхронность, а почему нельзя просто запустить в celery таску, которая "внутри" будет асинхронной?

Условно:

celery -A worker4messages.celery worker -P threads

async def entrypoint_task(...):
  ...

...
@celery.task(name="example_task")
def example_task(...):
  asyncio.run(entrypoint_task(...))
  return True

ipakeev May 30 2024 at 13:19

В моем примере происходит почти то же самое, просто логика вызова асинхронной функции из синхронной спрятана в декораторе.

asyncio.run создает новый цикл событий, выполняет корутину и закрывает цикл событий. Если для таски нужен предварительный сетап (например подключение к базе данных), то это также нужно сделать внутри таски. Поэтому оптимальнее сделать сетап один раз, создать/сохранить event loop и уже в нем запускать таски.