Comments / Profile of ewolf / Habr

Павел Агалецкий @ewolf

Пользователь

ProfileArticles10PostsNewsComments76

Как построить надёжную шину данных на Apache Kafka

ewolf Apr 14 2023 at 06:18

Единый реестр есть, в статье есть кратко про это. Все схемы событий при деплое попадают в этот реестр и потом мы валидируем изменения на допустимость и публикуемые события на корректность

0

Как построить надёжную шину данных на Apache Kafka

ewolf Apr 14 2023 at 06:17

Выше уже ответили на многие вопросы.

У нас есть таймауты на подключения, keep-alive сообщения, чтобы убедиться, что клиент жив.

Также у нас есть реестр схем событий, благодаря которому мы можем валидировать контракты как в момент попытки деплоя сервиса, так и при публикации

0

Как построить надёжную шину данных на Apache Kafka

ewolf Apr 12 2023 at 17:17

По-сути, переизобрели :)

Можете чуть подробнее раскрыть вопрос про разрыв соединения и схему данных?

+1

Как построить надёжную шину данных на Apache Kafka

ewolf Apr 12 2023 at 13:12

Паттерн outbox у нас поддерживается. Есть реализация клиента databus, которая на самом деле пишет события в отдельную специальную таблицу в той же базе данных, что и остальные сущности, а потом фоновый отдельный воркер перекладывает их в databus. Для клиента все работает атомарно внутри одной транзакции.

Написать общую библиотеку можно, но потом сложно следить за тем, чтобы ее своевременно обновляли и чтобы например, когда мы включаем один кластер или переводим его на другие адреса, или когда мы хотим заменить кафку на что-то другое, то это прошло бы незаметно для клиента.

Наш же сервис - это фасад.

Сама по себе шина не так сложна, фактически в ней просто websocket соединение вида pub/sub, где клиент может сказать в какие топики он хочет писать, а из каких читать.

Пока жив коннект от клиента - мы держим коннект в кафку. Плюс под капотом пара дополнительных штук типа набирания батча для клиента на консьюминге и так далее.

Общая задача была в том, чтобы защитить клиентов от знания о внутренней технологии, ее топологии и не дать совершать невалидные действия, так что решение в этом плане оправдывает себя

+2

Сколько нужно кросс-функциональных команд, чтобы открыть один склад

ewolf Apr 9 2023 at 05:04

Спасибо за интересную статью.

А что происходит после завершения проекта? Кто занимается поддержкой всего, что создала v-team, когда ее участники разошлись по новым командам?

0

Брокер сообщений NATS: как мы решали проблему скоростной и стабильной доставки сообщений

ewolf Jan 7 2023 at 09:33

Но тут дело ведь не только в потере сообщений. Консьюмеры не получат ничего, что было опубликовано в момент, когда они были отключены: например, в следствии бага, а момент редеплоя или каких-либо других работ.

Это не является проблемой?

0

Брокер сообщений NATS: как мы решали проблему скоростной и стабильной доставки сообщений

ewolf Jan 7 2023 at 09:32

Кластер же позволяет вам проводить работы на nats, пересетапливать сервера без простоя и т.д.

Как сейчас вы обеспечиваете бесперебойную работу?

0

Брокер сообщений NATS: как мы решали проблему скоростной и стабильной доставки сообщений

ewolf Jan 6 2023 at 10:42

Также, как я понимаю, вам не требуется персистивность сообщений после публикации продюсером?

0

Брокер сообщений NATS: как мы решали проблему скоростной и стабильной доставки сообщений

ewolf Jan 6 2023 at 10:38

А какую топологию кластера натса вы в итоге используете?

Мы в своих внутренних исследованиях обнаружили нестабильность работы NATS при кластером сетапе в 5 нод и использовании Jetstream (один баг даже зарепортили). В частности это проявляется в нестабильном создании стримов, "отключении" консьюмеров.

Также нас не очень устроила скорость работы Jetstream: при 300-400k RPM латенси записи начинает очень сильно уступать кафке. Ну и с масштабированием стримов тоже есть вопросы.

Общий наш вывод в том, что nats без Jetstream хорош, но с ним - пока слишком молод и нестабилен.

+1

Паттерны асинхронных обменов на платформе Авито

ewolf Mar 31 2022 at 06:26

Разница между RPC и REST лишь в понятийной области. Вполне можно использовать REST, но обычно сложно уложить многообразие действий в парадигму REST, да и не особо нужно.

В нашем случае, да, у каждого сервиса свой набор эндпоинтов, которые вызываются другими. Другие сервисы, разумеется, знают в какой сервис они шлют запросы.

Производительность ниже, чем если бы это был монолит, но зато мы можем разрабатывать такие системы отдельно друг от друга. Также никто не отменяет кэши и другие оптимизации

+2

Паттерны асинхронных обменов на платформе Авито

ewolf Mar 31 2022 at 03:28

Это один из паттернов возможных обменов. Например, недоступна шина, сервисы живут на одном физическом сервере или имеется особый характер данных, скажем вы выгружает видео файл и передаёте его другому сервису.

Файл это просто носитель информации

+1

Паттерны асинхронных обменов на платформе Авито

ewolf Mar 31 2022 at 03:20

В общем смысле ответ таков. Каждый сервис занимается своими задачами, поддерживается отдельной командой и отвечает за выделенную предметную область.

Но различные процессы в одних сервисах могут запускаться как реакция на изменения в других. Именно для отправки сообщений о подобных изменениях и нужна шина данных

+1

Как ускорить приложение за счёт PHP-FPM (няшим FPM conf)

ewolf Sep 5 2021 at 16:22

Не факт. Большая часть современной нагрузки - это нагрузка на сеть, когда процесс, обрабатывая входящий запрос делает какое-то количество исходящих запросов к другим системам, базам данных, очередям и прочему

0

От веб-студии к SaaS сервису для автоматизации склада (часть первая)

ewolf Aug 14 2021 at 19:50

Очень интересно, жду продолжения. Все, что связанно с логистикой и складом - супер интересная тема, ведь в ней айти встречается с реальным миром как никогда близко

+1

Классификатор обращений пользователей (1C + python)

ewolf Jul 22 2021 at 21:07

Ещё один вариант, который очень простой, но довольно рабочий - использование байесовского классификатора.

Можно классифицировать на любое число классов, очень быстро работает

0

Apache Pulsar как основа для системы очередей

ewolf Jun 25 2021 at 04:12

Можно сделать nack и настроить в пульсаре redelivery timeout: тогда оно будет предоставлено через заданный интервал времени

0

Apache Pulsar как основа для системы очередей

ewolf Jun 25 2021 at 04:11

Да, все верно, используем в том числе отложенные сообщения

0

Apache Pulsar как основа для системы очередей

ewolf Jun 24 2021 at 18:34

Согласен с вами. Своим комментарием я имел в виду, что пульсар, имея в основе систему хранения логов, похож в этом на Кафку, но в отличие от нее добавляет поверх ещё ряд функций: отложенные сообщения, отсутствие ограничения на число консьюмеров и другое. Все то, что в случае с кафкой пришлось бы реализовывать самостоятельно. Но все это правда не бесплатно с точки зрения надёжности

+1

Apache Pulsar как основа для системы очередей

ewolf Jun 24 2021 at 15:51

Пока их относительно не много. 1000+ партицированных топиков и соответственно 5000+ топиков-партиций

0

Apache Pulsar как основа для системы очередей

ewolf Jun 24 2021 at 09:32

Конкретно pulsar — это кафка на стероидах. Тоже log внутри, но с добавлением некоторой логики сверху.

0

2