Комментарии / Профиль ewolf / Хабр

Павел Агалецкий@ewolf

Пользователь

ПрофильСтатьи12ПостыНовостиКомментарии78

Шина данных поверх Kafka — когда каждому хочется иметь своё число консьюмеров для топика

ewolf 1 ноя 2025 в 11:02

Нет, ведь это очередь и основная задача - масштабирование чтения.

Гарантий порядка мы не даём даже в обычной шине данных

Шина данных поверх Kafka — когда каждому хочется иметь своё число консьюмеров для топика

ewolf 24 окт 2025 в 10:53

Привет!

Метрики мы отдаем сами из quasar и шины данных. Для беклога мы делаем следующее

смотрим положения курсоров и оффсетов по партициям и получаем базовый беклог как partition end - cursor offset
распаковываем оффсеты, вычитаем индивидуально акнутые события.
итоговый рассчет оказывается приблизительным, но близким

И уже это пишется в метрику для пользователей

По нагрузке - сейчас около 40-50 млн rpm проходит.

В сторону ydb смотрели, но не хочется снова идти в не самую стандартную технологию. Пока предпочитаем api, которое если что можно подменить любой реализацией.

Гарантии у нас at least once, порядок и транзакционность доставки событий не гарантируем

if err != nil: почему мы (не) любим обработку ошибок в Go? Обзор предложений по её улучшению

ewolf 9 сен 2025 в 14:13

+= есть через

err = errors.Join(err, Two())

Junior of IntelliJ IDEA

ewolf 13 дек 2024 в 17:07

Поправьте всё-таки написание ide к единому виду

IntelliJ IDEA

Работа с Kubernetes: поднимаем локальный кластер и деплоим в него приложения

ewolf 16 мар 2024 в 09:00

Бесплатность, возможность запуска виртуалки для общих целей и задач

Ещё рекомендую рассмотреть OrbStack: быстрее Docker Desktop на порядок

Мультиплатформенные образы: что это такое и зачем они нужны

ewolf 3 фев 2024 в 10:26

Сам образ просто содержит признак, что он собран под другую архитектуру.

Важно не это, а то, что исполняемый файл запускается внутри. В Linux ядре есть специальный механизм - binfmt, который при запуске исполняемого файла умеет проверять его сигнатуру (первые несколько байт) и по ним определять, под какую архитектуру скомпилирован файл и запускать нужный для нее враппер. А если бы точным, то определяет не архитектуру, а просто в какой враппер нужно обернуть запуск файла с такой сигнатурой.

И дальше запускается qemu нужного вида и транслирует инструкции amd64 под arm

Мультиплатформенные образы: что это такое и зачем они нужны

ewolf 6 ноя 2023 в 09:30

Все верно :) Но часто это лучше, чем торможение образов ненативных

Kafka, go и параллельные очереди

ewolf 26 окт 2023 в 19:30

Ну кстати это хороший вопрос, я не имею отношения к статье и ее кейсу, но со своей стороны я бы сказал, что джетстрим по моему опыту показал себя гораздо медленнее и менее надёжным, чем кафка

Kafka, go и параллельные очереди

ewolf 26 окт 2023 в 07:25

Nats из коробки как минимум не персистентный (не берём в рассмотрение Jetstream)

Семантики доставки событий в распределенных системах

ewolf 27 авг 2023 в 14:56

Да, но это выполняется только при условиях одной очереди, одного эксчейнджа, одного консьюмера и так далее.

Ничего особого, собственно

Семантики доставки событий в распределенных системах

ewolf 27 авг 2023 в 14:50

Под капотом на данный момент у нас Kafka, а для внутрисервисных очередей - Apache Pulsar. Вокруг них своя обёртка на go для сокрытия топологии кластеров и валидации контрактов

Семантики доставки событий в распределенных системах

ewolf 24 авг 2023 в 12:15

Спасибо за комментарий. Да, все верно, чаще всего порядок событий реализуется на стороне клиентов, но есть варианты когда брокер предоставляет механики для соблюдения порядка, такие как шардирование по ключу для помещения событий одной сущности в одну партицию, эксклюзивный консьюминг, когда только один консьюмер читает соответствующий топик и т.п.

Статья дает общий обзор существующих гарантий и какие причины могут приводить к их нарушениям или сложности в поддержании.

Как построить систему, способную выдерживать нагрузку в 5 млн rps

ewolf 25 июл 2023 в 15:55

Да, похожая, хотя нагрузка меньше.

Нет, пока не думаем менять, потому что основное время тратится на взаимодействие с самой кафкой, а в ней в свою очередь - на дисковые и процессорные операции.

Использование grpc даст (но не для всех клиентов) экономию процессорного времени и немного сети, что однако не является для нас узким местом.

Как построить систему, способную выдерживать нагрузку в 5 млн rps

ewolf 20 июл 2023 в 14:28

Нагрузка немаленькая.

А сколько реплик топиков используется и в каком режиме происходит продьюсинг (acks=0, acks=1, acks=all)?

Как построить систему, способную выдерживать нагрузку в 5 млн rps

ewolf 20 июл 2023 в 14:15

Основной профит в том, что скрыта технология под капотом. Сегодня кафка, завтра может быть редпанда, послезавтра - федерация кластеров. А для клиентов точки входа и апи не меняются

Как построить систему, способную выдерживать нагрузку в 5 млн rps

ewolf 20 июл 2023 в 13:38

Весьма интересная статья, спасибо!

Как реализовать ролевую систему доступа через Open Policy Agent. Опыт PaaS Авито

ewolf 17 июл 2023 в 08:59

Через OpenPolicy, все верно

Как построить надёжную шину данных на Apache Kafka

ewolf 29 июн 2023 в 05:44

Спасибо за вопрос. Мы в настоящий момент используем uReplicator, но в планах отказаться от него в пользу меньших кластеров

Как построить надёжную шину данных на Apache Kafka

ewolf 9 мая 2023 в 12:51

Спасибо!

Мы даём пользователям at least once, достигаем за счет механики ack на продьюсере и на консьюмере

Как построить надёжную шину данных на Apache Kafka

ewolf 27 апр 2023 в 06:37

Дело в том, что проблема не в ресурсах, Кафка нормально масштабируется горизонтально. Дело в надёжности и времени восстановления.

Схема с несколькими кафками на запись (под каждый из дц) выбрана исходя из требования гарантировать доступность записи. У такого решения минус тоже есть, в виде сложности системы, например. Поэтому сейчас мы движемся к другой схеме, где будут отдельные независимые кластера меньшего размера

2 3 4

Информация

Специализация