Mitochondria Oct 23 at 15:04

Kafka для начинающих: работа с брокером сообщений на практике

Medium

18 min

11K

Apache * Microservices * Java *

Tutorial

Comments 9

Pinned comments

Mitochondria Nov 6 at 06:08

Обновил статью.

Используем confluentinc/cp-kafka вместо Bitnami (который переехал в legacy без обновлений).

kmatveev Oct 23 at 21:12

Большой прогресс по сравнению с предыдущей статьёй: на этот раз всё написано самостоятельно. Вопрос с намёком: а что более осмысленное, чем строка "Key", имело бы смысл в этом конкретном сервисе использовать в качестве ключа?

Mitochondria Oct 24 at 05:12

Рад слышать, спасибо!

Я планирую обновить достаточно сильно эту статью. Выкладывал вечером, подуставший :)

Добавлю новый сервис, исправлю некоторые архитектурные косяки. И вставлю осмысленный ключ в примере.

donRumatta Nov 4 at 18:40

Можно подробнее про 2 основных кейса.

1) Хочу быстрее обрабатывать (чтобы очередь быстрее рассасывалась) => добавляю консьюмеров. Что будет, если просто добавить, без групп, при одной партиции и при нескольких? А если с группами? Что, если партиций три, а в 3 группах по 1, 2 и 3 консьюмера, как они будут назначаться партициям?

2) Хочу, чтобы одно и то же сообщение обрабатывалось несколькими разными сервисами. Что делать?

Теперь стало понятно, что для поддержки перезапусков сервисов есть специальная техническая очередь. Но, как оффсеты сопоставляются с консьюмерами, мы же не задаем никаких id на стороне консьюмера. А что если состав консьюмеров изменился?

Например, единственный консьюмер упал, после перезапуска Кафка не смогла подобрать ему оффсет, а в очередь за время простоя набежало сообщений. Если брать latest, то не будут обработаны некоторые сообщения. С этой точки зрения всегда удивлялся, как в Кафке выкручиваются, не храня состояние на стороны консьюмеров.

Mitochondria Nov 5 at 08:41

Ну поехали :)

Если вы добавляете консьюмеров без групп на топик, то партиции не распределяются. Каждый консьюмер читает все сообщения. Если же с группами, то в рамках одной группы будет распределение партиций.

Теперь давайте рассмотрим ваш кейс с 3 партициями:
1. Если 1 консьюмер, то он читает все партиции.
2. Если 2 консьюмера, то один читает две партиции, другой — одну.
3. Если 3 консьюмера, то каждый читает по одной.
4. Ещё предлагаю для большего понимания рассмотреть случай, когда консьюмеров в группе больше, чем партиций. В этом случае "лишние" консьюмеры будут простаивать.
Если хотите, чтобы разными сервисами обрабатывались одни и те же сообщения, надо все инстансы в рамках одного сервиса засунуть в одну группу. Так надо сделать для каждого интересующего вас сервиса.

Вторая часть вопроса несколько более сложная. Попытаюсь адекватно объяснить:
1. Оффсеты напрямую не сопоставляются с консьюмерами. Видите ли, какая ситуация, в топике, ответственном за оффсеты, хранятся сообщения следующего вида:
  1. Ключ — <group_id, topic, partition>
  2. Значение — <commited_offset, metadata>
  Это нам даёт возможности для перебалансировки, так как нет жётской связи между оффсетом и конкретным инстансом.
2. В вашем кейсе с упавшим единственным консьюмером будет примерно следующее:
  1. Kafka переведёт группу в состояние перебалансировки.
  2. Контроллер кластера смаппит сообщение из offser-топика на текущий активный консьюмер.
  3. Как следствие, активный консьюмер начнёт читать с последнего закоммиченного оффсета. То есть никаких потерь не будет, так как мёртвый брокер не мог закоммитить оффсеты для новых сообщений. На всякий случай отмечу, что коммит в Kafka — это некий процесс сохранения оффсета консьюмером.
  И в этом случае настройка latest применена не будет, так как кафка смаппит оффсет на консьюмера, а эта настройка срабатывает, как вы, надеюсь, помните, когда Kafka не находит оффсет для консьюмера.

Надеюсь, нигде не накосячил в объяснениях :)

donRumatta Nov 5 at 10:15

Ага, понял, т. е. оффсет относится к группе, как в ней консьюмер появится продолжит с последнего непрочитанного. Разве что переименование группы может потребовать какие-то явные указания.

Спасибо!

Mitochondria Nov 5 at 11:25

Рад помочь!

sethan8r Nov 5 at 13:34

Надеюсь не у меня одного проблемы с kafka?
failed to resolve reference "docker.io/bitnami/kafka:4.0.0": docker.io/bitnami/kafka:4.0.0: not found
На докер хабе нету ни одного тега на странице bitnami/kafka

Mitochondria Nov 6 at 05:40

Действительно, с августа 2025 Bitnami переместили все образы в bitnami legacy, где они больше не получают обновления. Статья будет обновлена. Спасибо за фидбек!

Mitochondria Nov 6 at 06:08

Обновил статью.

Используем confluentinc/cp-kafka вместо Bitnami (который переехал в legacy без обновлений).