Mitochondria13 янв в 11:49

Kafka для начинающих: работа с Kafka транзакциями на практике — когда они нужны, а когда только вредят?

Средний

9 мин

12K

Apache * Микросервисы * Java *

Туториал

Комментарии 6

Anahat 13 янв в 17:37

Привет! Спасибо за цикл статей!

Но совет, что надо каждый раз использовать рандомный transaction.id ( spring.kafka.producer.properties.transactional.id=some-service-${random.value}-) - имеет определенный набор проблем:

Если транзакция не завершилась, и сервис упал, то метаданные транзакции останутся висеть в незавершенном состоянии в топике __transaction_state. Если таких транзакций будет много - может в итоге выстрелить и по производительность, и по размеру файла-топика на диске;
При перезапуске сервиса, у него будет новый transaction.id, и старые незавершенные транзакции останутся навсегда незавершенными. Если бы стартанули с предыдущим transaction.id - они бы завершились;
Если у консумера уровень изоляции установлен на read_committed, то он может подвиснуть на таких незавершенных транзакциях.

Это из того, что вспомнил.

Поэтому для каждой инстанции сервиса корректнее использовать уникальный, но жестко заданный transaction.id

Mitochondria 13 янв в 19:06

Спасибо за комментарий!

На самом деле да, это правда.

При использовании StatefulSet в Kubernetes (или других решений со стабильными идентификаторами) каждый pod имеет постоянное имя, которое сохраняется между перезапусками (например, my-service-0, my-service-1 и т.д.). В таком сценарии можно использовать transactional.id в виде префикса, основанного на имени pod’а (например, ${POD_NAME}), что позволяет избежать как накопления незавершённых транзакций, так и проблем с fencing.

В статье я сфокусировался на базовой настройке Spring Boot и не углублялся в детали deployment'а — всё-таки добавлю это уточнение в статью.

Вам ещё раз спасибо!

fedokanez 13 янв в 20:04

Обязательно ли использовать транзакции ? Может что-то проще и надёжнее ?

Mitochondria 14 янв в 08:23

В большинстве систем транзакции Kafka не нужны. Чаще всего проще и надёжнее использовать тех же самых идемпотентных консьюмеров. В статье как раз разобраны сценарии, где транзакции действительно оправданы (если очень уж нужна атомарность), и почему во многих случаях от них больше вреда, чем пользы.

iliks84 11 фев в 08:37

Спасибо, я как раз в прошлых статьях просил про транзакции рассказать, наконец-то добрался до новой статьи, понятно стало!

Mitochondria 14 фев в 06:44

Всегда пожалуйста!

Рад, что статья оказалась полезной!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий