Как стать автором
Обновить

Комментарии 8

Репозиторий на гитхабе недоступен или отсутствует на 16:15 MSK.

Изменил настройки. Теперь всё доступно.

Из Kafka хорошо читает Apache NiFi с дальнейшей трансформацией

Согласен. О чем я вкратце написал в статье.

не увидел в тексте упоминания NiFi

Не помню подробностей (сам сидел со стороны Vertica, читая из Kafka), но есть нюанс, что WAL может рости до бесконечности, если в Kafka неправильно удалить толи topic, толи producer.

Не слышал о такой проблеме. Вообще, объём WAL для того же PostgreSQL можно настроить и время хранения данных в топиках Kafka тоже настраивается, но по дефолту семь дней.

Ну и кажется по логике, что влияние топика/продюсера не должны повлиять, что где-то что-то сломается, потому что они все независимы.

Я же могу писать в топик, но не читать оттуда (нет продюсера)

Там что-то со слотами репликации. И там где-то хранится LSN. Я не разбираюсь как это устроено на физическом уровне в связке Postgres-Debezium-Kafka, но если ничего не читается, то LSN остаётся один и тот же и WAL не может быть очищен, т.к. ждёт вычитки.

Как-то так "по-памяти".

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории