Comments / Profile of kohus / Habr

User

ProfileArticles2PostsNewsComments50

Kafka. Лучшие практики применения. Настройки Producer & Consumer

kohus Oct 28 2024 at 17:40

Я ни в чем не запуталась, я работаю datastreaming инженером больше 10 лет. Вы пишите, что "ключ используется для сегментации сообщений внутри партиции". Это в принципе неверно. Партицию, в которую отправить сообщение, определяет продюсер, и по умолчанию она определяется так: murmur2hash(key)%partition_count. То есть берется хэш от ключа, делится на число партиций в топике и остаток - это номер партиции. Это единственный смысл ключа.

Например, при отправке сообщений с данными клиента в топик, имеет смысл использовать идентификатор клиента в качестве ключа. Это обеспечит попадание всех сообщений, связанных с конкретным клиентом, в одну и ту же партицию, сохраняя их в правильном порядке.

Остальное, кому надо в документации проверит, но с ключами - это фундаментальная вещь.

0

Kafka. Лучшие практики применения. Настройки Producer & Consumer

kohus Oct 28 2024 at 10:02

Метрики Кафки выставляются через JMX, поэтому используйте стек для мониторинга, с которым вы умеете работать. Prometheus-Grafana, ELK, zabbix, что угодно. У Confluent хороший репозиторий https://github.com/confluentinc/jmx-monitoring-stacks, я его использую с минимальными изменениями.
Можете использовать статическую принадлежность к группе (static group membership), дать консьюмеру group.instance.id, тогда если перезапуск будет короткий (меньше установленного таймаута), то консьюмер получит свои партиции назад.

0

Kafka. Лучшие практики применения. Настройки Producer & Consumer

kohus Oct 27 2024 at 09:00

Нет, в Apache Kafka никакого автомасштабирования партиций нет. Количество партиций можно увеличить, запустив скрипт со специальными параметрами. При этом данные, которые в Кафке уже есть, останутся в старых партициях, и в новой конфигурации распределение по ключам будет уже другое. Уменьшить количество партиций в принципе нельзя (только пересоздать топик).

+1

Kafka. Лучшие практики применения. Настройки Producer & Consumer

kohus Oct 26 2024 at 19:05

Честно говоря, у вас здесь столько неточностей, что пройдусь только по крупным.

Kafka Connect API - это не программный интерфейс к Кафке, и никакого отношения к языкам программирования он не имеет. Kafka Connect - позволяет лить данные из внешних систем в Кафку, или из Кафки во внешние системы(базы данных, эластик, даталейк) без программирования, только плагин к системе и конфигурация.
Партиции - это вовсе не подмножества топиков. Топик делится на партиции, партиция - это единица репликации и избыточности(redundancy).
Емкий небольшой формат - это не json, а Avro или protobuf.
Ключ не используется для сегментации сообщений внутри партиции. По умолчанию сообщения с одинаковым ключом попадают в одну и ту же партицию (но все можно поменять). Смысл в том, что в партиции гарантируется очередность сообщения, и если очередность важна, то сообщения должны иметь одинаковый ключ.
Если хочется указать консьюмеру, как десериализовать сообщения, надо использовать не ключ, а headers.
Сообщение не будет удалено из переполненного топика. Сообщения удаляются по времени (старше, чем Х дней) или, (если сконфигурировано), когда размер топика будет больше, чем заданный размер. Если у вас просто кончится место на диске, то Кафка упадет.
min.insync.replicas нельзя ставить больше, чем количество реплик, это в принципе невозможно. Обычно это количество реплик - 1.
Кафка никогда не удаляет отдельные сообщения, а только целые сегменты.
max.poll.interval.ms проверяется на клиенте. Не Кафка считает клиента неработоспособным, а он сам себя считает неработоспособным и посылает leave request.

+8

Мы заглянули под капот Kafka и решили проблему потерянных сообщений

kohus Aug 25 2023 at 08:01

Вообще-то, delivery.timeout.ms по умолчанию 2 минуты. Ничего себе, проблемы с сетью. Какой-то странный outbox, тогда уже проще писать сразу записи в базу и тащить их оттуда кафка-коннектом.

0

Что происходит с рождаемостью в России и мире. И как это может отразиться на каждом из нас

kohus Aug 22 2023 at 13:19

А вам не наплевать на этот социум? Если, что я тоже женщина, двое детей (сын и дочь, больше не хочу), всегда была няня.

0

Рецепт готовки Apache Kafka: как создавался Data Lake на 80 Тb

kohus Aug 6 2022 at 09:51

В Кафке есть индекс по timestamp, поэтому можно быстро спозиционировать консумента на самую первую запись с заданным временем. А для того, чтобы примерно посчитать количество данных, можно использовать разницу оффсетов(инструмент GetOffsetShell)

0

Объяснение Kafka на примерах из Factorio

kohus Nov 26 2021 at 15:29

Стратегия по умолчанию не в том, чтобы разделы всегда распределялись между потребителями равномерно, а в том, чтобы разделы с одинаковыми номерами (из разных топиков) были назначены одному и тому же потребителю.

+1

Прощай, объектно-ориентированное программирование

kohus Aug 5 2016 at 10:40

Проблема повторного использования вообще не касается ООП. В функциональном программировании при использовании чужого кода тоже надо знать, как он работает. И да, в следующей версии он может поменяться и все сломать.

+14

Что означает Brexit для европейского финтех и IT рынка

kohus Jul 4 2016 at 14:14

Да, я имела в виду идентификационную карту, я не знала, как она называется правильно. Дайте пруф, что вы с видом на жительство можете ездить. А то вот у меня EU permanent residence, гражданство российское, а английское консульство утверждает, что мне нужна виза.

0

Что означает Brexit для европейского финтех и IT рынка

kohus Jul 4 2016 at 13:17

Почитала, ошиблась. Правда открытая граница тут все равно не при чем. То, о чем написано в статье, имеет отношение не к границе, а к единому европейскому рынку труда (Single labour market). Вполне возможно, что Британия там останется, так же как и, например, Норвегия, которая членом ЕС не является.

0

Что означает Brexit для европейского финтех и IT рынка

kohus Jul 4 2016 at 12:37

Не путаю. Гражданин ЕС не может въехать в Великобританию по внутреннему паспорту.

0

Что означает Brexit для европейского финтех и IT рынка

kohus Jul 4 2016 at 12:12

Открытая граница между Соединенным королевством и ЕС никогда не существовала.

+1

Автопилот Tesla: первая смерть

kohus Jul 1 2016 at 07:19

Это же ошибка человека, а не автопилота, тягач же налево поворачивал?

0

Что случилось с 53 компаниями, которые Yahoo купила под управлением Мариссы Майер

kohus Jun 23 2016 at 13:13

Yahoo, не закрывай flurry! Я так люблю их mobile developer suite.

0

Готовим простой блог на микросервисах, пишем свой микрофреймворк на php и запускаем все на Docker с примерами

kohus Jun 8 2016 at 07:49

И этот микросервис знает о всех правах в системе, то есть фактически о всех ее сущностях?

0

Готовим простой блог на микросервисах, пишем свой микрофреймворк на php и запускаем все на Docker с примерами

kohus Jun 8 2016 at 07:23

А можете сказать, насколько стоимость разработки выросла (ну или уменьшилась)?

0

Готовим простой блог на микросервисах, пишем свой микрофреймворк на php и запускаем все на Docker с примерами

kohus Jun 8 2016 at 07:03

Мне интересно, а где во всех этих микросервисах находится контроль доступа к данным? Например, какие посты может пользователь видеть, а какие редактировать. Каждый сервис это по своему решает? Или у вас есть сервис, который права раздает/проверяет, а все остальные от него зависят?

+1

Как перенести центр разработки из России в Чехию

kohus Jun 3 2016 at 09:25

Я вам отвечу, живу в Праге с 2002 года. Обязательная медицинская страховка платится как налог, размер выплат регулировать нельзя, от дохода зависит. Лечение зубов не входит, удаление и осмотр — бесплатно.

В конце февраля у меня рука начала болеть, так пришлось идти с этим сначала к терапевту, получила направление и записалась на конец апреля на консультацию к невропатологу. На консультации невропатолог решил, что нужно обследование и записал на начало июня. Вот ждем-с. Вобщем, лучше не болеть. Но бесплатно, это да. Правда, когда на скорой приезжаешь, все наверное быстро происходит..

+1

Как перенести центр разработки из России в Чехию

kohus Jun 3 2016 at 09:14

Я вот как раз разработчиков хорошо понимаю. Найти работу в Европе в разы легче, когда ты уже легально находишься внутри страны.

+1

1