Комментарии / Профиль sgjurano / Хабр

Это егэшная задачка по информатике, btw. Сдавал недавно (так вышло) - мне вот ровно она попалась, за 15 минут не уложился решить, сейчас интереса ради попробовал на leetcode - полчаса ушло с учётом вспоминания синтаксиса С++.

Хз насколько это вообще показательно, очень уж сильно зависит успешность решения таких задачек от набитости руки и состояния в моменте - в итоге алгоритмические секции просто проверяют насколько у человека натренирован конкретно этот навык, и корелляция с успешностью выполнения рабочих задач тут отнюдь не полная.

UPD: почитал решения, можно за линию сделать оказывается, у меня было решение за O(nlogk) - забавная задачка :)

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 27 июл 2023 в 06:58

Это текущая нагрузка на кластер, прокси просто должна с ней справиться, иначе она станет блокером роста бизнеса.

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 27 июл 2023 в 04:59

К сожалению это потребность платформы, практика показывает, что с настройкой умных библиотек для работы с кафкой (даже при разумных дефолтах), люди справляются очень плохо — слишком много денег теряется на факапах, связанных с этим.

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 26 июл 2023 в 22:54

Прекрасный вопрос!

Главный ответ такой: в большой компании людям не очень интересно разбираться с тонкостями настройки kafka. Это хорошо , согласуется с опытом Avito.

В итоге мы реализовали упрощающий pub-sub интерфейс, позволяющий не думать об этом.

-1

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 25 июл 2023 в 12:38

Систему делали для того, чтобы поставить её перед текущим боевым кластером, соответственно нагрузка на него определяла требования к прослойке.

Те самые миллионы rps - это нагрузка от тысяч различных потребителей по методам кафки produce и fetch (не единичные сообщения!). Мы постоянно работаем над оптимизацией потребителей через убеждение и тюнинг платформенных библиотек, но текущая ситуация именно такая.

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 23 июл 2023 в 16:48

Консьюмеров мы конечно уже реализовали, в статье об этом написано.

Как и задумывалось, api предоставляет сильно упрощённый функционал, его для большинства сценариев хватает.

Абстракция, разумеется, не идеальная — если сделать клиентов-консьюмеров больше чем партиций, то лишние будут простаивать. Это сделано намеренно, чтобы не усложнять реализацию.

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 23 июл 2023 в 04:09

Безусловно вы правы.

Выбор оптимизируемой метрики определяется целью — в нашем случае нужно было держать нагрузку на продовый кластер без чрезмерного оверхеда.

Поскольку кафка занимается в основном перекладыванием байтиков, то и оптимизировали мы именно его :)

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 21 июл 2023 в 12:37

Хорошее замечание, спасибо.

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 21 июл 2023 в 08:56

NATS к сожалению обеспечивает лишь гарантии at most once в безброкерном режиме, а с брокером смысл его использования теряется. Кроме того задача переезда на него гораздо тяжелее чем задача переезда на grpc-прокси перед kafka без переезда данных.

Ну и проблемы с библиотеками от этого никуда не деваются :)

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 20 июл 2023 в 23:17

Я в процессе отладки не раз подозревал GC, но ни разу он не был виновен - трейсинг хорошо позволяет отслеживать такое. На горячем пути в grpc и franz-go действительно в основном пулы объектов под капотом.

Идея про С++/Rust расcматривалась скорее в полушуточном режиме, поскольку мы не упирались в язык, а в команде экспертизы по Go заметно больше :)

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 20 июл 2023 в 23:10

Для подобных систем в целом валидно отправлять каждое событие в кафку, другое дело, что эти отправки стоит батчить, чтобы не создавать чрезмерную нагрузку на брокеры.

Потребность управлять поведением клиентов - как раз одна из основных причин создания data-bus, там зачастую что-то нездоровое происходит.

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 20 июл 2023 в 22:56

Посмотрел крупнейших потребителей - в топе рекламная сеть, аналитика и система защиты от ботов.

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 20 июл 2023 в 16:10

Тогда возможно вам будет интересно ознакомиться с проектом https://github.com/mailgun/kafka-pixy, хоть он и не имеет полноценной поддержки (последний релиз был в 2019), но как минимум из него можно черпать вдохновение :)

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 20 июл 2023 в 15:44

Вы оперируете интересными числами неизвестного происхождения в своих предположениях :)

Не думаю, что я смогу комплексно ответить на ваш вопрос за пределами уже сказанного.

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 20 июл 2023 в 15:36

Нагрузка на гейтвее скорее ближе к сотне тысяч rps, а дальше микросервисная архитектура делает своё дело — у нас сейчас около 4 тысяч сервисов.

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 20 июл 2023 в 15:04

Одна из ключевых целей, которую мы преследуем — это снижение сложности клиентских библиотек.

Библиотеки для работы через grpc гораздо проще чем библиотеки для работы с kafka, у нас более-менее активно используется 4 языка и на каждом свои либы с кучей подводных граблей, поддержка платформенных адаптеров вокруг них весьма болезненна.

По поводу конфигурации кластера не подскажу, возможно смогут ответить коллеги.

Как построить систему, способную выдерживать нагрузку в 5 млн rps

sgjurano 20 июл 2023 в 14:55

Клиент получит свой ack только после того как батч будет записан на брокеры.

ProducerLinger влияет на время накопления сообщений перед тем как они будут записаны, всё это время клиент ждёт подтверждения.

Если же клиент умрёт и сообщение в этот момент будет записано, то он просто запишет его ещё раз после рестарта — дублирование сообщений допустимо при at least once.

3 4 ...

11 12

Информация

Специализация