Как стать автором
Обновить

Пайплайны записи своими руками: думали — велосипед, оказалось — паттерны

Уровень сложностиСложный
Время на прочтение17 мин
Количество просмотров4.3K
Всего голосов 36: ↑36 и ↓0+41
Комментарии6
1

Комментарии 6

Почему просто взять и не попробовать использовать YDB? Там есть очередь, есть таблицы, есть транзакции, есть транзакции очередь-таблица, есть гарантии и есть механизмы дедупликации. И все это одна БД, а не зоопарк. И это явно работает быстрее и надежнее чем Kafka + VM

Это хороший вопрос! Постараюсь ответить по пунктам:
1. У больших продуктов всегда надо рассматривать исторический контекст, т.е. когда и что начиналось, какие инструменты были доступны и т.д.
2. С другой стороны даже при наличии интересных решений в текущий момент встает вопрос миграции. Миграции это очень дорого, не всегда есть смысл вообще это делать.
3. Мой опыт показывает, что нельзя сказать что одно быстрее другого, пока под своим профилем нагрузки на своей конфигурации железа не произведешь замеры. Для примера, сейчас мы делаем свою собственную бд оптимизированную под логи, интересно в таком ключе тоже сравнивать.
4. Если зоопарк переехал в одну бд это не значит, что стало все лучше работать или проще обслуживать. Вообще моя практика показывает, что небольшими кусочками управлять проще, и сами по себе они работают стабильнее. Более того, за годы эксплуатации нарабатывается опыт команды, набиваются шишки - с новым решением путь начинается с начала.
5. Ну и последнее, переход на YDB это по сути вендор-лок. Текущая реализация очень гибкая, ее можно развивать в любом направлении, итеративно.

Я с интересом слежу за развитием YDB, решение действительно очень крутое.

А почему вы считаете, что YDB - это вендор лок? Вкдь тоже самое можно сказать про кафку и тем более про VM.

возможно я неверно понял исходный вопрос, мне показалось что предложение - вместо кафки и разных бд использовать единое решение в виде YDB, чтобы не городить зоопарк.
зоопарк позволяет выбирать лучшее (в конкретный момент в понимании конкретных людей) для решения конретной задачи

  1. Я правильно понимаю, что вы предлагаете хранить в YDB вообще все виды данных: логи, трейсы и метрки?

  2. Вот эта фраза " И это явно работает быстрее и надежнее чем Kafka + VM" - на основе чего вы сделали данный ввод? Видимо располагаете бенчмарком? Можете показать?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий