Как стать автором
Обновить

Комментарии 3

Судя по документации YDB топики практически тоже самое что кафка топики? Есть ли какие-то значимые различия?

Мы очень стараемся, чтобы снаружи для приложений оно именно так и выглядело - полная совместимость.

Отличий на самом деле два вида: внутренние (стоимость, скорость, георезервирование), которые существуют, независимо от протокола, и отличия проявляющиеся при использовании YDB sdk или просто экосистемы YDB.

  1. С точки зрения внутренних отличий мы гораздо компактнее храним данные: у нас используется erasure-кодирование против репликации Kafka/Pulsar. В итоге разница в объемах хранения 1:2 в пользу YDB. Кроме этого, мы умеем в настоящее георезервирование на N датацетров, а не просто в дублирование в соседнем кластере. То есть мы полноценно живет в геораспределенных инсталляциях, включая кроссдц exactly once обработку данных.

  2. С точки зрения экосистемы мы двигаемся в сторону транзакционной передачи данных между топиками и таблицами. Сейчас мы умеем транзакционно читать из таблиц и писать в очередь, теперь учимся делать наоборот. Цель - exactly onсe при обработке данных между топиками и таблицами.
    Кроме этого, сейчас мы делаем split-merge партиций, этого нет в Kafka, но это позволяет динамически изменять число партиций (выполнять scaling) с сохранением всех гарантий exacly once.

Спасибо. Судя по тому как вы ответили, то можно просто заменить кафку на YDB и не переписывать клиентские приложения в части протоколов обмена. При этом мы получим новые эксплуатационные возможности и снизим требования к серверам в части объемов хранения. Если так, то это просто замечательная информация.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий