Комментарии / Профиль bznk / Хабр

Вот этого не происходит, конечно же. Мы не можем просто взять и прервать обработку заказов, даже на несколько минут. Первым шагом мы учим узлы сервиса искать данные одновременно и в старом и в новом шарде. Благодаря этому, записи (как от сервиса, так и любую сбоку) можно делать в любой шард.

Но пока вы как-то копируете данные, эти данные обновляются на старом шарде

Чтобы такого не случилось, нужно перестать записывать новые данные в старый шард. Тогда после копирования старый шард будет "не свежее", чем новый.

В таком подходе способ копирования будет не принципиален, потому что переливать данные можно сколь угодно долго без потери консистентности. Поэтому у нас это простой фоновый скрипт.

10 000 RPS и доступность 99,99%: как устроено шардирование PG в процессинге Яндекс Такси

bznk 17 фев в 15:48

На момент выбора много лет назад YDB еще не была достаточно зрелой технологией. А на текущий момент мы действительно переезжаем на YDB.

10 000 RPS и доступность 99,99%: как устроено шардирование PG в процессинге Яндекс Такси

bznk 16 фев в 16:52

Транзакции в такой все-таки нужны, чтобы атомарно работать с цепочкой событий. Но, в основном, выбор был скорее субъективный, так как была хорошая поддержка постгре в userver'e.

10 000 RPS и доступность 99,99%: как устроено шардирование PG в процессинге Яндекс Такси

bznk 13 фев в 16:03

Выбор шарда делается по формуле из статьи. То есть вычисляется хеш от PK и от него номер шарда (из фиксированного кольца). В этом смысле схема довольно типичная. Отличие тут в способе выполнения решардирования.

В этой статье не рассказывается, но в реальности, хранилище разделяется на горячую и холодную часть (на основе YTsaurus).

10 000 RPS и доступность 99,99%: как устроено шардирование PG в процессинге Яндекс Такси

bznk 13 фев в 08:40

Да, конечно, следим за опытом коллег. Но этот кейс не очень релевантный, так как процессинг не работает с координатами (этим занимается отдельный микросервис). Процессинг отвечает за цикл заказа, то есть за продвижения автомата заказа по стадиям, а это не очень интенсивная по update'ам задача.

Информация

Специализация