tangro 25 дек 2014 в 12:33

Scapegoat-деревья

7 мин

11K

Блог компании Инфопульс УкраинаПрограммирование*Алгоритмы*

Туториал

+21

Комментарии 6

kostja 25 дек 2014 в 14:50

Эти деревья использовались в Tarantool 1.5 и 1.4 как наиболее компактные отсортированные структуры данных. К сожалению, из-за того что худший случай при вставке очень плох, они не подходят для предсказуемой производительности на больших объёмах — пересортировка при дереве в пару миллиардов записей может занимать секунды. Поэтому в 1.6 мы отказались от scapegoat деревьев в пользу B-tree в памяти с компрессией указателей на вершины.

voidnugget 25 дек 2014 в 16:27

Имхо главной главным приемуществом b*-tree является возможность использования более толерантных к кэшу операций с памятью, а недостатком является относительно длительный простой конвееров в процессоре — операцию сравнения нельзя быстро предсказать, и простой возникает уже на каждой второй-третей операции.

Мне в этом плане больше импонируют ART-деревья — с ними достаточно просто реализовать вертикальное масштабирование key-value хранилищ.

leshabirukov 25 дек 2014 в 17:45

Понимая, что в худшем случае нам, возможно, придётся посчитать вес половины дерева — мы видим ту самую сложность O(N) в худшем случае… амортизированная сложность операции не превысит O(log N)

После любой вставки, а не только в худшем случае, нам надо перепроверить баланс корня, а значит обойти всё дерево -> O(N). Или я чего-то не понимаю?

Mrrl 26 дек 2014 в 07:57

Они проверяют не полную α-сбалансированность дерева, а всего лишь условие height <= log_1/α(N)+1, где height — глубина, на которой оказался новый узел. Вот если оно нарушается, то начинают считать веса поддеревьев.

leshabirukov 26 дек 2014 в 12:42

Спасибо, теперь понятно. Автору стоило бы об этом написать, а вот объяснения сократить раза в два. А само дерево интересное, дёшево и сердито.

klirichek 25 дек 2014 в 18:02

Какая тонкая статья к году деревянного козла!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий