Комментарии / Профиль dronnix / Хабр

Андрей@dronnix

Backend

Black-White Array: новая структура данных с O(log N) аллокаций

Коллега @jordiutrera предложил использовать свободную часть старшего обновляемого white-segment'a, вместо Black-сегмента, что снизило потребление памяти почти вдвое:

Теперь реализация не вполне соответствует оригинальной статье. В качестве референса к публикации лучше использовать версию 1.0.2: https://github.com/dronnix/bwarr/releases/tag/v1.0.2

Ускорение вычислений в алгоритме DRS-виртуализации через векторизацию

dronnix 28 янв в 09:45

Спасибо, классная статья!
Как шутил одни профессор - "оптимизация загрузки кластера задачами может занимать больше чем сами задачи".

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 25 янв в 09:51

Выпустил релиз 1.0.2 с дополнительными комментариями реализации.
Спасибо хабробропользователям:
- @wataru - за ревью, найденный баг в реализации и интересную дискуссию;
- @jordiutrera - за ревью, PR с оптимизациями;
- @cpud47 - за продуктивное обсуждение трудоёмкости;

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 21 янв в 08:11

Отличный вопрос. Действительно, черные сегменты нужны каждую вторую вставку. Поэтому в своей реализации я держу их наготове. Но! более опытный в алгоритмах @jordiutrera предложил использовать старший белый массив как целевой: https://github.com/dronnix/bwarr/pull/23

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 17 янв в 15:16

Это верно, но и представить режим работы, при котором каждый вызов Min будет довольно сложно: нужно изменить довольно много данных между его вызовами. На фоне этих изменений вклад Min будет не заметен.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 17 янв в 15:03

то при удалении это надо будет пересчитывать за O(n).

Я решил пересчитывать не при удалении, а при вызове Max/Min чтобы не портить производительность удаления.
Верно, что в худшем случае это будет , но при последовательном вызове DeleteMin() для N элеметов потребуется сумммарно пропустить не более N элементов. Т.е. для серии вызовов это амортизируется в . Такая же история с упорядоченным обходом.

21 урок, который я усвоил за 14 лет работы в Google

dronnix 16 янв в 15:00

В оригинальной статье - "clever code", ближе к "заумный" чем к "продуманный" в этом контексте.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 15 янв в 17:19

Линейный поиск ненулевого бита - это лишь деталь моей реализации. Планирую заменить на многоуровневый с логорифмической сложностью, хотя и жалко пары процентов производительности на вырожденный случай. На оценки из оригинальной публикации это не влияет, там этот механизм вообще не описан.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 15 янв в 15:35

Также, есть обратная сторона медали: если мне нужны только уникальные элементы(а этом, согласитесь, более частый кейс), то приходится делать Search||Insert - а это бъёт по перфу.

Не знаю на сколько частый, но да, бъёт. Мне нужны были именно вспомогательные индексы по неуникальному полю - timestamp, [S2CellID] (https://s2geometry.io/devguide/s2cell_hierarchy.html), etc, поэтому сразу делал упорядоченное мультимножество.

Ещё раз спасибо вам за ваши коментарии.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 15 янв в 14:47

Вы имеете ввиду случай, когда после минимального элемента идёт серия удалённых? Да, этот минус описан в начале статьи и вот здесь обсуждали возможные оптимизации.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 15 янв в 11:16

Положил в бэклог.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 15 янв в 11:13

Также этот инвариант нарушается при слиянии отрезков: https://github.com/dronnix/bwarr/blob/5a25121cb0da85fe401dc81b5b046f376cae8638/segment.go#L35

А вот это - "nice catch", как говорится, посмотрю подробнее и поправлю чуть позже. Большое спасибо.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 15 янв в 10:43

Верно, даже хуже, сложность будет при упорядоченном обходе - нужно каждый раз выбирать сегмент с наименьшим элементом.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 15 янв в 10:05

Про корректность ответил выше.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 15 янв в 10:04

У вас там похоже делается предположение, что раз в отрезке меньше половины удаленных и вы встретили удаленный, то слева точно что-то должно быть. Но ограничение-то на весь целый отрезок. Маленький его кусочек, рассматриваемый в бинпоиске, может нарушать это ограничение.

Спасибо за подробности! Верно, всегда идём на лево, потому что всегда удаляем самый правый элемент среди равных, что и обеспечивает `findRightmostNotDeleted` (используется и при поиске и при удалении). Надеюсь, снял вопрос по корректности?

Это O(N) даже с битовой магией. Ибо повторяющихся элементов может быть много

С учётом вышесказанного - нужно найти первый ненулевой бит в серии. Для этого есть много разных подходов, но прийдётся городить структуру данных внутри структуры данных. В простейшем случае можно сначала проверять не биты, а машинные слова - по 64 бита сразу. Последовательно. В теории сложность всё ещё линейная, на практике очень быстро работает.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 15 янв в 09:42

В целом я бы посоветовал собрать сравнительную табличку.

Это можно, но для каждой структуры данных худшие, а для BWA ещё и довольно экзотические.

Так же более медленные поиск минимума, максимума (там линейная вообще сложность, по-моему. Ибо, а что если минимальные элементы все удалены?

Верно. Так как это случай был критичен для моего случая практического использования - оптимизировал его хранением позиций первого и последнего неудалённого элемента в массиве. Но со вторым элементом с конца всё будет так как вы написали.

Так же нельзя также быстро сделать всякие вещи на отрезках.

Можно, для этого даже отдельный метод есть! Сложность будет - квадрат логарифма. Медленнее чем у деревьев, но всё ещё достаточно быстро для многих случаев.

Структура интересная, но надо четко понимать, что в лоб сравнивать с деревьями нельзя, потому что она может сильно меньше.

Вот тут полностью согласен: структура требует знания её сильных и слабых сторон, B-Tree с правильным degree в этом плане более универсален.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 15 янв в 09:18

Вот представьте, что у вас все элементы с одинаковым ключом, и массив deleted: [true, false, true, true, true].

Во первых, этот пример не корректен - удалённых элементов не может быть быть более половины, но в целом кейс верный. Я его сразу описал в начале статьи, в недостатках:

При редких паттернах операций массового удаления, возможна деградация производительности поиска до

Это случай поддаётся оптимизации - нужно эффективнее искать неудалённый элемент в битовой маске. Но он настолько вырожденный, что я не стал усложнять реализацию ради него.

Тесты у вас слабые. Надо добавить побольше одинаковых элементов и кучу разных битовых масок deleted.

Чтобы не перебирать разные битовые маски, существуют классы эквивалентности. Кажется я покрыл все, но если упустил - пожалуйста напишите какой конкрктно, или сделайте PR.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 15 янв в 09:01

Перебалансировка дерева - это перекинуть Log n указателей-индексов. Прыжков тут не больше, чем в бинарном поиске.

Верно, но BWA не делает этой перебалансировки при вставке. Только слияния. И эта перебалансировка в BTree от Google уже медленнее чем вставки в BWA. Если ещё добавить периодические перемещения при использовании реаллокации массива - будет еще медленнее. Но если нужен не `Insert`, а `ReplaceOrInsert`, тогда будет как вы написали.

Ну это такое себе, оно за O(n) уменьшает потребление памяти максимум в 2 раза. В дереве тоже можно все пустые места перекинуть в конец и обрезать массив (с переаллокацией и memcopy, конечно).

Виноват, здесь не имел в виду удаление. Приведу пример: приложение читает данные из потока, размер которого заранее не известен. После чтения последнего элемента можно вызвать метод Compact() и удалить неиспользуемые массивы и чёрные сегменты. Например, при 9 элементах в BWA будут массивы длиной 1,2,4,8. После компактификации останутся 1 и 8 (трудоёмкость логарифмическая). В дереве-в-массиве же будет 16 элементов в этом случае.
Compact довольно удобен, когда нужно периодически обновлять данные - можно минимизировать потребление памяти до полезной + 1 бит(для признака удаления) между обновлениями.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 15 янв в 08:40

Во-первых, спасибо за внимательное прочтение, включая первоисточник. В современном мире это дорогого стоит!

Значения поисков редко распределены равномерно. Вообще распределение входных ключей может быть сильно разным. И есть основания полагать, что достаточно часто оно сильно перекошено (всякие правила Парето и прочее). Поэтому на практике результатами этой теоремы воспользоваться нельзя.

75% элементов расположено в первых двух массивах. ~94% в первых четырёх, что даёт или что хуже чистого логарифма, но всё ещё очень быстро.
Случай, когда нам постоянно нужны только 6% элементов расположенных в младших массивах - довольно вырожденный.

P.S. Будьте аккуратнее с обработкой "одинаковых ключей", как Вы заявили. Потому что там очень легко все ассимптотики могут стать. Хотя глядя на код поиска, кажется он некорректен в присутствии одинаковых элементов.

Вот тут пожалуйста по-подробнее, у меня покрыты тестами этот и другой случаи. Буду признателен за конкретный пример, на котором код работает некорректно. Про деградацию по производительности - такая же просьба.

Black-White Array: новая структура данных с O(log N) аллокаций

dronnix 15 янв в 08:19

Кажется такой бенчмарк не очень репрезентативен.Не до конца понятна целевая ниша этой структуры данных, но обычно всё же у нас есть ещё какое-то (сравнительно большое) значение.

Типичный случай такого применения - вторичный индекс: основная структура лежит в массиве или map, a дерево/BWA хранит индекс в этом массиве или указатель и упорядочено по другому ключу.

Также стоит понимать, что использовать деревья просто как ассоциативные контейнеры чаще всего затея не самая удачная.

Это верно, если посмотрите на интерфейс библиотеки - у меня реализованы все типичные для деревьев методы, включая итераторы, Max/Min, etc. Так же реализованы некоторые методы, которые в деревьях не реализуемы, неупорядоченный обход с , например, по скорости близкий к обходу массива.

2 3 4

Информация

Специализация