chemtech 7 мая 2020 в 10:31

Go optimizations in VictoriaMetrics. Александр Валялкин

22 мин

6.5K

Open source*Системное администрирование*Go*DevOps*

+20

Комментарии 6

youROCK 7 мая 2020 в 12:19

Кстати задачу поиска дублей в Go я лично решал путем сортировки слайса и после этого удаление дублей тривиально :). Не знаю, быстрее ли это решение, чем использовать bitset, но оно очень простое и памяти на map выделять не требуется.

valyala 7 мая 2020 в 15:59

Да, это простое и хорошее решение, которое работает в большинстве случаев. Оно может оказаться медленнее, чем использование map для удаления дублей, если размер слайса будет большим (например, миллион элементов и больше). Сортировка требует O(n*ln(n)) операций, где n — размер слайса, а хэшмэп — O(n) операций, т.е. при больших n хэшмэп будет выигрывать по скорости. Недостаток удаление дублей с помощью хэшмепа — он требует больше памяти и работает медленнее при небольшом количестве элементов в слайсе.

maxim_ge 7 мая 2020 в 16:13

удаление дублей тривиально :)

Можно раскрыть эту тривиальность для случая удаления тысячи дублей из миллиона элементов? Дубль копируем в конец а затем что-то типа `a = a[:len(a)-1] ` или что-то более нетривиальное?

youROCK 7 мая 2020 в 16:53

Если массив отсортирован, то достаточно пробежаться по нему, имея два индекса i и j. Итерируемся по массиву с индексом i, запоминаем во временной переменной предыдущий элемент, и если он отличается от текущего, то увеличиваем j и копируем текущий элемент в тот же массив, по которому итерируемся, в позицию j. После чего возвращаем сабслайс a[0:j-1] (или a[0:j], сходу сложно сказать :)). Извините, если немного сумбурно объяснил :).

maxim_ge 7 мая 2020 в 17:01

Понятно, спасибо

valyala 7 мая 2020 в 16:02

Вот ссылка на видео этого доклада — https://youtu.be/MZ5P21j_HLE
Вот ссылка на слайды — https://docs.google.com/presentation/d/1k7OjHvxTHA7669MFwsNTCx8hII-a8lNvpmQetLxmrEU/edit?usp=sharing

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Go optimizations in VictoriaMetrics. Александр Валялкин

Комментарии 6

Публикации

Истории