erogov 29 мая 2017 в 09:48

Индексы в PostgreSQL — 3

9 мин

74K

Блог компании Postgres ProfessionalPostgreSQL*SQL*

+33

Комментарии 14

x-wao 29 мая 2017 в 10:24

Хеш-индексы мало кто пробовал, из-за того, что они работают без WAL. С 10-ки, в которой оно наконец появятся, ситуация, возможно, изменится. Кто-нибудь из читателей использует Hash-индексы, и зачем?

afiskon 29 мая 2017 в 11:35

Amit Kapila не так давно показал, что хэш-индексы иногда могут быть быстрее B-деревьев. Следовательно, если вы ищите только по равенству, имеет смысл сравнить оба варианта и выбрать тот, который на ваших данных и объемах будет быстрее.

erwins22 29 мая 2017 в 17:32

Я пытался, раз в 10 медленнее обычных.

Кто то тут на habre пытался (я предложил попробовать) с аналогичным результатом, там задача была — связка двух таблиц по ключевому полю.

насколько я вижу по описанию и отсутствия тестов производительности совсем все плохо…

Ivan22 29 мая 2017 в 17:55

тем не менее при джоина почему-то только хэш-таблицы строяться.

erwins22 29 мая 2017 в 18:20

тут небольшая разница, я говорю о хешиндексах(постоянно хранимых), а вы о хештаблицах.(динамически создаваемых)

erwins22 29 мая 2017 в 20:23

https://habrahabr.ru/post/317980

Ivan22 30 мая 2017 в 09:12

а суть таже. Построить хешиндекс в памяти и потом по нему быстро искать.

erogov 30 мая 2017 в 11:03

Они, конечно, похожи на уровне общей идеи, но на этом сходство и заканчивается.

Starche 29 мая 2017 в 20:04

Пробовал с полгода назад. На таблице 250М записей для запросов «IN (1000 значений)» при поиске по 64-символьному текстовому ключу (sha1-хэш) скорость чтения по hash-индексу была в три раза лучше чем по btree.
Плюс хорошее влияние на скорость записи (обновление hash-индекса очень быстрое в сравнении с btree). Ну и размер индекса тоже сильно меньше.
В общем, я бы их с удовольствием использовал в проекте, если бы не отсутствие репликации.

schetchik 1 июл 2017 в 02:09

Честно говоря, так и не понял из объяснения, почему их так долго держали в недоделанном состоянии.

aykuli 14 мая 2023 в 13:22

Спасибо большое за ваши статьи, очень помогают в понимании работы Постгреса. А можно обновить статьи в соответствии с новой версией Постгреса 15? Привет из 2023 года)

erogov 14 мая 2023 в 19:10

Рад, что статьи помогают!

Сейчас наиболее актуальный источник — это книга «PostgreSQL изнутри». А обновлять и книгу, и статьи, увы, никаких сил не хватит.

Marat-onlin 27 мар в 19:57

Честно говоря не совсем понимаю для чего они вообще нужны )) Мне кажется очень тяжело придумать задачу где hash индекс был бы лучше b-tree особенно если учитывать тот факт что после удаления записей кол-во корзин не уменьшается...

erogov 27 мар в 21:48

Так и страницы B-дерева не объединяются при удалении данных.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий