youROCK Jul 23 2023 at 20:25

Поиск по произвольным параметрам

Medium

5 min

4.6K

High performance * Website development * MySQL * PostgreSQL * SQLite *

Tutorial

-3

Comments 12

Tzimie Jul 24 2023 at 05:44

Автору следовало бы указать, что многие вещи верны только для определенных баз, иначе как неверных утверждений, типа

Помимо очевидного недостатка, что набор полей кластерного индекса должен быть уникален (т.е. AUTO_INCREMENT использовать не выйдет),

youROCK Jul 24 2023 at 07:07

Согласен, я рассматривал только MySQL, SQLite и Postgres. У первых двух автоинкремент в составе композитного кластерного индекса нельзя определить. В каких-то других базах разве можно?

Tzimie Jul 24 2023 at 08:06

Конечно, более того, это самая стандартная практика, ID как primary key, identity (в терминах MSSQL)

FanatPHP Jul 24 2023 at 06:46

Спасибо, Юра, как всегда интересно и познавательно!
Для "Много чтения, мало записи" можно еще финт ушами — составной индекс по всем полям, участвующим в поиске, где первым идет поле для сортировки. И выбирать двумя запросами: сначала только айдишники, а потом по ним нужные записи целиком. То есть такой вариант битмап индекса, который жрет больше памяти и в целом работает помедленнее, но по крайней мере читаем из памяти по порядку. Но зато его не надо вручную перестраивать :)

youROCK Jul 24 2023 at 07:30

Спасибо :). Да, твое решение тоже норм, если искать нужно не по всем полям. Интересное свойство именно кластерного индекса состоит в том, что оно не требует создания отдельной копии данных (для индекса), поэтому в случае, если фильтровать нужно (почти) по всем полям, дополнительный индекс почти ничего не даст.

youROCK Jul 24 2023 at 07:34

На счет битмап индекса: его тоже ведь можно обновлять плавно, например сделать из него LSM-структуру, где новые куски (уже отсортированные) битмап-индекса вставляем в виде отдельного индекса в конец и периодически мержим в один большой. Но это вариант только когда данных очень много, да :). Обычно задержка в несколько минут (или как часто перестраивается индекс) для пользователей не так важна.

FanatPHP Jul 24 2023 at 08:01

Смешно, я невнимательно прочитал статью, и решил что битмап индекс строится на стороне БД. Но сейчас я понял, что это это совсем отдельный массив, который лежит, например, в Редисе. Тогда да, перестройка индекса не будет влиять на работу БД — что меня смущало.

youROCK Jul 24 2023 at 09:52

Вместо редиса можно использовать, скажем, простенький сервис на Go, ибо у редиса будет большой оверхед просто из-за необходимости хранить каждый битмап в отдельном ключе (вместо просто сплошного массива в Go)

noszone Jul 24 2023 at 07:02

Используются ли в реальных, больших интернет-магазинах приведённые Вами примеры?

youROCK Jul 24 2023 at 07:26

Да, вполне. Про bitmap index, например, есть такая статья: https://habr.com/ru/articles/261137/

comerc Oct 2 2023 at 15:27

В мамбе такое было 15 лет назад.

youROCK Oct 2 2023 at 19:17

Да и сейчас наверное ;)