Txanxs 6 июн 2023 в 08:48

Оптимизация выборок в больших коллекциях MongoDB

7 мин

2.2K

Блог компании Специальный Технологический ЦентрPython*MongoDB*Big Data*

Кейс

Комментарии 3

kir_vesp 29 авг 2023 в 12:30

После прочтения сразу в голове возник вопрос: а зачем, собственно, был весь этот алгоритм, если вы и сами признаёте, что кастомный id решил бы эту задачу лучше? Почему не было использовано это решение?

Почему вообще MongoDB в таком необычном сценарии оказалась? Если работа с большими коллекциями, то не рассматривались ли альтернативы?

Txanxs 6 сен 2023 в 15:01

Ну, во первых, не хотелось отказываться от встроенного по умолчанию в систему идентификатора. Во-вторых - понимание приходит с опытом, изначально не было задачи осуществлять подобные выборки и накопилось большое количество баз. Переиндексировать их - можно, конечно, но мне показалось, что поиск алгоритма - хорошее решение, которое потребует меньше затрат ресурсов.

По поводу альтернатив - у меня было желание, чтобы СУБД была совместима с системой аналитики Knime. А в Knime, кроме Mongo - мало альтернатив... PostgreSQL - ну, она, как бы реляционная, не совсем подходит для слабоструктурированных данных.

kir_vesp 6 сен 2023 в 17:34

Спасибо за подробный ответ. Стало сильно понятнее теперь :)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий