MongoDB *

Документо-ориентированная система управления БД

СтатьиПостыНовостиАвторыКомпании

spring_aio 22 дек в 16:11

Как ускорить MongoDB в Java: profiling, explain(), индексация и антипаттерны

Простой

32 мин

6.7K

Блог компании Spring АйОПрограммирование * Java * Kotlin * MongoDB *

Обзор

Перевод

Команда Spring АйО подготовила материал о том, почему «быстрый запрос в MongoDB» — это не магия, а дисциплина: индексы, форма запроса, проекции, explain(), профайлер и наблюдаемость в Java/Spring Boot. Разбираем, как отличать IXSCAN от COLLSCAN, где чаще всего прячутся антипаттерны (skip-пагинация, тяжёлые $regex/$nin, findAll), и как выстроить измеримый цикл оптимизаций от Atlas/Compass до Micrometer.

Meijlen 24 ноя в 13:25

KRepo: Spring Data для Ktor — без Spring и без боли

Простой

3 мин

Kotlin * Java * MongoDB * PostgreSQL * Open source *

Из песочницы

KRepo: Никаких имплементаций или инъекций. Под капотом — динамический прокси, кэширование метаданных и независимость от фреймворков: плагины под Exposed, JDBC или MongoDB реализуются отдельно.

emil12345 18 окт в 20:06

Как я в одиночку спроектировал API-шлюз на FastAPI, который держит 200к+ запросов в сутки

Средний

3 мин

20K

Python * Проектирование API * MongoDB * MySQL *

Из песочницы

Привет, Хабр!

я Python-инженер. Последние несколько лет я в одиночку строил довольно сложную бэкенд-систему, и за это время набил немало шишек и нашел, как мне кажется, несколько интересных решений. В этой статье я хочу поделиться не "историей успеха", а конкретными архитектурными проблемами и их решениями при построении высокопроизводительного сервиса на асинхронном Python.

Статья будет полезна тем, кто работает с FastAPI, микросервисами и думает о надежности и масштабируемости своих систем.

-14

Dred222 20 сен в 20:50

Как я перенёс опыт из PostgreSQL в MongoDB и получил готовый чек-лист

Простой

4 мин

8.3K

PostgreSQL * MongoDB * Программирование * Базы данных *

Роадмэп

Работаете с PostgreSQL и хотите попробовать MongoDB? Я спроецировал опыт работы с реляционными БД на NoSQL и собрал два чек-листа: проверенные практики для PostgreSQL и их аналоги для MongoDB.

Без воды, только ключевые пункты чтобы быстро стартовать и не наступать на типичные грабли.

korobovn 19 сен в 13:53

Нормализация vs Денормализация: Mongo, Postgres и реальная жизнь

Средний

19 мин

9.6K

PostgreSQL * MongoDB * Базы данных * Анализ и проектирование систем * Микросервисы *

Кейс

Нормализация vs Денормализация: Mongo, Postgres и реальная жизнь. Почему у нас вырастает 160 таблиц там, где мог быть один jsonb? И как понять, когда денормализация — это костыль, а когда осознанный выбор?

Если при слове «нормализация» у тебя начинается зевота, а менеджер с порога предлагает «спроектировать базу» — этот текст для тебя.

KoppeKTop 11 сен в 07:00

Миграция без боли и даунтайма: как мы перевозили данные с MongoDB на PostgreSQL

Средний

12 мин

8.7K

Блог компании ЯндексБазы данных * MongoDB * PostgreSQL * Высоконагруженные системы *

Ретроспектива

Всем привет! Меня зовут Андрей, я бэкенд‑разработчик ядра Яндекс Диска. В индустрии я уже около 15 лет и повидал некоторое ПО. Последние три года занимаюсь ядром файловой системы — всем, что связано с метаданными о файлах.

Однажды мы в Диске переносили общие данные из шардированного MongoDB в шардированный же PostgreSQL. После переноса пользовательских данных у нас осталась часть данных про общие папки.Их было сложно изолировать внутри шарда пользователя, и они остались в общей БД на MongoDB, которую мы так и назвали — CommonDB. Спустя время мы заметили, что общая БД не справляется с нагрузкой: все запросы перед выполнением должны были сначала получить информацию об общих папках, и только после этого они начинали работать. Поэтому надо было дублировать информацию ближе к другим данным пользователей — на их шарды.

Однако при дублировании важно было избежать распределённых транзакций, так как они снижают общую производительность. Также проблемой был сам процесс перехода: у нас сотни миллионов пользователей, которые не должны были ощущать процесс перехода и потерять доступ к своим данным. При этом надо было выкатывать изменения не сразу на 100%, а частично, с возможностью в любой момент отключить функциональность. При выкатке также нельзя было допустить даунтайм.

В статье я хочу поделиться опытом этой масштабной миграции. Под катом покажу, как вообще устроены сложные миграции и как к ним подходить. А также перечислю те пункты, на которые нужно обратить внимание, если вам предстоит миграция под нагрузкой.

Замигрировать

+28

SergeyGSA 19 авг в 13:17

Тестирование CAP-теоремы на примере MongoDB: аварийные ситуации

Средний

13 мин

5.8K

Блог компании Т-БанкMongoDB * Распределённые системы * Анализ и проектирование систем * Базы данных *

FAQ

Привет, Хабр! На связи Сергей Гайдамаков. Продолжаем обсуждать и тестировать набор реплик MongoDB.

В предыдущей статье мы рассмотрели структуру отдельного узла MongoDB, разобрали свойства параметров writeConcern и readConcern для работы с набором реплик MongoDB.

В этой статье я покажу результаты тестов при аварийных ситуациях, которые могут происходить в распределенной системе. Сделаем выводы о свойствах набора реплик с точки зрения CAP- и PACELC-теорем для распределенных систем и посмотрим параметры управления CAP-свойствами неоднородных распределенных систем.

CodeStar 7 авг в 14:15

Построение REST API на Go с использованием Gorilla Mux и MongoDB

4 мин

7.7K

Go * MongoDB * Программирование *

Из песочницы

Введение

В данной статье будет рассмотрена практическая интеграция MongoDB с веб-приложением на Go, построенным на базе маршрутизатора Gorilla Mux. Цель — получить минимальный, но функциональный REST API с поддержкой CRUD-операций над сущностью Book, при этом соблюдая лучшие практики структурирования кода.

Материал рассчитан на разработчиков, знакомых с Go, HTTP API и основами работы с базами данных.

Выбор стека

Go — компилируемый язык с лаконичным синтаксисом, встроенной поддержкой параллелизма и богатой стандартной библиотекой для работы с сетью. Эти качества делают его удобным выбором для разработки API-сервисов.

mav3riq 7 июн в 14:13

100K юзеров за 3 дня — что сломалось после релиза

Средний

11 мин

5.2K

Node.JS * NestJS * DevOps * MongoDB * Веб-разработка *

Кейс

Привет, Хабр!

В этой статье — история запуска Telegram Mini App, куда за трое суток пришло 100.000 реальных пользователей.

Покажу, как мы масштабировали Node.js приложения на многоядерных серверах, увеличивали RPS в 10 раз, боролись с N+1 проблемой в MongoDB и снижали нагрузку на CPU. А ещё расскажу как мы быстро настроили мониторинг через Grafana, подключили Cloudflare и интегрировали Sentry. Поделюсь практическими инсайтами о том, на что стоит обращать внимание в первую очередь, и как эти инструменты помогли нам оперативно находить узкие места и устранять сбои в реальном времени. Всё, о чём будет в этой статье, основано на том, что действительно сработало. Кроме того, расскажу, какие моменты мы упустили до запуска.

Это разбор с цифрами, графиками и практическими выводами. Он может сэкономить вам время, нервы и деньги, если вы готовитесь к запуску Telegram Mini App или просто работаете с Node.js-приложениями, которые могут оказаться под серьёзной нагрузкой.

Это вторая часть истории — про то, как мы запустились и что сломалось первым после релиза. Тут будет про то, как мы это чинили и какие решения приняли, чтобы приложение продолжало работать под нагрузкой.

Первая часть про подготовку к запуску доступна здесь.

+14

mav3riq 31 мая в 18:48

100K юзеров за 3 дня — как готовились к релизу

Средний

13 мин

3.8K

Веб-разработка * MongoDB * DevOps * NestJS * Node.JS *

Кейс

Привет, Хабр!

В этой статье — история запуска Telegram Mini App, куда за трое суток пришло 100.000 реальных пользователей.

Это первая часть истории — про то, как мы готовились к запуску, что предусматривали и на что делали ставку.

Во второй части будет про то, что именно сломалось первым после релиза, как мы это чинили и какие решения приняли, чтобы приложение продолжало работать под нагрузкой.

+15

hurdos 21 мая в 09:57

Что PID твой мне?

Простой

5 мин

1.2K

MongoDB * *nix * История IT

Кейс

История про то, как мы тюнили логи в своем проекте и как это переросло во что-то большее. Возможно кому-то это поможет в своих проектах, кому-то будет просто интересно почитать.

SergeyGSA 24 апр в 08:22

Тестирование CAP-теоремы на примере MongoDB

Средний

11 мин

2.2K

Блог компании Т-БанкMongoDB * Анализ и проектирование систем * Распределённые системы *

FAQ

Привет, Хабр! Я Сергей Гайдамаков. Уже 28 лет я занимаюсь проектированием и разработкой программных систем различного масштаба. Сейчас работаю в Т-Банке системным аналитиком и проектирую системы, которые в совокупности составляют большую распределенную систему.

Несмотря на большое число статей про CAP-теорему, есть трудности ее практического применения при создании распределенных программных систем. Я описал результаты тестирования набора реплик MongoDB в штатных и аварийных ситуациях, параметры запросов для достижения требуемых свойств CAP-теоремы. А еще развенчал некоторые заблуждения и мифы относительно базы данных MongoDB.

+11

Kami-sama322 15 апр в 12:48

Стриминг Apache Flink из MongoDB в PostgreSQL на Python

11 мин

1.4K

Блог компании МТСMongoDB * PostgreSQL * Kubernetes * Big Data *

Привет, Хабр! Меня зовут Александр Цай, я ведущий аналитик в МТС Web Services, но на деле занимаюсь всеми вопросами, касающимися DA/DE/BI: выявлением потребностей и сбором требований, проектированием дашбордов и витрин для них, построением и развитием внутреннего хранилища, поиском источников данных, созданием сложных ETL-пайплайнов по их доставке, DQ, проведением аналитики и много чем еще.

В этом материале я расскажу про разворачивание пайплайна по стримингу данных из MongoDB в PostgreSQL с помощью Apache Flink (стримить из Kafka банально, а так заодно пощупаем документоориентированную БД). Делать это мы будем в minikube (kubernetes), а языком программирования для заданий выступит Python. Все описанное в посте выполняется на MacBook с процессором i7.

В интернете, тем более русскоязычном, нет информации о стриминге из MongoDB в Postgres с помощью Flink. Почти все материалы по Flink, которые мне попадались, сводятся к пережевыванию примера WordCount из flink-kubernetes-operator, где на запущенном поде из папки с примерами читается файл и в консоль выводится количество слов в нем. Если спускаться до использования PyFlink, то мы натыкаемся на кастомные образы с Harness SDK и Apache Beam и другие страшные слова. Знакомо?

Так вот, это не наш путь! Данное руководство будет полезно тем, кто ~~такой же извращенец~~ хочет пощупать Flink на родном Python и кто не планирует брать примеры, оторванные от реальности.

+21

Prikalel 5 апр в 14:27

Сравнение 2х нишевых библиотек для написания миграций в монго

Простой

13 мин

816

MongoDB * C# *

Обзор

В работе веб-разработчика (в частности бекенд-разработчика) встречается много разных интересных и уникальных задач. В этой статье речь пойдёт о такой теме как написание миграций документно-ориентированной БД mongo. Как и в любой задаче у нас имеется несколько вариантов решения проблемы. Мы подробно разберём примеры использования 2х разных c#-библиотек, не углубляясь в детали реализации. Посмотрим их плюсы и минусы и выберем 1 из них для выполнения поставленной задачи. В конце нас ждёт небольшое сравнение производительности, так что пристегнитесь, ведь будет интересно.

Пристегнуться!

ivankov_timofei 29 мар в 11:15

Как правильно выбрать базу данных для разработки: понимание моделей репликации

Средний

38 мин

11K

SQL * PostgreSQL * NoSQL * MongoDB * Распределённые системы *

Из песочницы

Выбор подходящей системы управления базами данных (СУБД) — важнейшая задача при проектировании программных систем. Разработчики и архитекторы учитывают множество факторов: модель данных (реляционная или NoSQL), поддержку транзакций, масштабируемость, требования к согласованности и многого другое. Одним из ключевых архитектурных аспектов, влияющих на эффективность и надежность системы, является модель репликации данных. Репликация означает поддержание копий одних и тех же данных на нескольких узлах (серверах), соединённых по сети.

Зачем это нужно? Репликация позволяет: во-первых, держать данные ближе к пользователям (уменьшая задержку при запросах); во-вторых, продолжать работу системы даже при сбое отдельных узлов (повышая доступность); в-третьих, масштабировать систему, увеличивая число узлов для обслуживания запросов на чтение (повышая пропускную способность).

Однако реализация репликации сопряжена с серьёзными архитектурными компромиссами. Согласно теореме CAP, в распределённой системе невозможно одновременно гарантировать все три свойства: консистентность данных, доступность сервиса и устойчивость к разделению сети. При возникновении сетевых сбоев (разбиении на изолированные сегменты) системе приходится жертвовать либо мгновенной согласованностью данных, либо доступностью части узлов. Поэтому разные СУБД делают разные выборы в этих компромиссах. Архитектурная модель репликации, лежащая в основе СУБД, определяет, как база данных достигает (или не достигает) консистентности, доступности и отказоустойчивости. Понимание этих различий крайне важно для архитекторов и разработчиков: зная поведение репликации, вы сможете выбрать такую СУБД, которая лучше соответствует требованиям вашего проекта по масштабу, геораспределенности, допустимой задержке и устойчивости к сбоям.

Marwin 6 мар в 08:42

Как превратить сырые данные в аналитический отчет

Простой

10 мин

2.4K

Визуализация данных * Программирование * C# * Data Mining * MongoDB *

Туториал

Делюсь опытом и готовыми решениями по сбору и структурированию сырых данных, превращая их в полезный инструмент для аналитиков.

agushin 26 фев в 04:51

Работа с БД в MongoDB и PostgreSQL через питон(python3) и WSL

Простой

5 мин

1.9K

MongoDB *

Туториал

PostgreSQL и MongoDB: два подхода к управлению данными

В мире баз данных существует множество решений, каждое из которых подходит для определённых задач. Два популярных представителя — это PostgreSQL и MongoDB. Они представляют собой разные подходы к хранению и обработке данных: реляционный и документоориентированный. Рассмотрим их основные особенности.

-5

alenameteneva 13 фев в 10:20

MongoDB: магия вне Хогвартса в IT

Средний

9 мин

Блог компании SM LabMongoDB * Тестирование IT-систем * Тестирование веб-сервисов * Java *

Туториал

Привет, Хабр!

Меня зовут Алена Метенева, я работаю старшим инженером по обеспечению качества в компании SM Lab в проекте «Кассы». Я тестирую бэкенд и интеграции и там, где это возможно, автоматизирую тесты на Java. Сегодня я хочу рассказать вам о том, как MongoDB помогает мне с этим процессом.

Что такое MongoDb

Думаю, многие работали с MongoDB (Монга) и знают, что это нереляционная СУБД, которая использует для хранения данных JSON-структуру: вместо таблиц и строк, как в реляционных базах данных, в MongoDB есть коллекции (набор документов, эквивалент таблицы реляционной базы данных) и документы (внутри коллекции они могут отличаться друг от друга размером, содержанием и количеством полей), которые состоят из пар «ключ–значение».

Для чего Монга тестировщику

Основное преимущество Монги в том, что она позволяет хранить разнородные данные в одной коллекции, и поэтому хорошо подходит для хранения справочников, различных конфигов, фиче-тоглов и адресов для подключения к смежным сервисам. В моем случае приложение, которое я тестирую, считывает эти параметры из MongoDB в рантайме. А это значит, что я могу управлять поведением системы, если буду менять эти параметры прямо во время тестов.

Что я имею в виду?

Представьте, что вы тестируете интеграцию с другой системой. Если все работает стабильно, то пройти позитивные сценарии будет проще всего. А если вы хотите протестировать кейс, в котором смежная система выдает ошибку 503 (Service Unavailable) – это будет уже сложнее. Хорошо, если вы управляете обеими системами и можете просто перезагрузить одно приложение и попытаться достучаться до него через второе. А если система не ваша? В таком случае принято использовать моки. Но есть и третий вариант: если ваше приложение для подключения к другому берет ссылку из MongoDB, то эту ссылку можно просто подменить, добавив в нее лишние символы, чтобы получить ту самую ошибку 503 или 404 (Not Found), например.

mpanfilov 3 дек 2024 в 11:33

250 000 товаров и миллионы характеристик: как мы скрестили Битрикс с Symfony и MongoDB

Средний

7 мин

1.5K

Веб-разработка * Разработка под e-commerce * MongoDB * Symfony * 1С-Битрикс *

Кейс

10 лет назад мы начинали бизнес студии с разработки сайтов на CMS 1С-Битрикс. Сегодня наш основной стек связан с подходом Single Page Application на Symfony и Nuxt, но клиенты по-прежнему просят сайты на Битриксе.

Отказываться от работы не хочется, однако приходится обходить ограничения Битрикса, чтобы делать быстрые и качественные продукты. В этой статье о том, как мы написали сервис для обработки больших объемов данных на Symfony и MongoDB и интегрировали его с 1С-Битрикс.

+10

Z1at 10 ноя 2024 в 23:04

Написание ETL пайплайна при помощи airflow, rabbitmq и postgres

Простой

5 мин

6.3K

IT-инфраструктура * Apache * MongoDB * PostgreSQL * Python *

Туториал

В данной статье мы рассмотрим взаимодействие apache airflow, rabbitMQ и postgreSQL. Научимся правильно устанавливать соединения между ними и напишем базовый ETL.

2 3 ...

12 13

MongoDB *

Как ускорить MongoDB в Java: profiling, explain(), индексация и антипаттерны

Новости

KRepo: Spring Data для Ktor — без Spring и без боли

Как я в одиночку спроектировал API-шлюз на FastAPI, который держит 200к+ запросов в сутки

Как я перенёс опыт из PostgreSQL в MongoDB и получил готовый чек-лист

Нормализация vs Денормализация: Mongo, Postgres и реальная жизнь

Миграция без боли и даунтайма: как мы перевозили данные с MongoDB на PostgreSQL

Тестирование CAP-теоремы на примере MongoDB: аварийные ситуации

Построение REST API на Go с использованием Gorilla Mux и MongoDB

100K юзеров за 3 дня — что сломалось после релиза

100K юзеров за 3 дня — как готовились к релизу

Что PID твой мне?

Тестирование CAP-теоремы на примере MongoDB

Стриминг Apache Flink из MongoDB в PostgreSQL на Python

Ближайшие события

Сравнение 2х нишевых библиотек для написания миграций в монго

Как правильно выбрать базу данных для разработки: понимание моделей репликации

Как превратить сырые данные в аналитический отчет

Работа с БД в MongoDB и PostgreSQL через питон(python3) и WSL

MongoDB: магия вне Хогвартса в IT

250 000 товаров и миллионы характеристик: как мы скрестили Битрикс с Symfony и MongoDB

Написание ETL пайплайна при помощи airflow, rabbitmq и postgres

Вклад авторов