eshulyndina Jul 29 2021 at 15:26

Микросервисы vs. Монолит

20 min

64K

Яндекс Практикум corporate blogPython*Programming*Microservices*

Comments 29

JordanoBruno Jul 29 2021 at 15:40

Мы поняли, что большая часть наших проблем — из-за микросервисов. Недостаток ресурсов возникал из-за микросервисных проблем, а не сложных вычислений или бизнес-логики.

Ну хорошо, хоть поняли. Сначала автор создает себе массу проблем, потом пытается их героически решить. Одно хорошо - с опытом приходит понимание, как действительно нужно разрабатывать софт.

princessmilana Jul 29 2021 at 17:47

То есть один микросервис посылал во второй данные, а тот был либо более старой версии, либо данные от первого второму не доехали, а второй микросервис уже переслал что-то в третий.

Тут проблема не в архитектуре, а в том, что после выпуска кода в продакшен, кто-то начал бездумно менять контракты.

В примере описано большое количество ошибок и ни одна из них не связана с архитектурой. Видимо, в команде ни у кого не было опыта работы с микросервисами.

mayorovp Jul 29 2021 at 19:18

Архитектурной проблемой тут были неправильные контракты, которые пришлось менять. Второй архитектурной проблемой была неготовность системы к изменению контрактов.

roboter Jul 29 2021 at 21:26

Они и не должны меняться, делаешь ещё один контракт _v2 и всё.

mayorovp Jul 29 2021 at 22:40

Ну да, обычно это помогает. Но иногда бывает, что старый контракт сломан настолько, что его просто нельзя оставлять.

maxzh83 Jul 29 2021 at 18:02

Золотое правило микросервисов: если можно не использовать микросервисы, не используй микросервисы.

К сожалению, с такими требованиями (петабайт фильмов, 100500 RPS) без микросервисов будет очень сложно, если вообще возможно. Но есть и хорошая новость, ни Руслан, ни Савва за полгода это не сделают. Разве что, недавно они делали тоже самое другому заказчику.

mayorovp Jul 29 2021 at 19:29

Если каждый фильм "весит" хотя бы по гигабайту — то петабайт фильмов — это всего лишь миллион фильмов. Это уже не тот размер БД, где можно делать любую чушь — но за рамки возможностей традиционных СУБД ни разу не выходит.

Тут нормальным решением будет выделение непосредственно хранения и раздачи фильмов в отдельный шардируемый (микро)сервис — в то время как остальную систему можно без всяких проблем оставить монолитом.

maxzh83 Jul 29 2021 at 19:53

Я решил, что 1 петабайт тут это просто условная метрика, которая означает "много". Примерно как и 100500 RPS. Но если речь про миллион фильмов, то согласен - лучше монолит.

NeverIn Jul 29 2021 at 21:01

Исходя из моей практики, монолитом называют то приложение, которое во время разработки сложно запустить на локальной машине

Крайне некорректное мнение.

slepmog Jul 29 2021 at 22:05

Распределенные данные
Что насчёт JOIN?
Нам нужно сходить в сервис пользовательских данных, в сервис авторизации и аутентификации, подтянуть его комментарии, историю просмотров — и отдать. Вместо JOIN мы выполняем какое-то число HTTP-вызовов.

Вопрос без иронии.

Описанный механизм работает хорошо, когда он про одну сущность детализацию собирает.
Как этот механизм выглядит, когда для управленческих инструментов требуется разнообразными способами агрегировать информацию по тысячам сущностей, в реальном времени по актуальным данным?

В монолите был бы один хранимый view, который джойнит и агрегирует десяток таблиц, всё внутри одной базы, на злостно оптимизированных фильтрованных индексах, отдавая только результат в несколько сотен КБ.

Здесь же, получается, запрашиваем 100К строк с одного микросервиса, 200К с другого, 15М с третьего, передаём эти гигабайты JSON по сети, парсим у себя, стараясь не упасть по памяти, и джойним вручную на самописных алгоритмах?

ayevdoshenko Jul 30 2021 at 11:11

Как этот механизм выглядит, когда для управленческих инструментов требуется разнообразными способами агрегировать информацию по тысячам сущностей, в реальном времени по актуальным данным?

Это плохо выглядит везде - хоть в какой архитектуре. Запросы в оперативную базу с разлапистыми джойнами - совершенно не сахар и для самой базы данных, и требуют уже специальных решений - типа отдельной базы данных для аналитики с денормализованными данными или хотя бы отдельной реплики базы. И вот когда эта самая реплика/отдельная база появляются... тут над ними легко и создать микросервис поставки данных.

beezy92 Jul 30 2021 at 09:52

Да, это круто, но что ты будешь делать, когда твоё хранилище перестанет влезать на один сервер или в один дата-центр? Тогда ты захочешь распределённое хранилище. Хорошо, если Django умеет поддерживать транзакционный механизм с распределённым хранилищем.

Преждевременная оптимизация - зло. А если такой проблемы в будущем не будет?
Как люди жили до этого? Как решали такие проблемы?
Почему такую проблему должен решать Django. Да, он фреймворк, но он не все силен. Это уже задача/проблема масштабирования Базы Данных.

djarik Jul 30 2021 at 09:58

Участвовал в двух проектах на микросервисах и понял для себя важную вещ. Если можно не использовать микросервисы — не используй микросервисы

slepmog Jul 30 2021 at 11:50

Распределенные транзакции
Поэтому мы используем очереди. Мы списываем у Васи деньги и кладём это сообщение в очередь.

Вот, ещё такой вопрос.

Очередь ведь не часть какого-то микросервиса, она на все микросервисы одна.
Как обеспечивается транзакционная целостность между очередью и кладущим в неё микросервисом?

Если в микросервисе полагается иметь что-то типа

begin tran;
списать у Васи;
положить в очередь;
commit tran;

то возможна ситуация, когда в очередь на присвоение Пете-то ушло, а у Васи не списалось, потому что транзакция не смогла закомиттиться.

А если полагается иметь

begin tran;
списать у Васи;
commit tran;
положить в очередь;

тогда возможна ситуация, когда у Васи-то списалось, а в очередь на присвоение Пете не ушло, потому что клалка в очередь не сработала.

Мне приходит в голову только взять пример 2, обернуть положить в очередь; в try, и сделать вернуть Васе;, если catch — но и здесь остаются вопросы вида "А если не удалось вернуть Васе?".

mayorovp Jul 30 2021 at 12:54

Тут два варианта. Вариант первый — всё та же распределённая транзакция.

Вариант второй — идемпотентные операции:

(локальная транзакция) списать у Васи, отметить присвоение Пете как начатое
(пока присвоение начато) положить информацию в очередь
(когда придёт ответ) отметить присвоение как законченное

alex-khv Aug 8 2021 at 11:39

А как ограничивать по нижней границе баланса для всех не завершенных операций ?

К примеру. В очереди на списание стоит 10 операций каждая по -10, но суммарно -100. А на балансе всего +30. Ведь имеется race condition между GetBalance и списанием.

mayorovp Aug 8 2021 at 11:46

Так же, как и без микросервисов делаете — проверять баланс в одной транзакции со списанием и одной операцией.

alex-khv Aug 8 2021 at 11:56

Разве оверхед на простой транзикционный механизм между микросервисами не создаёт эффект бутылочного горлышка ?

Количество открытых портов, память на каждое соединение, задержки сетевого хранилища когда там начинает работать сборщик мусора или дедупликация. Дополнительная синхронизация между несколькими инстансами в разных подах. И т.д.

-1

mayorovp Aug 8 2021 at 12:23

Откуда у вас взялось "между микросервисами"? Почему вы вообще рассматриваете ситуацию, когда получение баланса и списание с него же реализуется в разных микросервисах?

alex-khv Aug 8 2021 at 12:23

Баланс это лишь пример

mayorovp Aug 8 2021 at 18:47

Ну так ответ в общем случае я уже давал — бить сложную операцию на части, так чтобы каждая часть происходила в транзакции.

А как это делать конкретно в каждом случае — вопрос конкретных случаев.

alex-khv Aug 9 2021 at 09:54

Мой вопрос был не про принцип. А про решение проблем, с которыми сталкиваются когда реализуют транзикционный механизм в микросервисной архитектуре.

mayorovp Aug 9 2021 at 11:56

Я не понимаю что вы от меня сейчас хотите услышать.

alex-khv Aug 9 2021 at 11:57

От вас, ничего

Это вопрос всем

-1

mayorovp Aug 9 2021 at 11:59

Хорошо, поправим формулировку:

Я не понимаю что вы сейчас хотите услышать.

Vilaine Aug 8 2021 at 18:23

Разве оверхед на простой транзикционный механизм между микросервисами не создаёт эффект бутылочного горлышка ?

У вас же в требованиях заложено это бутылочное горлышко, по факту. Можно сделать шардирование там какое-то, максимум. Ну и локализовывать транзакции исправлением границ между сервисами.

alex-khv Aug 9 2021 at 09:46

Разве я где-то писал требования ?

-1

Vilaine Aug 9 2021 at 21:17

Конечно, вот:

В очереди на списание стоит 10 операций каждая по -10, но суммарно -100. А на балансе всего +30. Ведь имеется race condition между GetBalance и списанием.

Правда, мне пришлось додумать возможную проблему с этим: нарушенные границы BC, довольно типичная беда, плюс BC разнесены по сети, как это делается с микросервисами. А то без этого по одному лишь ТЗ и вправду нет проблем.

Vilaine Aug 1 2021 at 00:52

Если у вас нет message bus или queue и прочих характерных для микросервисов инструментов, то наверняка у вас монолит.

У монолита может быть несколько интерфейсов — CLI, API, Web, воркеры. Монолит может скейлиться сколь угодно, независимо скейлить каждый интерфейс.

Монолит — это
1) Единый для приложения деплой. Основная проблема, которая возникает при росте команды. Может решаться выделением сервисов или библиотек.
2) Синхронность коммуникаций между составляющими его компонентами (если т.н. «микросервисы» общаются через синхронный HTTP, то есть имеют temporal coupling, то это просто distributed monolith, не имеющий ничего общего с распределёнными вычислениями/concurrent computing). Хотя асинхронность тоже легко достижима, но используется лишь от случая к случаю.

Индустрия на редкость быстро забыла опыт 1980-1990-х, когда после некоторого энтузиазма обнаружились "Fallacies of distributed computing".