Распределённые системы *

Нюансы проектирования распределенных систем

СтатьиПостыНовостиАвторыКомпании

Elpiti 11 апр в 09:13

Видение концепции Цифровой Двойник в терминах «Индустрии 5.0». Агентный планировщик и симулятор

Средний

4 мин

634

Распределённые системы*Научная фантастикаНаучно-популярноеМашинное обучение*Алгоритмы*

Мнение

В данной статье рассматриваются некоторые ключевые термины индустрии 4.0., мнение автора на возможное гармоничное совместное использование понятий имитационная модель, симулятор, агентный планировщик, гибридные модели, а также алгоритмические и человеко-ориентированые (игры симуляторы) инструменты поиска лучших решений.

-3

ivankov_timofei 5 апр в 09:06

Отказоустойчивая распределённая архитектура для UX-аналитики

Средний

18 мин

1.2K

Программирование*Распределённые системы*Анализ и проектирование систем*Аналитика мобильных приложений*

Обзор

UX-аналитика – это сбор и анализ данных о взаимодействии пользователей с интерфейсом (клики, скроллы, навигация и прочие события). Такие события генерируются в огромных количествах, особенно при большой аудитории приложения. Чтобы эффективно обрабатывать эту информацию, необходима распределённая архитектура, способная масштабироваться под высокий поток событий и обеспечивать отказоустойчивость – т.е. работать надёжно даже при сбоях отдельных компонентов. Также важна возможность обработки данных в реальном времени, чтобы как можно быстрее получать метрики и инсайты об опыте пользователей. В этой статье мы рассмотрим ключевые аспекты такой архитектуры: масштабирование UX-событий, надёжный сбор метрик с устройств (в том числе офлайн), реалтайм-аналитику на основе потоковых технологий (Kafka, Flink, Kafka Streams, ClickHouse) и механизмы гарантированной доставки событий (at-least-once, exactly-once, retry, дедупликация). В результате станет понятно, как правильно спроектированная система UX-аналитики позволяет оперативно находить проблемные места UI, проводить A/B тесты и глубже понимать поведение пользователей.

ivankov_timofei 5 апр в 07:36

Выбор индексов в базах данных для highload-систем

Сложный

27 мин

15K

SQL*NoSQL*Проектирование и рефакторинг*Высоконагруженные системы*Распределённые системы*

Обзор

Индексы – это «ускорители» доступа к данным в базах данных. Правильно выбранные индексы могут многократно ускорить запросы, что особенно критично в highload-системах с большими объёмами данных и большим числом запросов. Однако за ускорение чтения приходится платить усложнением записи и дополнительным расходом памяти. В этой статье мы подробно рассмотрим, как работают разные типы индексов в реляционных СУБД, как выбирать индекс под конкретный запрос, обсудим подводные камни (например, блоат, переиндексация, избыточные индексы) и затронем индексацию в NoSQL (MongoDB, Cassandra). Завершим чеклистом, который поможет выбрать оптимальный индекс под вашу задачу.

+34

GrishinAlex 2 апр в 09:09

Мультирегиональность в Selectel S3: работаем с регионами SPB и MSK из Python

Простой

6 мин

3.1K

Блог компании SelectelPython*Облачные сервисы*Распределённые системы*Хранение данных*

Обзор

Катастрофоустойчивое хранение данных — одна из актуальных задач при построении IT-инфраструктуры. Но ее решение может завести в тупик. Как оптимальнее организовать хранение данных, исключив домены отказа? Как разместить определенные данные ближе к целевой нагрузке или части аудитории? Как организовать асинхронную репликацию данных между Москвой и Санкт-Петербургом?

Всем привет! Меня зовут Гришин Александр, я продакт-менеджер в Selectel и отвечаю за развитие объектного хранилища и облачных баз данных. Под катом я расскажу, как с помощью мультирегиональности взаимодействовать с разными регионами S3 через Python и библиотеку boto3. Это поможет хранить и обрабатывать данные в Москве и Санкт-Петербурге, используя единую авторизацию и простой интерфейс. К тому же — улучшить катастрофоустойчивость и доступность данных, а еще снизить задержки при работе с объектами, когда инфраструктура распределена между городами.

Читать дальше →

+49

ivankov_timofei 1 апр в 22:36

Лучшие практики создания отказоустойчивых систем

Средний

23 мин

12K

Python*Java*Распределённые системы*Серверная оптимизация*Программирование*

Обзор

Разработка отказоустойчивых систем представляет собой важнейшую компетенцию для инженеров, занятых созданием распределённых и масштабируемых приложений. Под отказоустойчивостью понимается способность системы сохранять работоспособность в условиях сбоев отдельных компонентов или недоступности внешних сервисов. В данной статье рассматриваются практики обеспечения устойчивости на уровне программного кода, в частности в контексте серверных приложений, реализованных на языках Python и Java.

Особое внимание уделяется методам повышения надёжности при временных сбоях, включая: повторные попытки выполнения операций с экспоненциальной задержкой (exponential backoff), использование шаблона circuit breaker, механизмы плавной деградации функциональности (graceful degradation), задание таймаутов, реализация идемпотентности, ограничение одновременных вызовов (bulkhead isolation), а также внедрение систем мониторинга и алертинга. Приводимые примеры охватывают типовые сценарии — обращение к внешним API, взаимодействие с базами данных и выполнение фоновых задач.

+20

ivankov_timofei 29 мар в 11:15

Как правильно выбрать базу данных для разработки: понимание моделей репликации

Средний

38 мин

14K

Распределённые системы*MongoDB*NoSQL*PostgreSQL*SQL*

Из песочницы

Выбор подходящей системы управления базами данных (СУБД) — важнейшая задача при проектировании программных систем. Разработчики и архитекторы учитывают множество факторов: модель данных (реляционная или NoSQL), поддержку транзакций, масштабируемость, требования к согласованности и многого другое. Одним из ключевых архитектурных аспектов, влияющих на эффективность и надежность системы, является модель репликации данных. Репликация означает поддержание копий одних и тех же данных на нескольких узлах (серверах), соединённых по сети.

Зачем это нужно? Репликация позволяет: во-первых, держать данные ближе к пользователям (уменьшая задержку при запросах); во-вторых, продолжать работу системы даже при сбое отдельных узлов (повышая доступность); в-третьих, масштабировать систему, увеличивая число узлов для обслуживания запросов на чтение (повышая пропускную способность).

Однако реализация репликации сопряжена с серьёзными архитектурными компромиссами. Согласно теореме CAP, в распределённой системе невозможно одновременно гарантировать все три свойства: консистентность данных, доступность сервиса и устойчивость к разделению сети. При возникновении сетевых сбоев (разбиении на изолированные сегменты) системе приходится жертвовать либо мгновенной согласованностью данных, либо доступностью части узлов. Поэтому разные СУБД делают разные выборы в этих компромиссах. Архитектурная модель репликации, лежащая в основе СУБД, определяет, как база данных достигает (или не достигает) консистентности, доступности и отказоустойчивости. Понимание этих различий крайне важно для архитекторов и разработчиков: зная поведение репликации, вы сможете выбрать такую СУБД, которая лучше соответствует требованиям вашего проекта по масштабу, геораспределенности, допустимой задержке и устойчивости к сбоям.

ph_piter 28 мар в 11:58

Каждый бэкенд-инженер должен знать, как обрабатывать платежи. Краткое руководство по повторным попыткам платежа

4 мин

37K

Блог компании Издательский дом «Питер»Финансы в ITРаспределённые системы*Платежные системы*

Перевод

Любая система, работающая с платежами, должна быть надежной и отказоустойчивой.

Сбои при оплате возможны — это может быть проблема с сетью, временный сбой банка или просроченная карта. Грамотная стратегия повторных попыток помогает корректно обрабатывать такие ошибки, избегая дублирования списаний.

Сейчас покажу, как это сделать.

Читать дальше →

+47

ph_piter 27 мар в 12:13

Обмен сообщениями в режиме реального времени: опыт Slack

6 мин

Блог компании Издательский дом «Питер»Серверная оптимизация*Распределённые системы*Программирование*Мессенджеры*

Перевод

А вы знали, что земные станции передают сигнал спутникам, расположенным на геостационарной орбите на высоте 35 786 метров над экватором, и что ответные сигналы накрывают целое полушарие? Сегодня спутниковые радиостанции обслуживают сотни каналов. Если вы только не работаете на секретном военном объекте или глубоко под землёй, то спутниковый радиосигнал к вашим услугам найдётся практически везде.

Платформа Slack подобна спутникам в том, что на ней ежедневно рассылаются миллионы сообщений по миллионам каналов — всё это в режиме реального времени. Если рассмотреть трафик типичного рабочего дня, оказывается, что большинство пользователей остаются онлайн с 9.00 по 17.00 по местному времени, причём, пиковые нагрузки приходятся на период с 11.00 до 14.00, с небольшим спадом в районе обеденного перерыва. Хотя, в разных регионах рабочее время распределено примерно схоже, на следующем графике наблюдаются два пика. Очевидно, что «час пик» совпадает не везде. В некоторых регионах он приходится на послеполуденные часы, в других наступает до полудня. Цветные линии на следующей диаграмме обозначают разные регионы.

Читать дальше →

razon 26 мар в 21:05

Принцип каскадного снижения связанности

9 мин

6.9K

Распределённые системы*Микросервисы*DevOps*Проектирование и рефакторинг*Качество кода*

✏️ Технотекст 7

Часто ли вы слышите о новом принципе проектирования IT-архитектуры? А об обновлении классических принципов? Попробую вас удивить и привнести что-то новое. 😎

У вас никогда не вызывало недоумения, что связанность и прочность (или связность) — это про примерно одно и то же (и то, и другое — это некая связь), но одно — хорошо, а другое — почему-то плохо? 🙂
Но давайте по порядку.

+20

avovana7 23 мар в 12:54

System Design для начинающих: всё, что вам нужно. Часть 4

Простой

12 мин

17K

Микросервисы*Распределённые системы*Анализ и проектирование систем*

Туториал

Перевод

Продолжаем наращивать базу знаний по System Design. В этот раз освятим использование BLOB Storage, CDN, Message Broker. Посмотрим на основные концепции и области применения этих важных компонентов при проектирование высокодоступных отказоустойчивых систем.

vstorozhilov 17 мар в 20:40

Три необсуждаемых вопроса о микросервисах и параллельной распределённой обработке данных — чтобы жить стало легче

Средний

12 мин

2.5K

Data Engineering*Распределённые системы*Big Data*Hadoop*Микросервисы*

Туториал

Воркшоп для тех, кто впервые сталкивается с распределёнными системами.

В этой статье на примере решения несложного архитектурного кейса я покажу, что ответов только на 3 вопроса при проектировании систем распределённой параллельной обработки данных будет достаточно для обеспечения жёстких нефункциональных требований.

skonik_dev 13 мар в 06:07

Как сделать livenessProbe для Kafka-консьюмеров и перестать перезапускать их вручную

Средний

6 мин

1.6K

Блог компании СамолетPython*Распределённые системы*Микросервисы*

Туториал

Kafka-консьюмеры не всегда работают так стабильно, как хотелось бы. Иногда они просто зависают — без ошибок, без падений, но и без обработки сообщений. LivenessProbe в Kubernetes помогает автоматически перезапускать зависшие сервисы, но с Kafka-консьюмерами всё не так просто: стандартного решения для них нет. В этой статье разберём, как правильно реализовать livenessProbe для консьюмеров с помощью паттерна Heartbeat, чтобы не перезапускать их вручную.

+11

avovana7 6 мар в 21:16

Почему Redis работает так быстро, несмотря на то, что он однопоточный?

Простой

7 мин

29K

Микросервисы*Распределённые системы*Анализ и проектирование систем*NoSQL*Хранение данных*

Обзор

Перевод

Redis — это высокопроизводительное хранилище «ключ-значение» в оперативной памяти, известное своей невероятной скоростью. Фактически, один сервер Redis может обрабатывать до 100 000 запросов в секунду (QPS). Такая скорость часто удивляет, особенно если учесть, что Redis в основном работает по однопоточной модели обработки запросов. Так почему же Redis работает так быстро, несмотря на однопоточный подход? Давайте рассмотрим ключевые факторы, влияющие на производительность Redis.

+14

polyakovin 5 мар в 13:13

Конспект по архитектуре ПО и System Design

Средний

1 мин

37K

UML Design*Анализ и проектирование систем*ИнфографикаМикросервисы*Распределённые системы*

Из песочницы

Это компиляция основных знаний по проектированию архитектуры ПО, которые мне удалось собрать. Конспект доступен по ссылке на Miro-доску.

Можно сказать, что это взгляд на System Design с точки зрения фронтенд-разработчика, который пытается разобраться в теме.

Читать статью целиком

+20

mfedyaev 4 мар в 14:07

Микросервисы в МТС: когда масштаб имеет значение

9 мин

3.9K

Блог компании МТСРаспределённые системы*Анализ и проектирование систем*Kubernetes*Микросервисы*

Привет, Хабр! Меня зовут Михаил Федяев, я работаю архитектором в департаменте управления технологиями МТС Диджитал. В нашей экосистеме порядка 500 разных продуктов — для их развития у всех команд должны быть общие правила принятия решений. Они сформулированы в виде 15 технологических принципов. Сегодня я хочу рассказать про один из них — «Микросервисы». Он определяет, как в нашей компании подходят к внедрению микросервисной архитектуры.

+15

programmerguru 4 мар в 09:01

Необычные способы хостинга

Средний

7 мин

28K

Блог компании RUVDS.comDIY или Сделай самРаспределённые системы*СмартфоныХостинг

Обзор

Где разместить сайт? Оказывается, для хостинга необязательно покупать VPS или домашний сервер. Можно поступить более креативно: например, захостить сайт на смартфоне. Причём желательно извлечь из него аккумулятор, чтобы смартфон работал напрямую от сети. А есть ещё более оригинальный вариант: бесплатный хостинг в социальных сетях.

Читать дальше →

+77

mo0Oonnn 2 мар в 15:46

Web 3 как замена Web 2 в стандартных задачах и есть ли в этом смысл

3 мин

2.7K

Децентрализованные сети*Распределённые системы*IPFS*Веб-разработка*

Туториал

В этой статье я не буду говорить про NFT, про Ethereum и т.п. Я сосредоточусь на возможности и смысле перенести все доступное нам сейчас с Web 2 на Web 3.

alexey_melezhik 28 фев в 13:27

Конфигурирование кластерных систем с помощью Sparky и Rakulang

Средний

8 мин

425

DevOps*Программирование*Распределённые системы*

Обзор

В общем случае конфигуриоование распределенных и кластерных систем - задача непростая. Для кого может быть полезным инструмент Sparky? Если у вас не используется кубернетес и вам приходится конфигурить / обновлять распределенную инфраструктуры со сложными взаимосвязями. Здесь я покажу несколько примеров не претендующих на исчерпывающее покрытие данной темы

Базовая конфигурация

Для того что бы все работало необходимо установить Sparky агенты на все настаиваемые ноды вашего кластера и обеспечить сетевую связанность на уровне http/https.

avovana7 23 фев в 16:37

System Design для начинающих: всё, что вам нужно. Часть 3

Простой

10 мин

23K

Микросервисы*Распределённые системы*Анализ и проектирование систем*

Туториал

Перевод

Вам не нужно изучать какую‑либо теорию, кроме этой статьи, чтобы начать собеседоваться. После прочтения смело приступайте к решению типовых System Design задач.

Изучая System Design, вы часто видите только теоретические материалы. В этой статье я постарался показать в том числе практическую реализацию многих вещей, чтобы вы не просто готовились к собеседованиям, но и знали, как эти вещи используются в реальном мире.

phillennium 21 фев в 09:15

Web3 для JavaScript-разработчиков на примере Solana

26 мин

6.3K

Блог компании JUG Ru GroupJavaScript*КриптовалютыРаспределённые системы*Конференции

Рассказать надёжный способ заработать на криптовалютах? Устраиваетесь в блокчейн-проект разработчиком, пишете код, получаете зарплату. Готово, вы стали богаче, пока другие прогорали на бирже!

Шутки шутками, но мир web3 разросся в индустрию со своими вакансиями. И в ней востребован JavaScript, причём не только на фронтенде. Так что у JS-разработчиков появился смысл обращать внимание на этот сегмент, а на нашей конференции HolyJS появились доклады об этом.

И для Хабра мы решили перевести в текстовый вид выступление Александра Казакова @AlexandrKazakov, помогающее влиться в тему. В этом докладе рассматривается блокчейн Solana, но после него проще будет разбираться и с другими вроде Ethereum или TON. Если вам удобнее видео, прилагаем ссылки: YouTube, VK Видео. Далее — текст от лица спикера.

+21

1 2

4 5 ...

36 37

Распределённые системы *

Видение концепции Цифровой Двойник в терминах «Индустрии 5.0». Агентный планировщик и симулятор

Отказоустойчивая распределённая архитектура для UX-аналитики

Выбор индексов в базах данных для highload-систем

Мультирегиональность в Selectel S3: работаем с регионами SPB и MSK из Python

Лучшие практики создания отказоустойчивых систем

Как правильно выбрать базу данных для разработки: понимание моделей репликации

Каждый бэкенд-инженер должен знать, как обрабатывать платежи. Краткое руководство по повторным попыткам платежа

Обмен сообщениями в режиме реального времени: опыт Slack

Принцип каскадного снижения связанности

System Design для начинающих: всё, что вам нужно. Часть 4

Три необсуждаемых вопроса о микросервисах и параллельной распределённой обработке данных — чтобы жить стало легче

Как сделать livenessProbe для Kafka-консьюмеров и перестать перезапускать их вручную

Почему Redis работает так быстро, несмотря на то, что он однопоточный?

Ближайшие события

Конспект по архитектуре ПО и System Design

Микросервисы в МТС: когда масштаб имеет значение

Необычные способы хостинга

Web 3 как замена Web 2 в стандартных задачах и есть ли в этом смысл

Конфигурирование кластерных систем с помощью Sparky и Rakulang

System Design для начинающих: всё, что вам нужно. Часть 3

Web3 для JavaScript-разработчиков на примере Solana

Вклад авторов