Распределённые системы *

Нюансы проектирования распределенных систем

СтатьиПостыНовостиАвторыКомпании

systemarch 25 авг 2023 в 09:04

LogDoc: логи здорового человека

Средний

6 мин

6.2K

Хранение данных * Распределённые системы *

Привет, Хабр

Однажды команда LogDoc, которая тогда ещё была просто дружеской компанией суровых разработчиков, после бурного обсуждения очередного напряжённого рабочего дня вынесла однозначный вердикт — в мире нет и не предвидится нормального, человеческого продукта для работы в распределённой среде с логами, трейсами, сигналами и прочим подобным. Нас это опечалило (по очевидным причинам) и воодушевило — мы увидели возможность создать полезный продукт. Подумали, собрались с духом и выложились полностью в попытке реализовать задуманное. Именно результат наших усилий мы представляем вам в этой вводной статье.

Sivchenko_translate 19 авг 2023 в 10:34

Простые радости вертикального масштабирования

13 мин

4.4K

Программирование * Алгоритмы * Big Data * Распределённые системы *

Перевод

В последние 20 лет архитекторы программных и аппаратных систем перепробовали различные стратегии, которые позволили бы решать проблемы, связанные с большими данными. Пока программисты усердно переписывали код, приспосабливая его для горизонтального масштабирования на множество машин, железячники впихивали на каждый чип всё больше и больше транзисторов и ядер, чтобы увеличить объём работы, осуществимый на каждой машине.

Как подтвердит любой, кому когда-либо доводилось проходить собеседование по программированию, при наличии арифметической и геометрической прогрессии геометрическая всегда возобладает. При горизонтальном масштабировании расходы растут линейно (арифметически). Но по закону Мура вычислительные мощности со временем растут экспоненциально (геометрически). Это означает, что можно несколько лет ничего не делать, а затем масштабировать систему вертикально и получать улучшение на порядки. За двадцать лет плотность транзисторов возросла в 1000 раз. Это значит, что такая задача, для решения которой в 2002 году потребовались бы тысячи машин, сегодня выполнима всего на одной.

+11

neshkeev 15 авг 2023 в 03:06

Обработка больших и очень больших графов: Pregel

Средний

24 мин

2.4K

Алгоритмы * Apache * Распределённые системы *

Статья является продолжением предыдущей статьи в рамках цикла статей, посвященных обработке больших и очень больших графов. В статье реализованы распределенные версии четырех классических алгоритмов: "Связные компоненты", "Кратчайшее расстояние", "Топологическая сортировка" и PageRank на Apache Spark DataFrame API. Алгоритмы составлены в соответствии с идеями популярного фреймворка распределенной обработки графов Pregel.

zapp 14 авг 2023 в 11:37

Dash Platform: Дата-контракты

7 мин

1.7K

Хранение данных * КриптовалютыРаспределённые системы * Solidity * Венчурные инвестиции

Кейс

Перевод

Дата-контракты - это мощный инструмент, который уже широко используется в сфере сервисов данных Web2 благодаря своим многочисленным преимуществам для пользователей и разработчиков. Они представляют собой относительно простые JSON-схемы, определяющие структуру данных, которые может хранить dapp.

Sivchenko_translate 13 авг 2023 в 20:01

S3 не сразу строилось

18 мин

9.4K

Хранение данных * Распределённые системы * Big Data * Amazon Web Services * Программирование *

Перевод

Привет, Хабр. Вашему вниманию предлагается сокращённый перевод эпичного поста под авторством Энди Уорфилда, вице-президента и заслуженного инженера в компании Amazon, занятого разработкой S3. Пост основан на его пленарном выступлении с конференции USENIX FAST ‘23 и затрагивает три различных аспекта, касающихся выстраивания и эксплуатации такого огромного хранилища данных как S3. Если пост окажется интересным - рассмотрим вариант перевести и вторую часть

+18

IvaYan 11 авг 2023 в 11:00

Распределённое обучение с PyTorch на кластере для тех, кто спешит

Средний

14 мин

7.6K

Машинное обучение * Распределённые системы * Искусственный интеллект

Туториал

Перевод

Глубокие модели становятся всё больше и всё реже помещаются на один компьютер. Это перевод поста в блоге Lambda Labs, компании, специализирующейса на инфраструктуре для глубого обучения. В этом посте нам расскажут как организовать распределенное обучение модели PyTorch на нескольких вычислительных узлах.

В качестве инструмента для запуска задач рассматриваются torchrun и MPI.

neshkeev 10 авг 2023 в 23:07

Обработка больших и очень больших графов

Средний

18 мин

5.1K

Алгоритмы * Распределённые системы *

Однажды ко мне обратилась одна крупная ~~фруктовая~~ телефонная компания с просьбой подготовить для них курс по Apache Spark продвинутого уровня, и в нем обязательно должен быть раздел про обработку графов (Neo4j не предлагать). На тот момент я знал про классические алгоритмы обработки графов на базе DFS (поиск в глубину) и BFS (поиск в ширину). При этом неотъемлемым условием применения того или иного подхода является локальная поддержка стека (DFS) или очереди (BFS). Следовательно, классические алгоритмы можно применять для обработки графов, которые умещаются в память одной машины.

В современном мире данные накапливаются очень быстро, и классические подходы, ориентированные на обработку графов в рамках одной машины, перестают работать, а значит высока потребность в алгоритмах распределенной обработки графов. Интуитивно можно предположить, что необходимо разбивать граф на части, но каким образом и как потом их собирать вместе?

+12

asermilov 10 авг 2023 в 09:30

«Возьмите инициативу на себя»: готовимся к System Design Interview

5 мин

28K

Блог компании AvitoTechАнализ и проектирование систем * Распределённые системы *

Рассказываем, для чего в Авито проводят интервью по System Design, чего от него ожидать и что нужно знать, чтобы его успешно пройти.

+14

ogun 1 авг 2023 в 12:59

Экономика вещей: устройства как экономические агенты. Роль Device Twins

Простой

6 мин

1.1K

Блог компании SIBlinkДецентрализованные сети * Распределённые системы * Интернет вещей

Обзор

Сегодня начинает набирать обороты концепция "экономики вещей" (Economy of Things - EoT). Евангелисты данной ~~конфессии~~ концепции прогнозируют массовый переход подключенных устройств на этот способ взаимодействия и, соответственно, колоссальный рынок.

Давайте посмотрим, что нам готовит новый дивный мир как с точки зрения пользователя (способы использования), так и с точки зрения разработчика (технологический стек). Особое место в этой концепции могут занять Device Twins.

ArchitectSimbirSoft 31 июл 2023 в 09:51

Как генерировать модели интерфейсов на основе спецификации на стороне frontend-приложений

Средний

7 мин

9.2K

Блог компании SimbirSoftРаспределённые системы * TypeScript * Проектирование API * Анализ и проектирование систем *

Обзор

На связи снова Архитектурный комитет компании SimbirSoft, и мы продолжаем наш цикл статей, посвященных Design API First. Ранее мы уже писали о том, что представляет собой этот подход, приводили пример спецификации для сервиса аутентификации и рассказывали, как мы интегрируем этот паттерн в наш конвейер разработки.

Сегодня мы немного отвлечемся от бэкенда и разберем автоматизацию одной из рутинных задач на стороне frontend-разработки. А именно описание моделей интерфейсов для взаимодействия фронта с беком, а также написание API-сервисов, в которых фиксируются endpoints, методы запросов и формат передачи данных (query-параметры, заголовки, тело).

Dasfex 25 июл 2023 в 07:01

Три движка для одной Лавки: как эволюционировала система поиска в сервисе

Средний

12 мин

6.4K

Блог компании ЯндексПоисковые технологии * Программирование * Машинное обучение * Распределённые системы *

Кейс

Лавка — сервис быстрой доставки продуктов. Один из важнейших сценариев использования сервиса для покупателя — это поиск. Примерно 30% товаров добавляются в корзину именно из его результатов. А ещё, если в пользовательской сессии был успешный запрос в поиск, вероятность совершения заказа вырастает на 10–15%. То есть, если клиенту нужен конкретный продукт и он его быстро находит через поиск, вероятность совершения заказа становится выше.

Корректная и качественная организация поиска — нетривиальная задача, поэтому иногда приходится придумывать нестандартные решения, чтобы всё работало как нужно. В этой статье я расскажу историю развития поиска в Лавке от самого начала до текущего момента. Нам пришлось объединить всю силу и мощь целых трёх движков, чтобы пользователи получали точный и актуальный результат. Параллельно погрузимся в различные технические детали, проблемы и прочие нюансы.

Найти товары!

+14

sgjurano 20 июл 2023 в 12:13

Как построить систему, способную выдерживать нагрузку в 5 млн rps

Средний

12 мин

58K

Блог компании Ozon TechВысоконагруженные системы * IT-инфраструктура * Go * Распределённые системы *

Кейс

✏️ Технотекст 2023

Всем привет!

Меня зовут Владимир Олохтонов, я руковожу командой разработки в отделе Message Bus, который является частью платформы Ozon. Мы занимаемся разработкой самых разных систем вокруг Kafka, etcd и Vault. В этой статье я расскажу о том, как мы строили линейно масштабируемую gRPC-прокси перед Kafka, способную обслуживать миллионы запросов в секунду, используя Go.

+108

Albert_Wesker 19 июл 2023 в 08:01

Верификация распределённых систем с применением Isabelle/HOL

Сложный

8 мин

1.9K

Блог компании Timeweb CloudАлгоритмы * Распределённые системы *

Обзор

Перевод

Мы ежедневно пользуемся распределёнными системами (в форме интернет-сервисов). Эти системы очень полезны, но и реализовывать их непросто, так как сети непредсказуемы. Всякий раз, когда вы передаёте сообщение по сети, предполагается, что оно прибудет очень быстро, но возможны и достаточно долгие задержки. Может случиться так, что сообщение не прибудет вообще, либо прибудет несколько раз. Когда вы отправляете запрос другому процессу и не получаете отклика, вы понятия не имеете, что произошло: потерялся ли запрос, либо тот другой процесс аварийно завершился, либо сам отклик потерялся? Или же на самом деле ничего не потерялось, сообщение просто задержалось и ещё может прибыть. Невозможно доподлинно узнать, что произошло, поскольку ненадёжный обмен сообщениями – единственный способ межпроцессной коммуникации.

Читать дальше →

+12

alexandergolovnya 12 июл 2023 в 19:23

Потоковая обработка данных с помощью Kafka Streams: архитектура и ключевые концепции

Средний

23 мин

46K

Data Engineering * Распределённые системы * Apache * Java * Программирование *

Из песочницы

При реализации потоковой обработки и анализа данных может возникнуть необходимость агрегирования записей для объединения нескольких независимых поток данных или обогащения какой-либо модели данных. Для этой цели может использоваться Kafka Streams, которая позволяет выполнять обработку данных в режиме реального времени.

В этой статье мы рассмотрим основные компоненты Kafka Streams и теоретические аспекты их использования. Мы будем использовать последние версии технологий, доступных на сегодня: Kafka 3.4.0 и Java 17 в качестве языка программированию. Для снижения входного порога мы будем использовать только нативные возможности Kafka и Kafka Streams, и не будем рассматривать решения с использованием различных фреймворков вроде Spring.

+13

CUSTIS 11 июл 2023 в 08:25

Изнанка архитектуры, или Менять нельзя оставить

Средний

16 мин

5.1K

Блог компании CUSTISАнализ и проектирование систем * Распределённые системы * Микросервисы *

Кейс

Около десяти лет назад мы в CUSTIS реализовали систему распределения товара для «Спортмастера». Со времени ее запуска изменилось многое: корректировались цели заказчика, менялись возможности и потребности рынка, появились новые способы автоматизации. Но на протяжении всех этих лет система дорабатывалась, поддерживалась и настраивалась нами, чтобы оставаться максимально удобной и эффективной для заказчика.

В этой статье мы расскажем о себе, заказчике, системе и требуемых доработках. И о том, почему мы выбрали именно тот подход к проектированию архитектуры, который применили. И почему наше решение было оптимальным.

Читать далее →

koreandr94 10 июл 2023 в 14:05

System Design для самых маленьких. Reference к интервью

Простой

5 мин

26K

Анализ и проектирование систем * Распределённые системы *

Туториал

Из песочницы

Эта статья-инструкция по построению высоконагруженных распределенных систем. Описанный подход может быть полезен как reference при подготовке к интервью по system design в FAANG и не только.

+15

ph_piter 7 июл 2023 в 12:25

Балансировка нагрузки: простыми словами о всей мощи двух случайных вариантов

7 мин

7.1K

Блог компании Издательский дом «Питер»Серверная оптимизация * Распределённые системы * Программирование * Алгоритмы *

Перевод

В мире динамического выделения ресурсов и балансировки нагрузки есть много интересных алгоритмов, но один из самых известных и занимательных – так называемый «метод двух случайных выборов». Он привносит очень простое изменение в процедуру случайного выделения ресурсов, а качество результатов от этого улучшается экспоненциально. Мне посчастливилось реализовать именно эту технику в гигантском масштабе, чтобы оптимизировать использование ресурсов в AWS Lambda, но мне всё равно долго не удавалось «прочувствовать» этот метод интуитивно. В этом посте хочу познакомить вас с той метафорической картиной этого алгоритма, которую я для себя составил, и которая очень удобна для понимания других продвинутых техник в этой области.

Читать дальше →

+18

ArchitectSimbirSoft 5 июл 2023 в 10:00

Интеграция паттерна Design API First в конвейер разработки ПО: наш опыт

Средний

7 мин

2.2K

Блог компании SimbirSoftАнализ и проектирование систем * Проектирование API * Распределённые системы * Микросервисы *

Обзор

Всем привет! Продолжаем наш цикл статей о внедрении подхода Design API First на проектах нашей компании. Ранее мы рассмотрели использование этого подхода, описали плюсы и минусы, узнали, как на практике выглядит проектирование API на примере сервиса аутентификации. Сегодня расскажем о том, как мы встраиваем Design API First в наш конвейер разработки, подробно остановимся на инструментах, помогающих с технической точки зрения организовать этот процесс. Объясним, как реагировать на изменения требований и обеспечивать версионность, а также что использовать для мокирования данных. Рассмотрим различные варианты применения: для нового проекта, для существующего проекта (где изначально был Code First).

4 часть: Как генерировать модели интерфейсов на основе спецификации на стороне frontend-приложений

5 часть: Design API First. Кодогенерация Roslyn

MaxRokatansky 4 июл 2023 в 14:03

Гарантии доставки и этика телепортации

7 мин

3.4K

Блог компании OTUSРаспределённые системы *

Перевод

Распределенным системам приходится решать вопрос о том, какие именно гарантии доставки поддерживать. У нас есть различные варианты, начиная от отсутствия гарантии и заканчивая гарантией exactly once (точно один раз). В зависимости от того, какой вариант мы выберем, это может повлиять на качество наших потоков данных. В этой статье мы рассмотрим различные гарантии доставки на примере телепортации.

"Корабль Тесея" — это мысленный эксперимент, в котором ставится вопрос: Если заменить все части корабля новыми компонентами, останется ли он тем же самым судном?

Этот вопрос часто возникает, когда люди обсуждают идею телепортации в научной фантастике. Однако, давайте уточним. Мы не говорим о телепортации, которая пробивает дыру в пространстве и времени, позволяя человеку просто шагнуть через нее. Вместо этого мы обсуждаем телепортацию, при которой человек дематериализуется атом за атомом, а затем вновь материализуется в новом месте.

+15

alexander_polivanov 27 июн 2023 в 06:59

Tarantool: «серебряная пуля» для построения микросервисной архитектуры VK Teams

8 мин

14K

Блог компании VKРаспределённые системы * Высоконагруженные системы * Базы данных * Tarantool *

Основной многих проектов являются кастомные решения и инструменты — часто кажется, что так проще и быстрее. Но на практике при динамичном масштабировании проектов наличие крупных кастомных узлов начинает создавать трудности: требуется больше времени, ресурсов и дополнительных издержек. Поэтому с ростом проектов командам нередко разумнее пересматривать стек в пользу готовых решений.

Читать дальше →

+35

1 2 ...

11 12

14 15 ...

37 38

Распределённые системы *

LogDoc: логи здорового человека

Простые радости вертикального масштабирования

Обработка больших и очень больших графов: Pregel

Dash Platform: Дата-контракты

S3 не сразу строилось

Распределённое обучение с PyTorch на кластере для тех, кто спешит

Обработка больших и очень больших графов

«Возьмите инициативу на себя»: готовимся к System Design Interview

Экономика вещей: устройства как экономические агенты. Роль Device Twins

Как генерировать модели интерфейсов на основе спецификации на стороне frontend-приложений

Три движка для одной Лавки: как эволюционировала система поиска в сервисе

Как построить систему, способную выдерживать нагрузку в 5 млн rps

Верификация распределённых систем с применением Isabelle/HOL

Ближайшие события

Потоковая обработка данных с помощью Kafka Streams: архитектура и ключевые концепции

Изнанка архитектуры, или Менять нельзя оставить

System Design для самых маленьких. Reference к интервью

Балансировка нагрузки: простыми словами о всей мощи двух случайных вариантов

Интеграция паттерна Design API First в конвейер разработки ПО: наш опыт

Гарантии доставки и этика телепортации

Tarantool: «серебряная пуля» для построения микросервисной архитектуры VK Teams

Вклад авторов