Все потоки

Высоконагруженные системы *

Методы получения высокой производительности систем

СтатьиПостыНовостиАвторыКомпании

SiYa_renko 25 окт в 09:21

Паттерны микросервисной архитектуры: от собеседования до прода

Средний

13 мин

15K

Блог компании OTUSМикросервисы * Высоконагруженные системы *

Обзор

Возможно, вы слышали о них, возможно, вы применяли их на своих проектах. Микросервисы. В разработке ПО используют различные подходы, технологии и архитектурные паттерны, так вот это — один из таких популярных шаблонов.

В этой статье рассмотрим, что это за понятие, как его применять и как рассказывать о нем на собеседовании так, чтобы покорить собеседующих.

Читать далее

+5

offiziellen 25 окт в 00:00

Вертикальное шардирование базы данных: проблемы, решения, практические рекомендации

Средний

13 мин

4.4K

Анализ и проектирование систем * Высоконагруженные системы * Программирование * Серверная оптимизация * Базы данных *

База данных — это сердце системы. И в какой-то момент это сердце начинает давать сбои. Не от объема данных, а от их разнородности. Таблица users разрастается до 200 колонок. Одни нужны для логина каждую секунду, другие — для годового отчета раз в год. В итоге, чтобы прочитать два "горячих" поля, база тащит с диска целый блок с "холодными" данными. Это неэффективно.

Читать далее

+7

olegbunin 24 окт в 09:00

ML в продакшене: почему аналитикам и бэкенду сложно договориться

12 мин

4.6K

Блог компании Конференции Олега Бунина (Онтико)Высоконагруженные системы * Управление продуктом * Go *

Самый дешёвый билет далеко не всегда лучший для пользователя. Люди готовы доплатить за удобное время вылета, нормальный аэропорт или отсутствие ночной пересадки. Но если выдачу сортировать только по цене, оптимальные варианты оказываются глубоко внизу — и часть пользователей просто уходит к конкурентам.

Чтобы закрыть эту проблему, в Авиасейлс решили внедрить ML-скоринг и ранжировать билеты по вероятности покупки. На практике задача оказалась гораздо сложнее: разные источники данных у аналитиков и бэкенда, training-inference skew, провалы в нефункциональных требованиях и неожиданный рост latency.

Читать далее

+2

MaxRokatansky 24 окт в 08:03

Разбор системы: Доставка котировок

Средний

14 мин

970

Блог компании OTUSВысоконагруженные системы * Распределённые системы * Проектирование API *

Привет, Хабр. В этой статье рассмотрим один из типов систем: доставка котировок от биржи до клиента. Здесь акцент на отказоустойчивость и скорость доставки данных. Будем двигаться поэтапно: от сбора требований и базовой конструкции до нюансов работы с данными.

Читать далее

+4

mieh 24 окт в 07:36

Spark, DataSphere и немного магии: как мы строим аналитическую платформу в облаке для банка

7 мин

372

Блог компании Yandex Cloud & Yandex InfrastructureХранение данных * Высоконагруженные системы * Распределённые системы * Apache *

Кейс

Для решения классических аналитических задач в банке дата‑специалисты обрабатывают миллиарды транзакций. Поэтому создание единого информационного пространства для работы с большими объёмами данных потребует решить как задачи оптимизации производительности и обеспечения безопасности, так и задачи удобства для пользователей — и найти баланс между ними.

Сергей Виноградов на конференции Data&ML2Business рассказал про разработку и построение DWH для задач Яндекс Пэй. В этой статье — дополненный рассказ о том, как устроена аналитическая платформа на базе Greenplum® и ClickHouse®, которую решили строить на базе managed‑сервисов в облаке. А также о том, как жизнь аналитиков облегчает связка Apache Spark™ и Jupyter‑ноутбуков в Yandex DataSphere.

Читать далее

+13

n27051538 23 окт в 12:28

Как использовать виртуальные сетевые карты SR-IOV в ProxMox VE 8

Средний

12 мин

4.7K

Блог компании BercutВиртуализация * Linux * Высоконагруженные системы * Сетевые технологии *

Туториал

Случается, что виртуальной машине необходимо предоставить доступ к RAW сетевой карте с тегированным трафиком, не разделяя его на VLAN на уровне гипервизора. Например, такое требование есть у OPNsense(firewall и routing) и у контроллеров для отечественной виртуализации Basis Dynamix.

Расскажу, как сделать такой доступ.

Читать далее

+22

EvgenyVilkov 23 окт в 12:04

Тестирование движков массивно-параллельных вычислений: StarRocks, Trino, Spark. Spark – с DataFusion Comet и Impala

7 мин

1.5K

Блог компании Data SapienceData Engineering * Big Data * Базы данных * Высоконагруженные системы *

Мнение

В сегодняшней, уже третьей по счету, публикации я продолжу делится результатами нагрузочных испытаний вычислительных технологий массивных параллельных вычислений (на Habr уже представлены мои материалы, посвященные сравнению Impala, Trino и Greenplum, в том числе по методике TPC-DS). В этот раз в список решений добавляется Spark, включая работающий с технологией нативных вычислений DataFusion Comet, и набирающий популярность StarRocks.

Читать далее

+9

Dmitrij-Blinov 23 окт в 09:59

Внедрение маркировки «Честный знак»: этапы и сколько стоит

11 мин

9.3K

Блог компании LogistiXВысоконагруженные системы * Локализация продуктов *

Мы живем в эпоху цифровой трансформации, и такие государственные инициативы, как “Честный знак” становятся не просто инструментами регулирования рынка, но и лакмусовой бумажкой зрелости бизнес-процессов. Внедрение маркировки, призванной бороться с контрафактом и повышать прозрачность цепочек поставок, сегодня обретает статус системного вызова для российских компаний: справится ли операционный и административный блок с таким количеством изменений, и сможет ли минимизировать потери при прохождении этого непростого “квеста”?

Читать далее

+5

eigrad 22 окт в 12:01

Масштабирование кластера Valkey до 1 миллиарда запросов в секунду

Средний

8 мин

1.2K

Базы данных * Высоконагруженные системы * Open source *

Обзор

Перевод

Предстоящий релиз Valkey 9.0 несёт в себе значительные улучшения в отказоустойчивости больших кластеров, позволяя масштабироваться до 2000 узлов и достигать производительности свыше 1 миллиарда запросов в секунду, и всё это с гарантированно ограниченным временем восстановления. В этой статье мы рассмотрим, как работает система кластеризации Valkey, а также архитектурные усовершенствования и тщательное тестирование, которые сделали возможным такой уровень масштабирования.

Читать далее

+8

python_leader 22 окт в 09:20

Kubernetes кластер на миллион узлов. Обзор проекта k8s-1m

Средний

36 мин

890

Go * Программирование * Kubernetes * Open source * Высоконагруженные системы *

Обзор

Перевод

Команда Go for Devs подготовила перевод k8s-1m — кейса о том, как не догадки, а измерения двигают пределы Kubernetes. Ключевые идеи: изоляция QPS по типам ресурсов, смягчение гарантий хранения для эфемерных данных, и шардирование планировщика. Полезно всем, кто проектирует крупные кластеры или хочет работать с ними.

Читать далее

+4

oleg_ar 22 окт в 09:14

Как мы строим сеть RUTUBE

Простой

16 мин

21K

Блог компании RUTUBEСетевые технологии * Сетевое оборудованиеIT-инфраструктура * Высоконагруженные системы *

Когда мы говорим о большом сервисе с десятками миллионов пользователей по всей стране, надёжно и эффективно должен работать каждый уровень: и приложения, и инфраструктура, и сеть. Если в уравнение добавляются петабайты видеоконтента, сеть становится ещё более критичным элементом.

В этой статье на примере эволюции сети RUTUBE разберём: с чего начинать ревизию legacy-сети; какие оптимизации помогут пережить резкий рост нагрузки и выиграть время для масштабного обновления; и наконец, что учесть при проектировании новой современной сети, подходящей для актуальных архитектурных подходов и стека технологий.

Читать далее

+18

kmoseenk 22 окт в 08:05

Архитектура Netflix Tudum: от CQRS с Kafka к CQRS с RAW Hollow

Средний

8 мин

1.3K

Блог компании OTUSМикросервисы * Анализ и проектирование систем * Высоконагруженные системы *

Кейс

Перевод

Tudum.com — фан-портал Netflix с более чем 20 млн MAU, где скорость публикации и персонализации упирается в архитектуру. В статье — путь от «классического» CQRS с Kafka и read-store к узкому месту предпросмотров, а затем — к RAW Hollow: in-memory состоянию с сжатием и read-after-write на требовательных запросах. Разбираем, как отказ от Page Data/KV и I/O на горячем пути упростил контур чтения и дал прирост производительности, какие компромиссы это привнесло и почему такой подход срабатывает для контента, меняющегося не каждую секунду.

Читать далее

+11

inetstar 21 окт в 14:30

Выжимаем из Go скорость до последних наносекунд

Средний

12 мин

17K

Блог компании RUVDS.comGo * Высоконагруженные системы * Программирование * Отладка *

Туториал

Будем оптимизировать программы на Go. Выжимать последние наносекунды, чтобы код приближался по скорости к Си или ассемблерному. Цель - скорость, чтобы процессор был загружен на 100% при высокопроизводительные вычислениях.

Читать далее

+84

akdengi 21 окт в 11:17

Чек-лист: 5 признаков, что вашему бизнесу пора переезжать с облака на выделенный сервер

Средний

11 мин

2.8K

Блог компании HOSTKEYОблачные вычисления * Серверное администрирование * Высоконагруженные системы * IT-инфраструктура *

Аналитика

Мы собрали 5 четких признаков, по которым можно понять: пора переходить на выделенный сервер. Включая реальные тесты облака против bare metal, анализ затрат и кейсы, когда облако превращается из решения в проблему.

Читать далее

+4

alexgreendev 21 окт в 07:05

Шпаргалка по работе с PostgreSQL для бэкенд-разработчиков

Средний

7 мин

18K

Блог компании BegetPostgreSQL * Базы данных * Высоконагруженные системы * SQL *

Роадмэп

Лайфхаки для миграций, оптимизации и избегания граблей

Реальные лайфхаки и проверенные практики по миграциям, оптимизации запросов, управлению индексами и обратной совместимости кода. Узнайте, как:

• Не сломать прод при миграции.
• Избежать N+1 и других проблем SQL-запросов.
• Планировать откаты и работать безопасно на высоконагруженных БД.

Читать далее

+20

Nickmob 20 окт в 13:42

Балансировка и проксирование L4-трафика в Angie

Средний

9 мин

3.3K

Nginx * Настройка Linux * Высоконагруженные системы * *nix *

Туториал

Возможности Angie в качестве веб‑сервера и обратного прокси довольно известны. Но кроме работы на уровне L7 (HTTP), мы можем применять его на L4 (TCP и UDP) в качестве балансировщика и прокси‑сервера. Именно об этой функциональности мы и поговорим в сегодняшней статье.

Читать далее

+22

kmoseenk 20 окт в 11:46

Одна строка — тысячи горутин: как мы поймали утечку памяти в сервисе на Go

Простой

6 мин

3.7K

Блог компании OTUSGo * Программирование * Высоконагруженные системы *

Кейс

Перевод

В этом техническом разборе рассмотрим, как инженеры Harness обнаружили и исправили критическую утечку памяти в Go: переназначение переменной контекста в циклах воркеров порождало невидимые цепочки, мешавшие сборщику мусора освобождать память в тысячах горутин, из-за чего их сервис-делегат CI/CD в итоге потреблял гигабайты памяти.

Читать разбор

+23

kolpakovee 20 окт в 08:17

Кейс из production: Deadlock в асинхронном коде на Java

Средний

4 мин

3.5K

Анализ и проектирование систем * Высоконагруженные системы * Веб-разработка * Тестирование IT-систем * Java *

Из песочницы

Недавно наткнулся на коварную проблему, которая отлично демонстрирует важность правильной конфигурации пула потоков при работе с асинхронным программированием. Эта ситуация может возникнуть в любом проекте, где используются вложенные асинхронные операции, и её последствия могут быть катастрофическими для production-системы.

Читать далее

+10

devozerov 16 окт в 13:52

Бенчмарк lakehouse-движков, часть 1: StarRocks и Doris падают под нагрузкой, Presto аутсайдер, CedrusData быстрее всех

19 мин

3.6K

Блог компании CedrusDataBig Data * Data Engineering * Алгоритмы * Высоконагруженные системы *

В этой статье мы детально рассмотрим поведение аналитических движков при выполнении отдельного TPC-DS запроса на одном узле.

Это глубоко технический текст, в котором мы увидим, как (1) три родственных движка (Impala, StarRocks и Doris) с трудом справляются с конкурентной нагрузкой, (2) разработчики StarRocks и Doris затачивают дефолты своих движков под бенчмарки, (3) Trino реализует эффективный шедулер запросов, но имеет ряд дефектов, ухудшающих производительность, (4) Presto строит хорошие планы запросов, но демонстрирует катастрофически плохую производительность из-за отсутствия буквально одной фичи. Ну а победит, конечно, наш движок CedrusData.

Хочу, чтобы подгорело

+19

codeyield 16 окт в 13:23

Развёртывание боевого кластера Cassandra. Часть 4

Сложный

7 мин

626

Базы данных * DevOps * Big Data * IT-инфраструктура * Высоконагруженные системы *

Кейс

Это продолжение цикла, рассказывающего о практике развёртывания небольшого, но вполне производственного кластера Cassandra. В первой, второй и третьей частях мы продвинулись вперед вот по такому плану:

1. Анализ рабочей нагрузки и требований
2. Разработка схемы данных
3. Настройка хостовых машин
4. Настройка конфигурации Cassandra
5. Настройка топологии кластера
= ВЫ НАХОДИТЕСЬ ЗДЕСЬ =
6. Подключение Prometheus Cassandra Exporter
7. Подключение Prometheus Node Exporter
8. Вывод всех метрик в Grafana
9. Проведение нагрузочного тестирования
10. Дополнительный тюнинг по результатам теста

В этой части мы возьмём простой советский...

Читать далее

0

3

4 5 ...