Все потоки

Администрирование

СтатьиПостыНовостиХабыАвторыКомпании

codeyield 16 окт 2025 в 13:23

Развёртывание боевого кластера Cassandra. Часть 4

Сложный

7 мин

6.1K

Базы данных * DevOps * Big Data * IT-инфраструктура * Высоконагруженные системы *

Кейс

Это продолжение цикла, рассказывающего о практике развёртывания небольшого, но вполне производственного кластера Cassandra. В первой, второй и третьей частях мы продвинулись вперед вот по такому плану:

1. Анализ рабочей нагрузки и требований
2. Разработка схемы данных
3. Настройка хостовых машин
4. Настройка конфигурации Cassandra
5. Настройка топологии кластера
= ВЫ НАХОДИТЕСЬ ЗДЕСЬ =
6. Подключение Prometheus Cassandra Exporter
7. Подключение Prometheus Node Exporter
8. Вывод всех метрик в Grafana
9. Проведение нагрузочного тестирования
10. Дополнительный тюнинг по результатам теста

В этой части мы возьмём простой советский...

Читать далее

0

kmoseenk 16 окт 2025 в 12:22

150 млн чтений/с: как Uber усилил консистентность кэша

Средний

10 мин

6.3K

Блог компании OTUSВысоконагруженные системы * Базы данных * DevOps *

Кейс

Перевод

150 млн чтений в секунду — итог скрупулёзной инженерии кэша. В этом кейсе Uber — как ужесточить консистентность без удушения записи: инвалидация «по пути записи» из слоя запросов, дедупликация по commit-timestamp из БД, сочетание TTL и CDC на бинлогах, плюс измерение «черствости» через Cache Inspector. Разобраны реальные источники stale-данных (лаг CDC, реплики, негативное кэширование) и компромиссы вроде read-your-writes — с практическими схемами, которые масштабируются до сотен миллионов RPS.

Читать кейс

+13

mokoron 16 окт 2025 в 09:00

Эффективный мониторинг облачных решений: первые шаги от метрик к асинхронным задачам

8 мин

4.9K

Блог компании Yandex Cloud & Yandex InfrastructureDevOps * IT-инфраструктура * Системное администрирование * Облачные сервисы *

Без мониторинга инфраструктуры и сервисов любая проблема с приложением становится сюрпризом, причём обычно неприятным, который случается в самый неподходящий момент. С помощью настроенного мониторинга мы можем обнаружить проблемы до того, как пользователи придут и начнут жаловаться.

Меня зовут Юлия Рубцова, я ведущий менеджер продукта Yandex Monitoring. В этой серии статей я и мой коллега Владимир Гордийчук @gordiychuk рассказываем про реальные сценарии использования мониторинга облачных решений. Что вас ждёт: мы покажем, как настроить дашборды, быстро проверить гипотезы при расследовании инцидента, а в конце соберём лучшие практики для настройки мониторинга.

Начнём с базы: что такое мониторинг, для чего он нужен, что такое золотые сигналы, как использовать гистограммы и перцентили. А уже затем рассмотрим сценарии мониторинга асинхронных задач.

См. вторую часть в этой серии: Переходим к очередям и клиент-серверному взаимодействию

Читать далее

+11

lexband 16 окт 2025 в 08:47

Uptrace v2.0: как новый JSON-тип ClickHouse ускорил запросы по трейсам в 10 раз

Простой

8 мин

4.8K

Системное администрирование * DevOps * Микросервисы * Высоконагруженные системы *

Из песочницы

Uptrace v2.0 использует новый JSON-тип ClickHouse для хранения observability-данных. Результат: запросы по трейсам ускорились в 10 раз.

Делюсь практическим опытом внедрения: установка за 5 минут через Docker, настройка data transformations для обработки данных на лету, гибкие retention policies для экономии на хранении.

В статье:

Пошаговая инструкция от установки до production

Примеры кода на Node.js с OpenTelemetry

Кейсы настройки: снижение cardinality URL, парсинг данных, удаление PII

Чеклист для продакшена

Подходит для микросервисных архитектур на 5+ сервисов, где нужна скорость поиска по атрибутам трейсов.

Читать про 10x ускорение

+7

eigrad 15 окт 2025 в 22:23

Terraform Actions: Глубокое погружение

Средний

16 мин

8.6K

DevOps * Amazon Web Services * Системное администрирование * IT-инфраструктура * Облачные сервисы *

Туториал

Перевод

Terraform Actions — это новая концепция, представленная в Terraform 1.14, которая позволяет выполнять операции вне стандартного рабочего процесса CRUD (Create-Read-Update-Delete). Это расширяет возможности Terraform, позволяя взаимодействовать с ресурсами способами, для которых раньше требовались другие инструменты, например Ansible.

Читать далее

+6

oleg-svs 15 окт 2025 в 16:15

Свой прокси DNS сервер для обхода санкций зарубежных сайтов(с использованием VPS)

4 мин

64K

БраузерыDNS * Nginx * Системное администрирование * Linux *

Из песочницы

Безусловно, тема обхода ограничений изнутри страны сейчас актуальна. Но что делать, если нужно открыть сайты, которые заблокировали пул IP-адресов из РФ? Например, было интересно создать аналог DNS‑сервера вроде comss, который открывает доступ к заблокированным AI, игровым серверам и тому подобному, с чем не смогут помочь обходы DPI (Возможно, эксперты напишут замечания в комментариях).

Один из возможных способов, который получилось реализовать у меня, представлен ниже.

Нам понадобится VPS в локации, через которую мы хотим быть видимы для нужных нам сервисов.

Для примера можно вспомнить Twitch, который заблокировал доступ к просмотру стримов в качестве 1080p и 1440p для пользователей из РФ.

Идём на страницу справки по бета‑тестированию качества 2k на Twitch и смотрим регионы, в которых оно доступно.

Читать далее

+52

akardapolov 15 окт 2025 в 12:21

Сравнение Grafana и Dimension-UI на задаче мониторинга истории активных сессий

Средний

9 мин

7.1K

Java * IT-инфраструктура * Системное администрирование * Базы данных * Визуализация данных *

Обзор

Недавно рассказывал про мониторинг истории активных сессий в базах данных Oracle, PostgreSQL, ClickHouse и MS SQL Server с использованием desktop-приложения Dimension-UI (link). В комментариях @KPSB92 задал вопрос о преимуществах/отличиях связки exporter Prometheus/Grafana и Dimension-UI, решил оформить ответ в эту небольшую статью.

Итак, возьмем для примера просмотр данных активных сессий в базе данных PostgreSQL и сравним визуализацию в Grafana и Dimension-UI. Посмотрим работу с интерфейсами обоих систем в динамике с помощью скринкастов.

Читать далее (трафик 21 Мб)

+5

QuasarFoks 15 окт 2025 в 12:15

QuasarLinux: когда хочется свободы и удобства

Средний

5 мин

8.3K

Системное программирование * DevOps * Настройка Linux * Open source * Linux *

Из песочницы

OpenRC + AUR + Wine с DXVK/VKD3D + модульный TUI-установщик. Всё это — QuasarLinux, основанный на Artix, но независимый от него.

Читать далее

+2

maxkrok 15 окт 2025 в 11:24

Умный родительский контроль на MikroTik: Как разрешать доступ в интернет с вашего телефона

Простой

4 мин

6.6K

Системное администрирование *

Из песочницы

Стандартные методы родительского контроля часто бывают неудобными: либо вы блокируете всё, кроме пары сайтов, либо тратите кучу времени на ручное ведение "белых списков". Этот метод предлагает элегантное и гибкое решение.

Идея проста: по умолчанию интернет на устройстве ребенка полностью заблокирован. Но как только вы заходите на какой-либо сайт или используете приложение на своем "контрольном" телефоне, его адрес автоматически добавляется в "белый список", и ребенок тут же получает к нему доступ. Вы управляете доступом, просто пользуясь своим телефоном.

Читать далее

0

aaskerkakhramanov 15 окт 2025 в 08:29

Kubernetes 1.29.15 и GPU: как починить пропавшие видеокарты и настроить Time-Slicing

Средний

7 мин

15K

Блог компании СитидрайвDevOps * Kubernetes * Облачные сервисы * Системное администрирование *

Туториал

В Ситидрайве Kubernetes обновляют регулярно — инфраструктура большая, и актуальность версий критически важна. После апгрейда до версии 1.29.15 один из GPU-узлов внезапно «забыл» о своей видеокарте, и нам пришлось срочно искать решение. В этой статье я расскажу, в чём была причина бага и как Time-Slicing помог повысить утилизацию GPU. Статья будет полезна всем, кто работает с GPU в Kubernetes и хочет избежать подобных сюрпризов в продакшене.

Читать далее

+6

Capacitor 15 окт 2025 в 06:01

Как мы ускорили ввод новых узлов до 40 секунд: надёжная работа на spot-инстансах в Kubernetes с Karpenter

Простой

7 мин

7.5K

Блог компании ФлантDevOps * Облачные сервисы * Kubernetes * Open source *

Кейс

В нашей практике DevOps мы столкнулись с задачей оптимизации Kubernetes-кластера в AWS, включая перевод нагрузки на ARM64-инстансы с процессорами Graviton и эффективное использование spot-инстансов. Благодаря Amazon EKS и Karpenter нам удалось ускорить ввод новых узлов до всего 40 секунд и успевать переносить нагрузку при отборе узлов со стороны AWS. При этом мы сохранили привычный набор инструментов Deckhouse для мониторинга и управления — статья подробно рассказывает о нашем опыте и решениях.

Читать далее

+16

eternaladm 14 окт 2025 в 13:30

Система персональных шпаргалок прямо в терминале

Простой

5 мин

13K

Серверное администрирование * Системное администрирование * Linux *

Туториал

Привет, Хабр! Часто ли Вы сталкиваетесь с необходимостью искать в закладках/заметках "ту самую" важную, но редко необходимую команду? git log, который Вы не использовали полгода или спасительный docker compose с десятком флагов. Нередко подобный поиск превращается в пятиминутный квест.

В статье напишем функцию cheat, которая дополнит терминал личной "базой знаний" с Вашим личным перечнем команд. Вводим cheat docker - получаем проверенный список команд мгновенно, без поиска в браузере и чтения мануалов.

Читать далее

+36

SrvTrantor 14 окт 2025 в 13:01

Какой была бы Всемирная паутина, если бы вместо WWW был Gopher

Простой

7 мин

38K

Блог компании RUVDS.comИстория ITНаучно-популярноеСистемное администрирование * Сетевые технологии *

Мнение

В начале 90-х Всемирная паутина (World Wide Web) вовсе не была единоличным хозяином сети. У неё был серьезный конкурент — протокол Gopher. Как изменилась бы наша цифровая реальность, если бы в конечном счёте он не утратил популярность? В статье расскажу, что такое Gopher, почему он уступил WWW, и каким мог бы стать современный интернет, если бы он развивался на базе этого протокола.

+106

aymericzip 14 окт 2025 в 12:32

Я мигрировал свой монорепозиторий на Bun — вот мой честный отзыв

2 мин

12K

JavaScript * Node.JS *

Недавно я перенёс Intlayer (решение для i18n) — монорепозиторий, состоящий из нескольких приложений (Next.js, Vite, React, design-system и т. д.) — с pnpm на Bun.

Кратко (TL;DR): если бы я знал заранее, я бы, вероятно, не делал этого.
Я думал, что это займёт пару часов. В итоге ушло около 20 часов.

Меня привлекло обещание «всё в одном» и впечатляющие показатели производительности.
Я попробовал, я собрал — всё билдилось молниеносно, круто.
Затем я сделал коммит… и столкнулся с первой проблемой.

Читать далее

+10

vasiliy_tyukin 14 окт 2025 в 08:14

Ubuntu в Windows Subsystem for Linux (WSL)

Простой

7 мин

16K

Настройка Linux * Виртуализация * IT-инфраструктура * Linux * Windows *

Туториал

Из песочницы

Если в качестве основной (или единственной) операционной системы используется Windows, самым быстрым и удобным способом начать пользоваться Ubuntu является использование встроенного ядра Linux прямо внутри Windows.
Эта функция, доступная в составе Windows, позволяет обойтись без гипервизора виртуальных машин и без настройки мультизагрузки (dual-boot, multi-boot). Ядро Linux запускается в лёгкой служебной виртуальной среде, основанной на компонентах Hyper-V, что обеспечивает минимальные накладные расходы и высокую производительность.
После установки выбранный дистрибутив Linux полностью интегрируется в систему Windows, позволяя разработчику пользоваться преимуществами обеих ОС с минимальными затратами — как аппаратными, так и временными.

Читать далее

+9

itcaat 14 окт 2025 в 07:46

SLA, SLO, SLI простыми словами и с примерами

10 мин

9.3K

Управление продуктом * Управление проектами * Управление разработкой *

Большинство инженеров начинают путь с простой задачи — сделать так, чтобы ничего не падало. И в этом нет ничего плохого. Мы ставим мониторинг, настраиваем алерты и радуемся когда всё «зеленое».

Но что делать когда этого не достаточно и пользователи все равно жалуются?

Читать далее

+2

mClouds_editor 14 окт 2025 в 06:33

Windows, которую мы помним: от 1.0 до 11 — история ОС, ставшей частью нашей жизни

9 мин

10K

Блог компании mClouds.ruОперационные системыЧитальный залСистемное администрирование * История IT

Ретроспектива

14 октября 2025 года завершается поддержка Windows 10 — ОС, на которой работали сотни миллионов людей по всему миру. И сегодня, в день прощания с Windows 10, мы решили вспомнить, как всё было, — от пасьянса и «Сапера», маркетинговых феерий и антимонопольных битв до ИИ-ускоренных платформ.

Читать далее

+8

cheeseburger 14 окт 2025 в 06:14

Netconf с нуля, для «чайников»

Средний

21 мин

6.4K

IT-инфраструктура * Сетевые технологии * Сетевое оборудование

Из песочницы

Netconf с нуля: препарируем протокол и пытаемся понять, стоит ли ради него забросить классическое CLI-программирование.

Читать далее

+6

Re1ter 13 окт 2025 в 19:58

Использование gMSA в Linux-контейнерах

Простой

6 мин

5.7K

Системное администрирование * DevOps *

Туториал

Зачем вообще использовать gMSA в контейнерах?

Group Managed Service Accounts (gMSA) решает проблему хранения и обновления сервисных паролей: пароль хранится только в AD и регулярно обновляется автоматически. Использование gMSA позволяет не менять уже настроенные ACL и роли на файловых шарах и SQL-серверах - приложения продолжают работать с прежними правами через корпоративные Kerberos/SPN-механизмы. Такая интеграция обеспечивает прозрачный и контролируемый переход классических приложений в контейнерную инфраструктуру Kubernetes.

Посмотрим как это работает на примере простого кроссплатформенного dotnet-приложения.

Читать далее

+1

Nickmob 13 окт 2025 в 14:59

Мониторинг Angie с помощью Console Light и API

Простой

7 мин

5.9K

Nginx * Настройка Linux *

Туториал

Не секрет, что штатные возможности мониторинга Nginx довольно скромны. Решалась эта задача различными способами: либо парсингом логов, либо сторонними модулями. При создании Angie эту проблему решили радикально и сразу несколькими способами. Начнём с исторического модуля stub_status.

Читать далее

+9

1 2 ...

47