Обновить
406.19

Системное администрирование *

Лишь бы юзер был доволен

Сначала показывать
Порог рейтинга
Уровень сложности

Streamcast про Надежность (SRE)

Время на прочтение1 мин
Количество просмотров388

Всем привет!

29 декабря в 19:00 инженерный стрим.

Темой первого стрима будут этические вопросы в SRE:
- Необвинительная (Blameless) культура, как ее понимать
- Допустимо ли врать в резюме, к чему все это может привести и подобное

А где смотреть?

Установка и настройка VPN с VLESS и Reality

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров492K

В статье рассмотрим 3 способа настройки VPN-подключения с VLESS и Reality.

VLESS — это современный протокол передачи данных ориентированный на конфиденциальность, его еще часто называют VLESS VPN, хотя строго говоря, речь пойдет об установке прокси с протоколом VLESS на базе сервера XRay с Reality.

Начнем с самого простого и универсального варианта, не требующего технических знаний.

Читать далее

Как мы построили SIEM для Холдинга «Газпром-Медиа» и научились подключать новые активы к SOC за сутки

Время на прочтение12 мин
Количество просмотров7.6K

Сегодня расскажу, как мы полтора года строили систему мониторинга информационной безопасности для одного из крупнейших медиахолдингов России. Это будет история о долгом и масштабном проекте, по итогам которого наша команда прокачала навыки инжиниринга и кардинально пересмотрела подход по внедрению SIEM и развертыванию SOC.

Представьте себе организацию с десятками разнородных цифровых активов, где каждое подразделение автономно управляет своей IT-инфраструктурой, что осложняет контроль безопасности.

Мы взялись за сложнейшую задачу — создать систему мониторинга, которая сможет объединить разрозненные инфраструктуры в единую управляемую экосистему. И как вы уже понимаете, решениями со Stack Overflow в данном случае не обойтись.

Читать далее

Миграция CDN с nginx на Angie: кейс RUTUBE

Время на прочтение5 мин
Количество просмотров8K

Всем привет! Давно планировали рассказать пару сценариев использования нашего веб-сервера с открытым кодом Angie. Сегодня речь пойдет о том, как Angie используется в инфраструктуре такого большого проекта, как RUTUBE.

Читать далее

Как мигрировать данные между разными StorageClass в Kubernetes и зачем это делать

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.4K

Миграция данных в Kubernetes: практическое руководство. Узнайте, как легко и безопасно перемещать данные между различными StorageClass с помощью простых шагов.

Читать далее

Scrum is dead или почему Kanban намного эффективнее Scrum

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров26K

Методы управления проектами в сфере разработки программного обеспечения, такие как Scrum и Kanban, стали основными инструментами для команд, работающих по методологии Agile. В этой статье я рассмотрю, какие преимущества даёт Kanban по сравнению со Scrum.

Читать далее

История оболочки Bash и чему она нас может научить

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров14K

В этот день, практически в канун католического рождества, 23 декабря 1996 года, вышла оболочка Bash версии 2.0. Последний мажорный релиз на сегодня — это версия 5.3. Сейчас Bash встроена почти во все версии Linux и MacOS, а также заявлена как встроенный компонент Microsoft Windows.

Bash поставляется по умолчанию почти во всех дистрибутивах Linux и современных версиях MacOS и, как ожидается, вскоре он станет неотъемлемой частью Windows Terminal. Bash действительно повсюду и это не фигура речи. Как до этого дошло? В сегодняшней статье мы глубоко исследуем этот вопрос, задавая вопросы именно тем людям, которые причастны к разработке оболочек.

Читать далее

CI/CD Kubernetes платформа Gitorion. Реестр Docker-образов Harbor c аутентификацией в Keycloak и доступом по ролям RBAC

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.9K

Привет всем! В данной статье мы осветим наш опыт внедрения реестра Docker-образов Harbor в CI/CD платформу Gitorion. Расскажем, как настроить внешнюю аутентификацию Harbor в Keycloak по протоколу OIDC. Разграничим права доступа пользователей к реестру на основе ролей RBAC. Настроим дисковые квоты и автоматизируем очистку Harbor от устаревших Docker-образов, используя API Harbor в пайплайне Jenkins.

Читать далее

Автоматизация мониторинга в НЛМК: от агрегации данных и ML до инцидент-менеджмента

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров4K

Привет, Хабр!

Простая истина: когда какой-то элемент инфраструктуры или бизнес-сервис простаивает из-за сбоя, то компания несёт потери. Чем понятнее текущее состояние ИТ, тем быстрее можно реагировать на возникающие проблемы и не допускать простоев. Для этого, конечно, нужен мониторинг. 

Рассказываем, какой концептуальный подход к мониторингу мы применяем в команде НЛМК ИТ и как идёт один из наших проектов по внедрению зонтичного мониторинга и автоматизации на базе российской платформы Monq. Читать всем, кто хочет агрегировать данные из различных инструментов мониторинга в одном месте и автоматизировать управление этими данными. 

Читать далее

Roadmap в DevOps 2025

Уровень сложностиПростой
Время на прочтение18 мин
Количество просмотров38K

DevOps — это стремительно развивающаяся область, объединяющая разработчиков и специалистов по эксплуатации для автоматизации, ускорения и улучшения процессов доставки программного обеспечения. DevOps-инженеры играют ключевую роль в современном ИТ-ландшафте, помогая компаниям быстро адаптироваться к меняющимся условиям и требованиям рынка. Их задачи охватывают широкий спектр областей: автоматизация инфраструктуры, управление жизненным циклом приложений, настройка мониторинга и обеспечение надёжности систем.

Основная концепция DevOps заключается в устранении барьеров между командами разработки (Dev) и эксплуатации (Ops), что позволяет внедрять изменения быстрее и с меньшими рисками. Это достигается за счёт использования инструментов и подходов, таких как CI/CD (непрерывная интеграция и доставка), Infrastructure as Code (IaC, инфраструктура как код), контейнеризация и мониторинг. Однако DevOps — это не только технологии, но и культура взаимодействия, прозрачности и ответственности в командах.

Читать далее

Что такое эмуляция, и зачем её придумали

Время на прочтение8 мин
Количество просмотров4.6K

В прошлых постах мы разобрали виртуализацию и гиперконвергенцию — два кита, на которых держится современная IT-инфраструктура. Сегодня поговорим об их младшем, но не менее важном брате — эмуляции, без которой многие вещи в современном IT были бы просто невозможны, а некоторые технологии, которые мы воспринимаем как должное, так и остались бы красивыми идеями на бумаге.

Читать далее

Kubernetes 1.32: как QueueingHint оптимизирует планирование подов

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.8K

Начиная с Kubernetes v1.28, рабочая группа SIG Scheduling разрабатывает элемент контекста планирования QueueingHint. Он подписывается на определённый тип кластерных событий и принимает решение о том, способно ли входящее событие сделать под планируемым. Это позволяет оптимизировать процедуру повторного планирования подов. 

На протяжении нескольких версий фича была выключена из-за проблем с утечками памяти. В вышедшей недавно Kubernetes v1.32 она снова включена по умолчанию. Проблемы с утечками устранены, и теперь QueueingHint успешно интегрирован со всеми плагинами. Под катом вас ждёт перевод статьи, из которого вы узнаете о пользе новой фичи планировщика Kubernetes.

Читать далее

Opensearch, Logstash и dynamic mapping

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров2.3K

У нас в Домклик огромное количество микро-сервисов, около 5000. Все они пишут какие-то логи. В этой статье я хочу рассказать о том, как у нас в компании настроен маппинг в индексах Opensearch и какие "фишки" мы используем, чтобы минимизировать работы по настройке маппинга.

Читать далее

Ближайшие события

AWX: упрощаем работу с Ansible

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров23K

Привет, на связи Ксения Кузьменко, DevOps-инженер департамента по организации выпуска продуктов YADRO. Наша DPS-команда предоставляет платформенные сервисы для 40+ команд и 1000+ пользователей внутри компании. Мы работаем с сотнями виртуальных машин в различных локациях. Каждый день прогоняем более 250 плейбуков, из них часть связаны между собой в сложные последовательности. Конечно, инструмент для упрощения работы с Ansible был в нашей дорожной карте еще на этапе планирования.

Почему мы выбрали AWX, какие задачи решили и приятные «плюшки» получили, я расскажу в статье. О некоторых подводных камнях — тоже. 

Нужен ли AWX в вашей команде? На этот вопрос вы ответите сами, прочитав текст под катом. Я максимально подробно описала наш опыт с Ansible AWX. Если появятся вопросы — пишите в комментариях, отвечу. 

Читать далее

Включение веб-интерфейса CBPolicyD в Carbonio

Время на прочтение3 мин
Количество просмотров604

Ранее мы рассказывали о том, как настраивать различные почтовые политики во встроенном в Carbonio модуле CBPolicyD за счет правки таблиц в базе данных SQLite3. Такие политики позволяют настроить различные ограничения для пользователей, запретив им получать или отправлять больше заданного администратором количества писем, ограничить круг отправителей, способных отправлять письма получателям на сервере и так далее. В данной статье мы расскажем о том, как настроить веб-интерфейс CBPolicyD, чтобы сделать процесс настройки более простым и наглядным.

Читать далее

Ищем проблему с доставкой картинок с котиками на разных уровнях L3-коммутатора: от CLI до SDK

Уровень сложностиСложный
Время на прочтение14 мин
Количество просмотров6K

Привет, Хабр! Возвращаюсь с продолжением нашей детективной истории про Петра, у которого не загружались картинки с котиками. В прошлом тексте, ссылку на который вы найдете в статье, мы выяснили, что проблема скрывается в коммутаторе. Теперь погрузимся с вами в глубь его программного устройства и будем по одному отметать версии о подозреваемых источниках проблем.

Когда введен десяток команд, сложно сказать, какая из них повлияла на прохождение трафика. Поэтому мы начнем вводить команды по одной и проверять правильность конфигурации. Поступим так: «занулим» конфигурацию и будем контролировать выполнение команды на разных уровнях коммутатора. Разгадка ждет вас в конце (спойлер: котик, играющий с проводами, тут ни при чем).

Читать далее

Улетная скорость параллельных вычислений и вывод в реальном времени: что умеет Blackwell от NVIDIA

Время на прочтение7 мин
Количество просмотров3.4K

Платформу Blackwell анонсировали в первой половине 2024 года. Из-за последующих доработок сроки выпуска несколько раз переносили. Последний раз — на начало 2025 года. А пока мы ждем выхода на рынок новой линейки ускорителей от NVIDIA, давайте разберемся, что про них известно на сегодняшний день и как далеко производитель шагнул от линейки Hopper.

Читать далее

Как обновить PostgreSQL и не потерять данные: метод минимизации простоя

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров16K

Мы успешно обновили кластер PostgreSQL с версии 13 до 16, обеспечив минимальный простой и высокую производительность. Процесс включал в себя создание новой реплики через логическую репликацию, перенос роли мастера на обновлённую реплику и настройку потоковой репликации. Несмотря на некоторые сложности, такие как управление LSN и проблемы с подписками, нам удалось сохранить данные и обеспечить синхронизацию.

Подробности читайте в статье.

Читать далее

Разбираемся с работой SAMBA в корпоративном домене

Уровень сложностиСредний
Время на прочтение25 мин
Количество просмотров33K

Привет, Хабр!
Меня зовут Александр, я работаю в команде над продуктом ALD Pro.

В статье поговорим о том, как обеспечить надежную работу файлового сервера Samba в больших доменах с Kerberos-аутентификацией и авторизацией через PAC-сертификат, как настроить права доступа на уровне ACL файловой системы, как на самом деле работает стандартная проверка прав доступа "Пользователь-Группа-Остальные" и как расширяется алгоритм при использовании POSIX ACL.

В конце посмотрим возможности нашего файлового менеджера fly-fm и я поделюсь ещё одной своей утилитой aldpro-setfacl, которая позволяет настраивать права доступа к файлам полностью из графического интерфейса

Читать далее

Удобные дашборды для быстрой диагностики

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.4K

Привет, Хабр! Меня зовут Станислав Егоркин, я инженер юнита IaaS департамента разработки Infrastructure в Авито. Эта статья посвящена дашбордам для Grafana, существенно упрощающим диагностику различных систем. Рассказываю про новые подходы, которые я использовал при создании дашбордов, и демонстрирую, как эти подходы реализованы на практике в отношении серверов и кластеров Kubernetes.

Читать далее

Вклад авторов