Обновить
338.43

Системное администрирование *

Лишь бы юзер был доволен

Сначала показывать
Порог рейтинга
Уровень сложности

Спокойствие админа: автоматический мониторинг и Telegram-уведомления с Monit

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели16K

Мониторинг процессов на сервере — ключевой элемент для безопасности и стабильности работы всей системы. Даже если на сервере всего несколько процессов, бывает очень критично вовремя узнавать об их сбоях и недоступности, чтобы своевременно восстановить доступ. Для автоматического отслеживания удобно использовать специализированный под эти задачи сервис, такой как Monit — лёгкий, но при этом мощный инструмент, позволяющий не только отслеживать работу процессов (например, nginx, apache, mysql, postgres, redis, node, java) и перезапускать их автоматически, но и направлять уведомления об этом (например, в Telegram).

Читать далее

О пакетах в экосистеме Apple (часть 2)

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели5.6K

Всем привет! Это снова Эрик, инженер технической поддержки из Ринго, и мы продолжаем разговор о пакетах в экосистеме Apple. В первой части мы разобрали теорию: изучили устройство PKG-файлов, познакомились с Gatekeeper и нотаризацией, научились инспектировать пакеты с помощью встроенных утилит. Теперь перейдём к практике — будем создавать и переупаковывать пакеты.

Читать далее

Как загрузить GPU на максимум. Разбираем узкие места в инфраструктуре для ИИ

Время на прочтение7 мин
Охват и читатели7K

Представим, что вы запускаете обучение модели, ждете, что процесс пойдет как по маслу. Но вместо этого в инструментах мониторинга видите, что GPU загружен на 40–60%, а то и меньше. Время обучения растягивается и эффективность не та, что вы ожидали. Даже самый быстрый GPU беспомощен, если данные не успевают до него «доехать». Он просто ждет.

В статье разберем, почему для эффективного AI-обучения важны быстрые диски, память и CPU, и расскажем, как спроектировать сбалансированную инфраструктуру — даже в условиях ограниченных ресурсов.

Читать далее

Осенние будни DevOps: Debian 13 и Proxmox VE 9.0 в продакшене HOSTKEY

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели11K

Новая версия Debian 13 и релиз Proxmox VE 9.0 пришли почти одновременно, вызвав ажиотаж у клиентов. В статье рассказываем, как команда HOSTKEY адаптировала свои процессы, автоматизировала деплой и подготовила инфраструктуру под свежие релизы.

Читать далее

Служба каталогов РЕД АДМ глазами инженера: работа без ошибок

Время на прочтение10 мин
Охват и читатели7.3K

Привет, Хабр! Меня зовут Дмитрий (@HaZkeR_Default), и я — инженер по инфраструктурным решениям в компании РЕД СОФТ. Моя работа связана с RED DC — контроллером домена, входящим в состав системы централизованного управления РЕД АДМ. В частности, я занимаюсь анализом проблем, возникающих у пользователей. Итак, я обнаружил, что 80% ошибок легко поправимы и закрадываются на этапе первичных настроек «Службы каталогов». Их можно избежать, выполнив проверки на стадии ввода или репликации.

Результат моих трудов — сегодняшний чек-лист. Разберем подробно типовые ошибки, которые допускаются в процессе заполнения конфигурационных файлов, и пройдем процесс первоначальной настройки.

Читать далее

Когда база устала искать: архитектура OpenSearch для больших данных

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6.8K

БигДата всегда звучит красиво — пока не нужно по ним искать и за нее платить.

Когда данные перестают влезать в индекс, а поиск тормозит — дело не в БД, а в архитектуре.Рассказываю, как мы перестроили систему на связке PostGIS + OpenSearch и добились отклика в десятки миллисекунд.

Читать далее

Когда MPLS, VPN и IPSec недостаточно: как повысить надёжность сети благодаря SD-WAN

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели12K

Организация сетевого взаимодействия между филиалами всегда была сложной задачей. Технологии вроде MPLS обеспечивали гарантированное качество связи, но со временем перестали справляться с растущими потребностями.

Главная проблема традиционных сетей — неэффективное управление трафиком. Все приложения вынуждены использовать общий канал, что неминуемо приводит к перегрузкам. А механизмы приоритизации требуют сложной ручной настройки на каждом устройстве.

Помимо этого, в распределённой компании важно постоянно отслеживать качество связи, чтобы оптимизировать использование каналов, повысить отказоустойчивость и упростить подключение филиалов и устройств.

Новые сетевые технологии успешно справляются с этими задачами. Сегодня мы подробно разберём интеллектуальную маршрутизацию. О других преимуществах современных решений для управления сетью рассказали на вебинаре — запись по ссылке

Читать далее

Файловые дескрипторы 0, 1, 2: полное руководство по работе с потоками

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели8.6K

Привет, Хабр! Конструкции вроде 2>&1 и &> встречаются повсюду — в мануалах, скриптах, инструкциях. Их используют постоянно, но редко понимают до конца. Почему ошибки продолжают появляться в терминале, хотя, казалось бы, должны уходить в файл? Почему конвейер передаёт только часть вывода?

В статье разберём всё от базового синтаксиса до работы с tee и /dev/null - каждая часть будет разобрана и показана на практических примерах.

Читать далее

Почему серверы не унаследовали название «мейнфрейм»?

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели21K

Мы часто говорим и слышим термины «сервер», «кластер» или «облако», но почти не вспоминаем слово «мейнфрейм». Почему современные вычислительные системы не называют тем же именем, что и их могучих предков? Попробую разобраться в истории ИТ и рассказать, как мейнфреймы уступили парадигме серверов.

Читать

Два в одном (HA) PaloAlto

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6K

Здраствуйте дорогие коллеги, сегодня с вами будет изучать тему HA Paloalto. Для этого нам понадобится 2 paloalto.

Как всегда будем все реализовать на практике, и буквально чутка теории)

HA = дублирование двух (или до 16) Palo Alto для отказоустойчивости. Один работает (Active), второй пассивный ждет... (Passive). Если активный падает , то пассивный мгновенно берёт на себя сессии и конфигурацию, если конечно же настрое преемтинг!

Синхронизируется:

Читать далее

Такой разный DevOps

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели10K

Истории из нашей практики: разные подходы к организации инфраструктуры и процессов DevOps. Первая статья из серии.

Читать далее

15 лучших оконных менеджеров для Linux в 2025 году

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели28K

Оконный менеджер — одна из тех вещей в Linux, о которой не задумываешься, пока не попробуешь сменить. Кажется, окна просто открываются и закрываются, а потом ставишь тайлинговый WM и понимаешь, что можно работать быстрее и почти не трогать мышь, или выбираешь плавающий — и ноутбук сразу оживает. Расскажем о 15 самых интересных и востребованных решениях на 2025 год.

Читать далее

Когда сбой — не катастрофа: настраиваем отказоустойчивый кластер Usergate NGFW

Время на прочтение10 мин
Охват и читатели8.2K

Представьте: обычный вторник, и вдруг в корпоративном чате паника — CRM лежит, бухгалтерия не может отправить платежи, сайт не открывается. Где-то в серверной тихо погас светодиод на ключевом коммутаторе. Или, что хуже — весь ЦОД оказался в зоне коммунальной аварии. 

Но что еще хуже — вместе с частью инфраструктуры вышли из строя защитные решения, и появился риск получить вдобавок к аварии еще и кибератаку. Чтобы этот страшный сон не стал явью, инженеры придумали «подложить соломки» при помощи кластеризации.

Сегодня поговорим о том, как превратить точку отказа в отказоустойчивую систему на примере российского NGFW-решения UserGate. Разберем не только техническую сторону (протокол VRRP, режимы Active/Passive и Active/Active, синхронизацию сессий), но и практические моменты: сколько это стоит, как долго настраивать, какие подводные камни ждут на каждом этапе.

Статья будет полезна системным администраторам, которые планируют внедрение отказоустойчивого периметра, и техническим руководителям, которым нужно понимать, во что они ввязываются.

Читать далее

Ближайшие события

Не просто метки: как построить модель тегирования, которая покажет, кто сжигает облачный бюджет. Часть 1

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели5.6K

Привет, Хабр! Меня зовут Лиля Ермакова, Service Delivery Manager в Cloudmaster. В своей работе нам часто приходится помогать компаниям настраивать отображение затрат по инфраструктуре в соответствии с бизнес-потребностями

Сначала я хотела рассказать, как просто и быстро проставить метаданные (теги) на виртуалках в VMware Cloud Director и получить первый отчет о расходах. Но, начав писать, пришла к мысли, что FinOps и тегирование — это целая модель учета. Если внедрять ее абы как, без правил, можно сделать еще хуже. А нам этого не надо. Поэтому будем делать по уму и разберем все в подробностях.

Чтобы полностью раскрыть тему и не перегружать информацией, я разбила статью на три части:

Читать далее

Клиентское кэширование в Angie

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели9.8K

Один из самых простых способов ускорить работу сайтов и снизить нагрузку на инфраструктуру — корректно использовать клиентское кэширование. Механизм одновременно и простой, и сложный. В этой статье посмотрим, как можно управлять клиентским кэшированием в веб‑сервере Angie.

Читать далее

Полное руководство по HTTP-кэшированию. Часть 2

Уровень сложностиСредний
Время на прочтение21 мин
Охват и читатели11K

Кэширование — скрытый двигатель, на котором держится веб. Именно оно делает сайты быстрыми, надежными и относительно недорогими в обслуживании. При правильной настройке кэширование снижает задержки, разгружает серверы и позволяет даже хрупкой инфраструктуре выдерживать резкие всплески трафика. При неправильной настройке или полном отсутствии кэширования сайты работают медленно, остаются уязвимыми для атак и обходятся очень дорого.

В основе кэширования лежит сокращение лишней работы. Каждый раз, когда браузер, CDN или прокси обращается к серверу за ресурсом, который не изменился, впустую тратятся время и трафик. Когда сервер заново формирует или повторно отдает идентичный контент, это лишь добавляет нагрузки и увеличивает затраты. А при пиковом трафике — например, в "черную пятницу", во время вирусной публикации или DDoS-атаки — такие ошибки стремительно накапливаются и приводят к сбоям всей системы.

Читать далее

Хватит тестировать вполсилы: Фреймворк RES-ATTACK для симуляции комплексных угроз и его метрика R-score

Уровень сложностиСредний
Время на прочтение17 мин
Охват и читатели10K

Привет, Хабр. С вами AdminFuture.

Давайте представим себе худший кошмар любого SRE-инженера или CISO. Пятница, вторая половина дня. Нагрузка на систему достигает пика, и в этот самый момент основной узел кластера вашей критически важной СУБД начинает сбоить. Автоматика запускает процедуру failover. Системы напряжены, инженеры наготове, но в целом ситуация под контролем — к такому вы готовились. Но именно в этот момент, в окне уязвимости, когда внутренние сервисы перестраивают сетевые маршруты, а часть проверок безопасности временно ослаблена, ваша система мониторинга безопасности взрывается алертами. На один из внутренних API, который стал доступен во время переключения, началась целенаправленная атака.

Это не голливудский сценарий. Это «идеальный шторм» — комбинация инфраструктурного сбоя и кибератаки, которая становится все более реальной угрозой для современных сложных систем.1 И самое опасное здесь то, что мы почти никогда не готовимся к таким комбинированным событиям.

Наши подходы к обеспечению отказоустойчивости и безопасности работают в параллельных вселенных. С одной стороны, у нас есть Chaos Engineering — дисциплина, которая учит нас готовиться к отказам инфраструктуры. Мы научились виртуозно «убивать» поды, вносить сетевые задержки и перегружать CPU, чтобы убедиться, что система выстоит.3 С другой стороны, есть Red Teaming — практика эмуляции действий злоумышленников, которая проверяет наши защитные бастионы на прочность с помощью таких фреймворков, как Atomic Red Team

Читать далее

«Есть 15 конкурирующих стандартов...»: Media over QUIC — зачем его развивают и что о нем думают в индустрии

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели11K

Мы регулярно рассказываем о новых стандартах, протоколах и сетевых технологиях. Одну такую технологию как раз развивает рабочая группа IETF. Речь о стеке протоколов для передачи мультимедиа поверх QUIC — Media over QUIC (MoQ).

Разработка началась еще в 2022 году, однако сегодня проект получает новую порцию внимания на ИТ-площадках. Также о Media over QUIC говорят облачные провайдеры и региональные интернет-регистраторы, участвующие в развитии протокола.

Читать далее

XRAYUI для ASUS: от интерфейса к экосистеме

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели17K

Эта статья - вторая по счету на тему open source модуля для роутеров ASUS на базе прошивки MerlinWRT. Предыдущая версия была написана почти год назад, и с того времени произошло множество изменений в модуле. Я хочу несколько осветить их в новой статье, поскольку модуль обзавелся множеством фич и полезных функций. Для базового понимания, все же стоит ознакомиться с изначальной статьей.

Читать далее

DNSSEC и DNS: как доменные имена управляют интернетом + настройка BIND на Ubuntu

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели21K

Все мы любим, когда интернет работает (и не виснет 🙂) — сайты открываются, видео грузятся, письма доходят. Но мало кто задумывается, как именно браузер узнаёт, куда вас отправить, когда вы вводите знакомое «habr.com». 

Эта статья для тех, кто хочет понять, как именно устроена и работает система доменных имён, её защита на уровне DNSSEC и почему эта технология важна для безопасности интернета. Если вы техно-гик и не боитесь деталей — добро пожаловать под кат!

Читать далее

Вклад авторов