Обновить

Администрирование

Сначала показывать
Порог рейтинга
Уровень сложности

Self‑service деплой: как перестать ждать DevOps и ускорить команду

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели7.5K

В статье разбираем, как self-service подход и платформенная инженерия помогают убрать этот шлюз: автоматизировать деплой, выдачу окружений, базы данных и типовые операции так, чтобы разработчики получали автономию, а админы и DevOps занимались архитектурой, надёжностью и развитием платформы.

Читать далее

Библиотека SNMP на Go, зачем я создал еще одну и чем она может быть интересна

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели12K

Я создал еще одну библиотеку SNMP на Go, но это не просто еще одна SNMP библиотека а библиотека созданная сетевым инженером, каждый день работающим с различным оборудованием.

Библиотека создавалась без оглядки на аналогичные а основной целью было написание различно ПО для мониторинга и управления оборудованием в реальных сетях.

Мне был необходим фундамент для создания:

Многоканальных сенсоров для PRTG

Утилит для сбора данных с сетевого оборудования, таких как MAC/ARP таблицы, режим работы портов, их состояние, информация о POE, информация о CDP/LLDP соседях и многое другое.

Приемника SNMP Trap/Inform сообщений версии 3 (с поддержкой смешанных трапов, как версии 2c так и 3 и с различными параметрами шифрования и аутентификации, то есть например часть оборудования шлет Trap и использует пользователя SNMPuser и использует шифрование DES, а часть использует пользователя useram и использует шифрование AES-256).

Утилит управления портами, POE и прочими функциями оборудования

Много внимания было уделено обработке ошибок и производительности.

Были изучены и учтены проблемы SNMP агентов на некотором оборудовании, с которыми мы столкнулись при использовании как gosnmp так и net-snmp и прочих библиотек.

Это вводная статья и надеюсь не последняя.

Читать далее

Fail2Ban больше не нужен? Разбираем PerSourcePenalties в OpenSSH на Ubuntu 26.04

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели26K

Начиная с OpenSSH 9.7, sshd умеет автоматически ограничивать на время подозрительные IP без Fail2Ban и iptables. В Ubuntu 26.04 эта функция уже включена по умолчанию — даже если в sshd_config про неё ничего не написано. Предлагаю попробовать разобраться с тем, как это работает.

Disclaimer: статья написана без использования ИИ. Нейросеть использовалась только для стилистической редактуры. Ничего не рекламирую и в ТГ-чаты не зазываю. Гараж не продаю.

Интересно, уже читаю

«Какой у вас ноутбук?» — вопрос, который стоит компании миллион в год

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели18K

Оператор техподдержки тратит 5 минут на каждый тикет, чтобы найти данные об активе. На трёх операторах это больше миллиона рублей в год — только на поиск. Считаем, откуда берётся эта цифра, и показываем формулу для ваших данных.

Читать далее

Cloud4Y строит ЦОДы в МО. Часть 15

Время на прочтение4 мин
Охват и читатели8.1K

Контейнерный ЦОД в Марфино пережил первые реальные аварийные отключения, принял первых гостей и обзавёлся соседями — тремя дизельными электростанциями и двумя газопоршневыми установками. Рассказываем, как прошёл апрель.

Читать далее

Два Kubernetes-кластера — одна сеть: объединяем через Mesh и межкластерный роутинг

Уровень сложностиСложный
Время на прочтение9 мин
Охват и читатели8.7K

Когда Kubernetes-кластеров становится больше одного, инфраструктура начинает жить по новым правилам. Один кластер развёрнут в основном датацентре, второй — в резервной площадке. Сложности начинаются в тот момент, когда этим кластерам нужно взаимодействовать друг с другом. Сервисы в одном кластере должны обращаться к сервисам в другом, приложениям требуется нормальная маршрутизация, а инженерам хочется управлять этим без набора временных решений вроде iptables и ручных DNS-записей.

В качестве сетевого слоя будем использовать Calico, а для межкластерного взаимодействия сервисов — Istio. Первый даст маршрутизацию и связность, второй — discovery, балансировку и управление трафиком на уровне приложений.

Читать далее

Как улучшить опыт работы с Zabbix: разбираем юзкейсы

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели13K

Привет, Хабр! Меня зовут Ярослав Яковкин, я младший инженер по разработке ПО в YADRO, работаю в команде TATLIN.FLEX. Еще будучи стажером, я разбирался в инструментах, которыми пользуется моя команда, и обнаружил, что система мониторинга Zabbix допускает некоторые ошибки в работе. Они не влияют на производительность, но, если их исправить, всем станет лучше.

Я погрузился и узнал, как устроен инструмент и что сделать, чтобы устранить неисправности, а опыт собрал в этой статье. Материал будет полезен тем, кто недавно работает с Zabbix, — возможно, вы найдете решение своей проблемы под катом. А опытных девопсов приглашаем в комментарии — поделитесь лучшими практиками по оптимизации Zabbix. 

Читать далее

Что именно сломалось: разбираем блокировки РКН/ТСПУ по слоям сетевого стека. Rkn Block Checker

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели27K

У вас не открывается сайт. Браузер пишет «Не удалось установить соединение». Это всё, что он знает — и это бесполезно.

Потому что «не открывается» - это как минимум четыре разных истории. DNS-резолвер провайдера соврал. ISP режет пакеты по IP. ТСПУ прочитал имя хоста в открытом поле TLS ClientHello и оборвал соединение. Или вы получили честный 200 OK - и страницу-заглушку «доступ ограничен по решению Роскомнадзора». В каждом случае нужно делать разное, и без понимания, на каком слое стоит фильтр, можно тыкаться в любую сторону и не угадать.

В статье разбираю все четыре механизма по слоям - снизу вверх, от DNS до HTTP - и показываю Python CLI, который запускает probes на каждом уровне и выдаёт диагноз: TCP_RESET, TLS_BLOCK, DNS_BLOCK, HTTP_STUB. Отдельно - про то, как «TCP открылся, а TLS handshake умер» становится надёжным отпечатком DPI на SNI, и почему параллельный стриминг результатов через as_completed радикально меняет UX по сравнению с pool.map().

Это диагностический инструмент, не средство обхода. Открытый код, MIT, pip install rkn-block-checker.

Читать далее

Chrome без спроса скачивает 4 гб модель. В масштабе миллиардов устройств это уже заметный удар по климату

Время на прочтение21 мин
Охват и читатели11K

Две недели назад я писал про Anthropic: Claude Desktop тихо регистрирует модуль Native Messaging сразу в семи браузерах на базе Chromium на машине пользователя. Схема там была чрезвычайно простая: запускаешь одну программу, а она без спроса прописывает себя в настройки других установленных тобой программ. То есть спокойно перелезает через некие «границы доверия» между вендорами. Ни окна согласия, ни понятного отказа в интерфейсе. Удаляешь вручную — при следующем запуске все появляется снова.

Теперь та же история всплыла у Google. Chrome без спроса кладет на диск файл локальной ИИ‑модели размером 4 ГБ. Это weights.bin в каталоге OptGuideOnDeviceModel. По сути, это веса Gemini Nano, локальной языковой модели Google. Браузер не спрашивает разрешения, никак не показывает пользователю, что сделал, а если файл удалить — просто скачивает его снова.

С юридической стороны история очень похожа на кейс Anthropic. Но у Google добавляется еще одна вещь: масштаб. Когда такой файл разъезжается по гигантской аудитории Chrome, экологическая цена уже вполне материальна. В зависимости от числа устройств речь идет примерно о 6–60 тыс. тонн CO2-эквивалента за одну такую волну загрузок. То есть одна компания просто решает, что браузер по умолчанию для миллиардов людей раскатает по их машинам 4 ГБ бинарных данных, которых никто не просил.

Читать далее

S3 Архипелаг: разворачиваем объектное хранилище за 15 минут

Время на прочтение18 мин
Охват и читатели7.2K

На связи Илья Шуйков, руководитель продукта «Фабрика данных» компании Диасофт.

В прошлой статье мы рассказали, зачем понадобилось строить свое объектное хранилище, и как устроен S3 Архипелаг изнутри. Теперь — практика: берем дистрибутив и разворачиваем рабочее хранилище.

Читать далее

Декодируем трафик Zabbix Proxy для быстрого устранения неполадок

Время на прочтение13 мин
Охват и читатели7.6K

Обычно для базовой диагностики прокси достаточно просто заглянуть на страницу администрирования Zabbix proxy или посмотреть метрики состояния прокси. Однако бывают ситуации, когда требуется более глубокий анализ.

Сегодня мы разберём взаимодействие между Zabbix server ↔ proxy и научимся интерпретировать внутренний протокол обмена.

Читать далее

Как развивалась виртуализация в Авито

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели10K

Всем привет! Меня зовут Ярослав Покрепов, я DevOps-инженер в Авито

Виртуализация — это технология создания изолированных и независимых виртуальных сред на базе физических ресурсов. Виртуализация в Авито — это неотъемлемая часть технического стека, как и во многих других IT-компаниях. На этапе основания Авито виртуализация уже была широко распространённой технологией. Проект нуждался в эффективных и гибких решениях для управления ресурсами, в возможности масштабироваться в будущем и в обеспечении стабильной работы при растущей нагрузке.

В этой статье попробую провести читателя от истоков виртуализации в Авито до современных решений и показать, как эти изменения повлияли на архитектуру и возможности компании. Описать общую хронологию развития виртуализации без полного погружения в технические детали — об этом расскажу подробнее в следующих частях.

Дисклеймер: ранняя история инфраструктуры компании восстановлена не по документации, а по воспоминаниям инженеров, которые работали в тот период. Это устная история — с допущениями, реконструкцией контекста и попыткой передать факты и логику решений.

Читать далее

В чем особенность виртуальных машин размером с хост

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели16K

Представьте ситуацию: у вас есть сервис, который стабильно работает в публичном облаке. Простое масштабирование, оплата по факту потребления — все устраивает. Но в какой-то момент появляются новые требования к изоляции нагрузок. И вот уже привычная модель с обычными виртуальными машинами перестает выглядеть универсальной. А переход на приватный хост публичного облака пусть и решает часть задач, но приносит с собой дополнительные ограничения и затраты.

Вот тут-то и появляется промежуточный вариант — виртуальные машины размером с хост. Разберемся, как они устроены и в каких сценариях могут стать наиболее подходящим решением.

Читать далее

Ближайшие события

Повторный обзор курса «Стань DevOps-инженером с нуля» — или как всё стало только лучше

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели13K

Да, простите меня ребята, но ко мне пришел автор курса из прошлой статьи и сказал, что все понял, учел поправил и даже GUI навалил. Так как я ранее приобретал курс, обновление получил просто так. Учитывая, что прошлая статья для многих оказалась полезной, я решил дополнить обзор новой — полезных изменений достаточно много.

Читать далее

Собственная LLM в корпоративном контуре: как мы собрали RAG на n8n и сократили расходы в 5,5 раза

Время на прочтение7 мин
Охват и читатели19K

В этой статье мы расскажем, как сократили время на поиск информации в корпоративной базе знаний и превратили тысячи страниц документации в удобного ИИ-ассистента. А также поделимся, как реализовали локальный GPT, почему выбрали путь собственных решений вместо готовых сервисов, с какими инфраструктурными вызовами столкнулись и как в итоге собрали рабочие инструменты на базе self-hosted-версии low-code-платформы n8n, полностью закрыв данные внутри корпоративного контура.

Читать далее

От кликов в личном кабинете до terraform apply: что меняется в работе с инфраструктурой

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели8K

Привет, Хабр! На связи Алексей Тюняев, директор по облачным продуктам Рег.облака.

Когда инфраструктура небольшая, личного кабинета обычно хватает: зашел, создал сервер, настроил — готово. Но как только серверов становится больше, появляются повторяющиеся операции, командная работа и необходимость воспроизводить окружения, ЛК начинает ограничивать. Именно здесь в игру входит Terraform. В этой статье разберу, что такое Terraform, как он работает и когда его действительно стоит использовать.

Читать далее

Как запускать LLM-агентов без облачных API: VPS, локальные модели и требования к железу

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели21K

LLM-агенты вроде Claude Code постепенно становятся рабочим инструментом разработчика. Но почти все они завязаны на облачные API с их ценами, лимитами и зависимостью от внешней инфраструктуры.

Поэтому всё чаще возникает идея: а что если запускать агентов на своём сервере — локально или на VPS?

Разберёмся, как это сделать, какое железо для этого нужно и почему такие сценарии могут быть выгодны не только пользователям, но и самим хостерам.

Читать далее

DGX Spark: мониторинг unified memory, когда NVML и dcgm‑exporter молчат

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели10K

Свежепоставленный мониторинг на DGX Spark. Открываю NVIDIA‑дашборд в Grafana — половина memory‑панелей пустые, прямые линии по нулю. Сначала кажется, что что‑то не настроил. Через полчаса доходит: это не у меня сломалось, это NVML на GB10 так работает.

Это та область, где на GB10 половина стандартного observability‑стека просто не работает: NVML отдаёт [N/A] на memory.used и memory.total, dcgm‑exporter не ставится, nvtop в memory‑колонке показывает пустоту. В Grafana NVIDIA‑дашборды по умолчанию выглядят так, будто GPU вообще нет — и это не очевидно, потому что Grafana при отсутствии данных не кричит, а молча рисует ровную линию по нулю.

Статья — про то, как я это место обошёл и что в итоге увидел в Grafana. Трёхуровневая схема: textfile collector для базовых метрик, per‑container attribution через docker top + nvidia-smi, и CLI‑фоллбэк на /proc/meminfo, который оказался полезен не только на Spark, но и на других Linux‑системах с единой памятью (unified memory) — AMD Strix Halo и подобные.

Читать далее

Минпромторг исключил бренды компьютерной электроники из перечня параллельного импорта, разбираем аналоги и влияние

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели32K

В начале мая Минпромторг решил убрать из параллельного импорта целую "пачку" брендов компьютерной электроники: Intel, Samsung, Kingston, Acer, Asus, HP и другие знакомые названия. То есть всё то, из чего сегодня в реальности собираются домашние ПК, офисные машины, серверы, ноутбуки и часть корпоративной инфраструктуры. Формально это не полный запрет на ввоз, но для рынка разница значительная: отсутствие легальных массовых поставок, серый импорт и скачок стоимости.

Самое интересное началось дальше. Минпромторг заявил, что рынок не пострадает, потому что отечественные производители якобы поставляют аналоги в полном объёме. И вот на этом месте мне стало уже не просто интересно, а даже почувствовал запах. Потому что «аналог» - очень удобное слово, если не смотреть на производительность, цену, доступность, архитектуру, драйверы, объёмы производства и реальную применимость.

В этой статье я разбираю, что у нас действительно есть: Baikal, Эльбрус, российские SSD, память, ноутбуки, серверы, роутеры и легендарную «отечественную» GT 1030. Смотрю не по пресс-релизам, а по характеристикам, ценам и здравому смыслу. А чтобы совсем не утонуть в грусти, добавил мемы.

Читать далее

Тестовый релиз 1С: Предприятие 8.5.4: лицензии, данные и администрирование

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели11K

Фирма «1С» опубликовала тестовый релиз технологической платформы «1С:Предприятие 8.5.4». Версия предназначена для ознакомления и тестирования, но уже позволяет оценить изменения, которые могут быть важны для администраторов, разработчиков и команд сопровождения.

Одно из заметных обновлений - новый инструмент «1С:Предприятие — менеджер лицензий». Он унифицирует работу с программными и аппаратными лицензиями и позволяет управлять их распределением между информационными базами, продуктами и пространствами лицензирования. Также менеджер поддерживает работу с HASP License Manager, при этом поддержка HASP License Manager в клиентских и серверных приложениях прекращена...

Читать далее