Обновить

Администрирование

Сначала показывать
Порог рейтинга
Уровень сложности

24 000 чипов NVIDIA и 2600 Rhea1 в действии: как устроен самый мощный европейский суперкомпьютер JUPITER

Время на прочтение6 мин
Количество просмотров1.2K

Европа официально вступила в экзафлопсную эру суперкомпьютеров. В исследовательском центре Юлиха (Германия) начал работу JUPITER — первый европейский суперкомпьютер, способный выполнять квинтиллион (10^18) операций в секунду.

JUPITER объединяет в себе передовые технологии: 24 000 чипов NVIDIA GH200 Grace Hopper, новейшую систему жидкостного охлаждения и модульную архитектуру. Рассказываем, что внутри у крупнейшего суперкомпьютера Европы, сколько он стоит и для каких целей его будут использовать.

Читать далее

Культура экономии в IT: как вовлечь команды в управление облачными расходами

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров726

Хотите лайфхак, как выбесить финдира? Забудьте про задержки в релизах, падения продакшена и критические баги. Все это мелочи. Если хотите по-настоящему вывести его из себя, возьмите за правило никогда не отключать на выходные тестовые инстансы, разверните staging-среду на том же железе, что и продакшен, и настройте автобэкапы сразу в 2-3 региона. А когда получите счет за облако на 800 тысяч вместо 300, надменно спросите – “А при чем тут я?”. Звучит как вольный пересказ “Вредных советов” Г. Остера, согласен. Да и мы с вами не в третьем классе, а значит, вредительско-инфантильный подход к работе просто не допустим. Поэтому в команде надо с самого начала развивать культуру разумного потребления облачных ресурсов, чтобы и код писать с удовольствием, и финансистов до нервного срыва не доводить.

Читать далее

Приказ 221 v2 Роскомнадзора для простых админов — создать XML и выжить

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров29K

От Роскомнадзора пришло недвусмысленное желание получить от вас XML с внутренностями вашего интернет-соединения.

Системный администратор почему-то спохватился в последний момент, но прислал инструкцию уровня "что-то на XML" и несколько таблиц от одного из известных форумов nag.ru.

С третьей-четвертой попытки у вас ничего не получилось загрузить по требуемому адресу. Давайте пошагово рассмотрим одну из типовых ошибок начинающих XML-писателей.

Как просто сделать требуемое

Инфраструктура без боли: Kubernetes Security, GitOps, Kafka, Angie — что изучить в октябре

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров3.7K

Привет, Хабр. Это октябрьский дайджест по инфраструктуре и данным: безопасность Kubernetes, IaC и GitOps, Kafka и балансировка в Angie, Postgres 17/FDW, OpenSearch, файловые системы Linux и многое другое. В нем мы рассказываем об актуальных программах, а также приглашаем на бесплатные уроки от экспертов индустрии. Каждый сможет найти что-то полезное для себя.

Все темы выпуска

Я DevOps, который искал работу. Почему не Яндекс?

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров21K

Мне 25 лет, и я работаю DevOps-инженером четвёртый год. Начинал системным администратором.

За это время сменил 5 работ. Первые три был сисадмином. На четвертой работе я был уже DevOps.

Читать далее

Core Web Vitals на практике: как инфраструктура убивает ваш SEO (и что с этим делать)

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров1.3K

Знаете, что бесит больше всего? Когда Вы делаете всё правильно с точки зрения контента, семантики, ссылочной массы — а сайт всё равно проваливается в выдаче. Открываете PageSpeed Insights, а там красные цифры LCP: 4.2 секунды. И вдруг понимаете: проблема не в вашем коде. Проблема в сервере, который думает три секунды, прежде чем отдать первый байт HTML.

С мая 2021 года Google официально включил Page Experience в факторы ранжирования, и это изменило правила игры. Теперь недостаточно просто написать хороший текст и собрать ссылки — нужно, чтобы сайт загружался за считанные секунды, иначе Google просто не покажет его в топе. Даже если контент идеален.

По данным исследований, увеличение времени загрузки с 1 до 10 секунд повышает bounce rate на 123%. Каждая секунда задержки — это минус 20-22% конверсии. Каждые 100 миллисекунд — минус 2.4% на десктопе и минус 7.1% на мобильных. Цифры жестокие, но реальные.

И вот что интересно: по моему опыту работы с несколькими десятками e-commerce проектов, в 60-70% случаев узким местом оказывается именно инфраструктура. Не JavaScript. Не картинки. А сервер, который медленно отвечает, или отсутствие кэширования, или shared hosting с перегруженными соседями.

Сегодня я расскажу, как инфраструктура влияет на Core Web Vitals, покажу реальные кейсы с цифрами и дам чек-лист для аудита. Без воды, только практика.

Читать далее

Отказ от самурайства: EXANTE меняет инфраструктуру или Как мы ошиблись в реализации Cloud Native

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров791

От Kubernetes-хаоса к Infrastructure 2.0: опыт EXANTE, ошибки, неожиданные инсайты и новые подходы к современной инфраструктуре будущего

Читать далее

GitOps в Linux: бесперебойное управление инфраструктурой на основе Git

Время на прочтение4 мин
Количество просмотров4.5K

Представь мир, где каждый сервер, приложение и сетевая конфигурация тщательно оркестрируются через Git, где обновления, аудиты и восстановления происходят с помощью одного коммита. Эти и другие возможности открывает GitOps. Особенно мощно он проявляет себя в сочетании с универсальностью Linux-систем. Как же преобразить управление инфраструктурой Linux? И каким образом с помощью Git добиться ясности, контроля и уверенности в каждом изменении?

Читать далее

Что такое DevOps и почему он автоматизировал не всё

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров29K

Вы сделали заказ в интернет-магазине, а он внезапно завис в самый разгар скидок. За кулисами этого сервиса работают сотни строк кода и ещё больше человеческой поддержки. DevOps — это  способ организовать эту работу так, чтобы новые функции доходили до вас быстрее и без сбоев. Он объединяет разработчиков, тестировщиков и операторов, автоматизируя рутинные шаги и следя за сервисом в режиме реального времени. Звучит хорошо, но на практике автоматизация закрывает далеко не всё.

В статье рассмотрим, что за зверь такой DevOps. Когда работает, а когда спотыкается и где автоматизация работает, а где нужна платформа и процессы. Даже если вы не айтишник — переходите под кат.

Читать далее

Не новые обои, а капитальный ремонт: чем zVirt отличается от oVirt

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров3.1K

Привет! Я Саша Епихин, CTO zVirt. В прошлой моей статье речь шла о том, как oVirt стала самым зрелым Open Source ПО для виртуализации и о том, почему мы в Orion soft выбрали разработку на базе этого решения, а не пошли другим путем. Я упоминал, что мы давно ушли от модели форка: oVirt — это только проверенное ядро, а всю дополнительную функциональность мы разрабатываем «поверх» него сами. Можно сказать, мы не просто натянули новые обои, а сделали капитальную пристройку с ремонтом. Это позволяет и получать обновления сообщества, и отправлять в него багфиксы, и развивать свое комьюнити.

Важно понимать контекст: в 2024 году oVirt официально осталась без поддержки разработчика Red Hat, который перестал выпускать для нее обновления безопасности. Любой продукт, оставшийся без техподдержки, опасен для бизнеса. Но zVirt — это не просто локализованная версия oVirt. Это эволюция платформы, которая не только добавляет новые функции, но и решает проблемы безопасности и стабильности исходного кода.

В этой статье я хочу рассказать подробнее, чем именно мы отличаемся от oVirt. Начну с доработок по стабильности и безопасности.

Читать далее

Делегирование прав локального админа Windows — Систематизация и автоматизация

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров9.3K

Привет, Хабр! Меня зовут Иван Мороз, я системный администратор в BPMSoft. В нашей компании существовала проблема с контролем прав локального администратора на сотнях корпоративных ноутбуков. Ручной учет через Excel или стандартные GPO оказалось неэффективным, а ошибки могли приводить к проблемам с безопасностью и операционным рискам.

В этой статье я расскажу, как автоматизировал выдачу и изъятие прав локальных администраторов с помощью PowerShell и шедулера, как строилась концепция решения, какие трудности возникли и как их удалось обойти. Я покажу конкретные блоки кода и дам практические советы для внедрения подобных процессов в крупных корпоративных средах.

Читать далее

От хаоса к порядку: как мы научились управлять Vault через GitOps

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров4.2K

Представьте, что вы DevOps-инженер и разработчик просит развернуть новое приложение в Kubernetes. В большинстве случаев в нем будут секреты: логин или пароль от базы данных, ключи для S3-бакета и так далее. Эти секреты желательно спрятать.

Есть несколько способов это сделать. Мы в команде используем HashiCorp Vault. Храним там секреты в формате key-value, откуда они попадают в приложения, развернутые в ArgoCD с помощью ArgoCD Vault Plugin или аналогичных решений. Звучит не очень сложно, но кое-что в такой схеме нам не нравилось: ручное добавление или изменение существующих секретов в Vault, а также необходимость периодически создавать руками новые key-value secrets engine. Еще стоит упомянуть, что Vault используется не только DevOps-инженерами, но и разработчиками, например в их Jenkins-джобах, а у разработчиков нет доступа на запись в Vault, поэтому любой запрос на добавление/изменение секретов с их стороны выполнялся в рамках заведенного на DevOps-инженера Jira-тикета. Тикеты не всегда вовремя замечались в бэклоге, поэтому такая простая задачка, как добавление секретов, могла растянуться на пару дней.

Поэтому процесс взаимодействия с Vault мы в YADRO решили автоматизировать. В статье я расскажу, как можно управлять Vault через подход IaC (Infrastructure as a Code) с использованием OpenTofu — open source-форка Terraform.

Читать далее

Инферит ИТМен 6.3: проактивный контроль и новые возможности для администраторов

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров485

Вышла новая версии 6.3 нашей системы инвентаризации, учета и контроля ИТ-инфраструктуры. В этой статье расскажу, что конкретно изменилось. 

В обновлении мы сосредоточились на удобстве администрирования, работе с отчетами и контроле задач. Ключевое изменение — проактивный контроль: система автоматически выявляет критичные события и уведомляет ИТ-команды.

Читать далее

Ближайшие события

FuriosaAI NXT RNGD: как корейский стартап бросает вызов NVIDIA в сегменте ИИ-инференса

Время на прочтение3 мин
Количество просмотров790

Корейский стартап FuriosaAI представил сервер NXT RNGD для ИИ-инференса. 4 петафлопса вычислений при потреблении 3 кВт вместо 10+ кВт у GPU-решений. Анализ архитектуры, преимуществ и перспектив альтернативы NVIDIA.

Читать далее

Как мы в Авито автоматически лечим ноды в Kubernetes

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров17K

Привет, Хабр! Это Станислав Егоркин, инженер юнита k8s департамента разработки Infrastructure в Авито. В одной из своих прошлых статей я описал, как мы детектируем проблемы на нодах Kubernetes-кластеров. Логичным продолжением этой работы стала автоматизация их лечения. В этой статье я расскажу, как у нас устроены механики Auto Healing.

Читать далее

Supermicro ARS-121L-NE316R: как ARM-процессор стал основой для высокоскоростного NVMe-сервера

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров2.2K

Обзор инновационного 1U-сервера Supermicro ARS-121L-NE316R: 144-ядерный ARM-процессор NVIDIA Grace Superchip, 16 слотов E3.S и решение для хранилищ PCIe Gen5. Анализ архитектуры и сценариев применения.

Читать далее

Топ-10 мифов о публичных облаках в корпоративном сегменте

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров2.2K

Пусть плюнет в меня IT-директор той компании, который ни разу не задумывался о переходе в облако. Ну, а что? С одной стороны, это должно быть выгодно. Конечно, есть кое-какие вопросики к безопасности, но ведь люди пользуются – и ничего. С другой стороны, переход на облачную инфраструктуру вроде как требует пересмотреть модель бюджетирования. А так не хочется. Да и надо ли? В общем, вопросов, ответы на которые формируются на основе слухов или давно неактуальных данных, хватает. Поэтому мы собрали 10 самых распространенных мифов об облаке, чтобы выяснить, где правда, а где домыслы, не имеющие ничего общего с реальностью.

Читать далее

Рутокен ЭЦП + ИФНС: отправляем отчетность в Линуксе

Время на прочтение4 мин
Количество просмотров4.7K

Еще не так давно периодическая процедура типа «сдача налоговой отчетности» заставляла нервно дергаться глаз: для того, чтобы сделать это онлайн — нужна электронная подпись на USB‑токене, для того, чтобы работать с USB‑токеном нужно установить специальную программу (широко известную в узких кругах), а для того чтобы установить эту специальную программу — нужен компьютер с Windows.
Да еще у нее может закончиться срок лицензии, и тогда его надо продлевать...

Но что делать, если больше ни для чего мне Windows не нужен нигде и никогда? Держать на полке специальный старый ноубук (который все время мешается)? Завести образ виртуальной машины, который нужно будет в определенное время запускать только ради того чтобы отправить файл?
Да еще периодически обновлять программу, выполнять хотелки типа «нужно установить версию ХХХ не ниже YYY!», бороться со странными багами после установки версии XXX...

Причем, нельзя это сделать где‑то на сервере и работать удалённо — получится ошибка типа «по идейным причинам программа не работает с ключом через удаленный Рабочий стол!»‑ ну как‑то так.
Изволь поставить на свой компьютер и работать лично! Очень «удобно», когда у тебя их несколько в разных местах...

Конечно, для большинства это вообще неактуально, так как они живут в Windows, но я про свой случай говорю, а не про всеобщий.
И вот наконец‑то что‑то изменилось.

Читать далее

Потеря и восстановление данных 8 августа 2025 из-за беспечности в безопасности

Время на прочтение4 мин
Количество просмотров4.8K

После 22:00 у меня случилась проблема с диском U: ёмкостью 2 Гб — на нем частично исчезли файлы и папки, изначально мне показалось, что из-за аппаратного сбоя HDD, но потом я выяснил истинную ужасную причину, о которой нужно знать. Рассказываю, как я с этим боролся.

Читать далее

Автоматика через telnet

Время на прочтение3 мин
Количество просмотров4.3K

Я тут периодически пишу про всякие штуки, с использованием shell‑скриптов и разных linux‑утилит — в частности, чтобы лишний раз продемонстировать, что в линуксе не обязательно требуется «найти программу которая умеет делать ХХХХХ» — во многих случаях у вас уже есть всё необходимое, нужно только знать как использовать.

Вот, например, такая задача. У меня выход в интернет через роутер Keenetic. Роутеры эти неплохие, умеют, в частности, вести контроль работоспособности нескольких подключений, автоматически переключаться между ними.
Отвалилось соединение по каналу А — переходим на канал Б. Восстановилось — переходим обратно. Очень удобная функция.

До недавнего времени работало идеально, в том смысле что всё происходило само собой, и об обрыве канала А я узнавал только из воплей в местном чате.
Но с некоторого времени провайдер Б начал блокировать что не надо, и создавать проблемы на ровном месте, а поэтому потребовалось принимать некоторые меры безопасности.

Но для этого надо отлавливать факт переключения. И как это сделать, если роутер не умеет об этом как‑либо оповещать?

Читать далее