Все потоки

DevOps *

Методология разработки программного обеспечения

283,69

Рейтинг

СтатьиПостыНовостиАвторыКомпании

SrvTrantor 11 мар в 09:01

Что происходит, когда у сервера заканчиваются файловые дескрипторы

Простой

5 мин

13K

Блог компании RUVDS.comСистемное администрирование * Серверное администрирование * Linux * DevOps *

Мнение

Сервер внезапно перестал отвечать, а в логах ошибка Too many open files? Дело не в нехватке памяти или перегруженном процессоре — просто ваш процесс исчерпал свои файловые дескрипторы. Под катом расскажу, что это такое, почему они заканчиваются, как быстро обнаружить проблему и как её пофиксить.

+37

Cloud4Y 11 мар в 07:12

Сети в Kubernetes: руководство для сетевого инженера

Средний

14 мин

12K

Блог компании Cloud4YDevOps * Kubernetes * IT-инфраструктура * Сетевые технологии *

OSPF, BGP, VLAN, ACL — вы знаете их как свои пять пальцев. А потом приходит Kubernetes и предлагает «просто описать желаемое состояние в YAML». Звучит как магия? На самом деле под капотом K8s работают всё те же сетевые протоколы, просто теперь их настраивает не инженер с консолью, а код в репозитории. Эта статья — мост между классической сетевой инженерией и миром контейнеров. Без маркетинга, только факты: veth-пары, BGP-пиринги Calico, DNAT в iptables и почему ClusterIP не пингуется.

Читать далее

+15

kubelet 11 мар в 05:01

Когда кластер решает, что ваш под «лишний»: гид по всем вариантам вытеснения

Средний

8 мин

7.7K

Блог компании ФлантDevOps * Kubernetes * Open source * Системное администрирование *

Перевод

В этой статье разбираются все случаи, когда под в кластере может исчезнуть сам — без kubectl delete и без вашего ведома. Перезапуск kubelet, нехватка памяти, taint с эффектом NoExecute, высокоприоритетный под в очереди планировщика — любой из этих сценариев способен остановить под, даже если вы настроили плавное завершение.

В конце удобная шпаргалка, чтобы держать ситуацию под контролем даже в небольшом кластере.

Читать далее

+11

SiYa_renko 10 мар в 18:55

Пора переезжать на локальные LLM. Или нет?

Простой

4 мин

17K

Блог компании OTUSИскусственный интеллектМашинное обучение * DevOps *

Мнение

Нет большой разницы в инструментах, когда речь идет о создании простеньких чат-ботов. Но когда вы работаете над продуктом посерьезнее, например создаете сложного AI-агента или работаете с чувствительными данными, облачные LLM начинают выставлять большие счета. И не только финансовые.

Что если переход на локальную инфраструктуру (вроде Ollama) это решение, которое не просто поможет сэкономить, но изменит саму динамику разработки?

Читать далее

+4

HappyTrashBin 10 мар в 14:16

Regex песочница

Средний

17 мин

6.8K

DevOps * Linux * Виртуализация * Регулярные выражения *

Из песочницы

В данной статье описывается процесс реализации песочницы для регулярных выражений с помощью платформы для контейнеризации Docker и утилит Linux. Цель - получить ограниченную среду, куда пользователь может подключиться по SSH и где у него будет минимум возможностей, чтобы он ничего не сломал, но мог свободно использовать регулярные выражения как со встроенными в среду txt заготовками, так и со своим произвольным пользовательским вводом.

Читать далее

+2

AnaltoliiZotov 10 мар в 13:00

Гайд по быстрому мониторингу Linux-хостов в Grafana без Zabbix

Простой

13 мин

10K

Блог компании МТССистемное администрирование * DevOps * Серверное администрирование * Linux *

Всем привет! Меня зовут Анатолий Зотов, я системный архитектор SOC в RED Security. Как центр мониторинга и реагирования на кибератаки, мы должны быстро и внятно видеть, что происходит с железом и ОС на хостах: не кончается ли место на диске, не улетела ли память и не уперся ли CPU в потолок. Как это реализовать, да еще и безопасно?

Когда мы только приступали к задаче, первой мыслью, конечно, был Zabbix, как и у половины планеты. Но у нас никто не горел желанием поднимать еще одну систему, раскатывать агенты, подбирать шаблоны и разбираться с нюансами. Времени, как обычно, не завезли. А вот Grafana у нас уже была, поэтому я подумал — а что, если просто использовать то, что уже есть? Так я и наткнулся на связку «node_exporter → Prometheus → Grafana».

Эта статья для тех, кто хочет быстро начать мониторить хосты и не готов тратить вечность на внедрение тяжелой системы, особенно если Grafana уже живет в вашей инфраструктуре. Если Grafana и Prometheus у вас еще нет, то дополнительно расскажу быстрый старт через Docker Compose.

Читать далее

+23

bpm_da_kidd 9 мар в 17:41

Между tail и ELK: пытаюсь собрать логи с нескольких серверов одной командой

4 мин

8.9K

DevOps * Linux * Python * Системное администрирование *

Из песочницы

Я студент, который только начинает заходить в devops‑тематику. Сам я не админ и не держу в проде десяток серверов, поэтому решил не выдумывать «боли» из головы, а посмотреть, на что реально жалуются люди в интернете.

Одна жалоба повторялась достаточно часто: «Когда что‑то падает, приходится обходить несколько серверов, смотреть логи по отдельности и пытаться сложить картину вручную. ELK/syslog решают, но ради пары сервисов это перебор.»

После этого я решил собрать небольшой прототип LogRanger — CLI‑утилиты, которая по SSH забирает логи с нескольких серверов и открывает их в lnav одной командой. Ниже коротко расскажу, какую проблему хочу закрыть и что именно делаю.

Читать далее

+1

Inessa_S 9 мар в 15:15

Почему DevOps-инженеров ищут месяцами

3 мин

12K

Карьера в IT-индустрииDevOps * Управление персоналом * Системное администрирование *

Аналитика

Из песочницы

На рынке IT-найма есть роли, которые закрываются относительно быстро: фронтенд, тестирование, иногда backend-разработка, но есть одна категория специалистов, поиск которых почти всегда превращается в долгую историю — DevOps-инженеры.

Иногда компания ищет такого специалиста 2–4 месяца, проводит десятки интервью — и всё равно не находит подходящего кандидата.

Почему так происходит? За последние годы работы с техническим наймом мы выделили несколько причин, которые повторяются практически в каждом поиске.

Читать далее

0

kmoseenk 9 мар в 09:50

Как ускорить создание реплики PostgreSQL: pgBackRest вместо pg_basebackup

Средний

13 мин

8.4K

Блог компании OTUSPostgreSQL * DevOps * Системное администрирование *

Кейс

Перевод

Создать реплику PostgreSQL на базе в 1 TiB — задача, где быстро выясняется, что NVMe и сеть в 75 Гбит/с сами по себе ничего не гарантируют: упираешься в инструмент, который копирует данные в один поток. В статье разбираемся, как обойти этот потолок с помощью pgBackRest и параллельной передачи, какие настройки реально влияют на скорость, где легко потерять порядок величины на «мелочи» вроде хранилища под spool, и почему в PostgreSQL 18 внезапно стало лучше — но недостаточно.

Открыть статью

+14

gtosss 8 мар в 23:22

Установка OpenStack через kolla-ansible

Средний

7 мин

9.4K

DevOps * Системное администрирование * Облачные вычисления * Серверное администрирование * Виртуализация *

Туториал

OpenStack — это ваш собственный «Self Hosted AWS». Звучит пугающе, но с kolla-ansible развернуть его можно за вечер. Рассказываю как — от ip addr show до рабочего дашборда Horizon. Гайд, которого мне не хватало на русском.

Читать далее

+2

pasalisdeaths1970 7 мар в 15:26

Docs as Code: документация, которая живёт вместе с кодом

Простой

3 мин

12K

Open source * DevOps * Git * Подготовка технической документации * Управление разработкой *

Из песочницы

Перевод

Это перевод статьи с opensource.com, которая мне показалась особенно полезной и практичной, поэтому решил поделиться адаптированной версией для русскоязычной аудитории. Оригинал доступен по ссылке: https://opensource.com/article/22/10/docs-as-code

В статье разбирается подход Docs as Code — способ встроить документацию в процесс разработки так, чтобы она проходила через Git, ревью и автоматическую сборку вместе с кодом. Материал будет полезен разработчикам, тимлидам и тем, кто выстраивает инженерные процессы в команде.

Читать далее

+8

Ilya519 6 мар в 13:11

Мониторинг того, что нельзя «пощупать»: как следить за cron-задачами, бэкапами и серверами за NAT с помощью Heartbeat

Средний

6 мин

12K

Системное администрирование * Python * DevOps *

Heartbeat-мониторинг — единственный способ проверить cron-задачи, фоновые процессы и устройства за NAT. Рассказываю, как работает эта технология в PingZen, и почему она проще и надежнее self-hosted решений.

Читать далее

+1

x4team_only 5 мар в 16:16

Как я искал замену MinIO S3 и написал свой S4 на Rust

Средний

6 мин

21K

Rust * DevOps * Linux * Хранение данных * Системное администрирование *

Из песочницы

В начале 2025 года компания MinIO в лице сооснователя Harshavardhana начала поэтапно сворачивать свою версию Community Edition. В феврале из open-source версии был вырезан веб-интерфейс администрирования - управление политиками, мониторинг, репликация, IAM - всё это переехало в коммерческий продукт AIStor с ценником от $96 000 в год. Пользователям оставили лишь базовый object browser и CLI-утилиту mc. В мае последовало удаление поддержки OIDC-аутентификации. В октябре MinIO прекратил публикацию Docker-образов и готовых бинарников - причём аккурат в момент раскрытия критической CVE-уязвимости. А в декабре 2025-го проект официально перешёл в режим maintenance mode: никаких новых фич, pull request'ы не принимаются, только точечные security-фиксы по усмотрению компании.

Читать далее

+82

antonromashka 5 мар в 11:16

Разворачиваем self-hosted Matrix: Synapse + OIDC + LiveKit + подписанные обновления

Сложный

9 мин

10K

Информационная безопасность * DevOps * Android *

Кейс

Из песочницы

Привет. Мне стало интересно, насколько реально одному разработчику собрать продакшн‑подобную инфраструктуру мессенджера без managed‑решений и облачной магии. Не стартап‑презентацию, а инженерный эксперимент: развернуть стек, заставить его жить, увидеть слабые места и понять, что в этой системе действительно критично.

На Хабре уже есть материалы про базовую установку Synapse + Element, но моя цель чуть другая - показать сборку, где к Matrix добавляется внешний слой идентификации (OIDC), VoIP‑инфраструктура (LiveKit + TURN) и механизм подписанных обновлений Android‑клиента.

В статье: архитектура, ключевые конфиги и границы ответственности компонентов. В следующих частях разберу грабли, потому что в этом стеке они не побочный эффект, а часть реальности.

Читать далее

+4

wizardloong 5 мар в 09:16

Я устал каждый раз собирать проект с нуля — и сделал универсальный Docker+Python-шаблон

Средний

5 мин

9.5K

DevOps * GitHub * Open source * Python * SaaS / S+S *

Из песочницы

Всем привет! Это моя первая статья на Хабре и я надеюсь и рассчитываю на вашу критику, дельные замечания, внимание и аплодисменты. Сим я начинаю серию статей посвящённых тому как создавать SaaS продукты, как подбирать нишу, как его собственно программировать и отлаживать, как выводить на рынок и всё в таком духе. Поделюсь своим опытом, так сказать.

Эта статья (и несколько последующих) будет посвящена сугубо технической части вопроса. Я расскажу о своём шаблоне для разработки и тестирования MVP, который ускоряет дело. Он у меня появился потому, что я любитель экспериментов и много раз делал разные микропроекты — боты, игры, сайты, парсеры и тому подобное В какой‑то момент я заметил что таскаю между проектами один и тот же кусок кода, который здорово ко всему подходит и с которого начинается каждый мой новый проект.

Итак, вашему внимаю представляю МЕГА ШАБЛОН УДОБНОГО БЫСТРОГО ПРОГРАММИРОВАНИЯ

«Чем же он так хорош?», спросите вы. И правильно сделаете что спросите! А я вам отвечу.

Читать далее более сильнее погнале

+2

NuGan 5 мар в 08:37

Мониторинга много, управляемости нет: «зонтик» — не ещё один мониторинг, а слой управления ИТ-ландшафтом

23 мин

5.7K

Блог компании MonqСистемное администрирование * Высоконагруженные системы * Анализ и проектирование систем * DevOps *

Казалось бы, сейчас мы наблюдаем всё, но факт в том, что не управляем ИТ-ландшафтом в целом. Упор на автономию команд и разрозненные инструменты приводит к «разрывам» в управлении: нет единой картины при инцидентах, SLA считаются в табличках, корреляция событий происходит «в головах людей», интеграции держатся на 1–2 специалистах, а построение CMDB и моделей ИТ ландшафта часто игнорируется. В этой статье мы постараемся переосмыслить роль зонтичного мониторинга, и докажем, что это не еще один мониторинг, а важный архитектурный слой.

Читать далее

+5

VitaliySemenov 5 мар в 07:57

Как я спроектировал Memory MCP Server для AI-агентов: архитектура, SQLite, semantic search и грабли

18 мин

5.5K

DevOps * Developer Relations *

Из песочницы

AI-агент каждую сессию начинает с нуля — не помнит, что вчера разбирали архитектуру, какие баги нашли и почему выбрали именно это решение. Знакомо?
Я сделал open-source MCP-сервер на Go, который даёт агентам persistent memory с semantic search. Один memory-layer для Cursor, Claude Code и Codex — чтобы контекст не терялся между инструментами.
В статье — не обзор, а инженерный разбор: схема БД, embedding pipeline с fallback между провайдерами (и почему я в итоге от этого отказался), in-memory cosine similarity вместо vector DB, RAG-индексирование с инкрементальным обновлением, и реальные промпты для агентов.
Отдельно разобрал грабли: почему fallback между разными embedding-моделями — это не отказоустойчивость, а источник тихих багов, и как я это починил.

Читать далее

+6

YukinoKingu 5 мар в 07:29

Google выпустила CLI-инструмент для управления Workspace и работы с LLM

2 мин

6.7K

Блог компании FirstVDSИскусственный интеллектСофтМашинное обучение * DevOps *

Обзор

Google опубликовал в открытом доступе Google Workspace CLI — инструмент для системных администраторов, DevOps‑инженеров и разработчиков, которые управляют корпоративной инфраструктурой. Это интерфейс командной строки для администрирования и автоматизации работы с сервисами Google Workspace. Проект размещён на GitHub.

Фактически, это удобная прослойка между API Google Workspace и вашей консолью. Вместо того, чтобы напрямую работать с REST‑запросами, настраивать OAuth и обрабатывать авторизацию, разработчики получают готовый CLI‑инструмент. В нём уже есть описанные скиллы (команды) для типовых операций — управления пользователями, группами, файлами Drive, Gmail и другими сервисами. Это особенно удобно при создании AI‑агентов и автоматизированных сценариев. LLM может вызывать конкретные команды CLI, не дергая API напрямую и не усложняя логику авторизации.

Читать далее

+4

jonniops 5 мар в 05:15

CRM, регуляторные ограничения и автоматизация: как мы выстроили надёжный процесс релизов

Средний

14 мин

7K

DevOps * Kubernetes * Git * Системы управления версиями * IT-инфраструктура *

Из песочницы

Как мы превратили стрессовые ручные релизы в предсказуемый one-click процесс с GitOps и автоматикой. 60+ модулей, аудиторы и регуляторика — в едином шаблоне, который масштабировался на 30+ сервисов. Без магии, но с инженерной дисциплиной

Читать далее

+1

Ilya519 4 мар в 18:09

10 900 тестов: Как мы обеспечиваем качество в PingZen, или Почему ваш мониторинг должен быть протестирован

Сложный

10 мин

8.2K

Kubernetes * Python * DevOps * Системное администрирование * Тестирование IT-систем *

Обзор

Мониторинг мониторинга - звучит как масло масляное, но именно этим мы постоянно занимаемся в PingZen. Ведь наш сервис должен быть надёжнее, чем объекты, которые он отслеживает. Если PingZen упадёт, кто сообщит о падении вашего сайта?

Сегодня я залезу под капот тестирования PingZen и расскажу, как мы дошли до 10 900 автоматических тестов (5100 на бэкенде и 5812 на фронтенде). Все цифры и технологии - строго из нашего репозитория . Без хайпа, только факты, код и архитектурные решения.А статью подробнее про Pingzen можете посмотреть здесь

Читать далее

+1

6

7 8 ...