Все потоки

Kubernetes *

ПО для работы с контейнерными приложениями

СтатьиПостыНовостиАвторыКомпании

@nordby 4 окт в 22:33

SLO-Scout: AI для автоматического создания SLO и SLA в SRE

Средний

3 мин

5.7K

DevOps * Google Cloud Platform * IT-инфраструктура * IT-стандарты * Kubernetes *

Обзор

Представьте: у вас десятки микросервисов, миллионы логов и трассировок, а ваша задача — поддерживать SLA и не дать системе сломаться. Ручная настройка SLO (Service Level Objectives) и мониторинг SLI (Service Level Indicators) превращается в кошмар.

SLO-Scout решает эту проблему с помощью AI, анализа телеметрии и автоматизации, позволяя SRE сосредоточиться на надежности, а не на ручной рутине.

Читать далее

0

@nikwebzer0 2 окт в 18:20

K8S для самых маленьких или как поднять отказаустойчивый кластер k8s. Часть 1

Средний

6 мин

11K

Kubernetes * DevOps * *nix * Виртуализация *

Из песочницы

Еще до открытия для себя практик Dev-ops я использовал Docker для упаковки и быстрой доставки кода на сервера (всё делалось ручками, я еще не знал про CI/CD xD). Со временем мои приложения становились больше, появлялись микросервисы, убирался монолит. И управлять ручками или через Portainer всей архитектурой было слегка сложновато. Простой, куча вопросов, падение контейнеров, рост нагрузки и все в этом духе. Тогда-то я и открыл для себя кубер.

Познать кубер

+3

@MaxRokatansky 1 окт в 16:07

Инфраструктура без боли: Kubernetes Security, GitOps, Kafka, Angie — что изучить в октябре

Простой

4 мин

9.6K

Блог компании OTUSСистемное администрирование * DevOps * Kubernetes *

Дайджест

Привет, Хабр. Это октябрьский дайджест по инфраструктуре и данным: безопасность Kubernetes, IaC и GitOps, Kafka и балансировка в Angie, Postgres 17/FDW, OpenSearch, файловые системы Linux и многое другое. В нем мы рассказываем об актуальных программах, а также приглашаем на бесплатные уроки от экспертов индустрии. Каждый сможет найти что-то полезное для себя.

Все темы выпуска

+8

@About_it 30 сен в 13:01

Что такое DevOps и почему он автоматизировал не всё

Простой

10 мин

25K

Блог компании RUVDS.comDevOps * Системное администрирование * IT-компанииKubernetes *

Обзор

Вы сделали заказ в интернет-магазине, а он внезапно завис в самый разгар скидок. За кулисами этого сервиса работают сотни строк кода и ещё больше человеческой поддержки. DevOps — это способ организовать эту работу так, чтобы новые функции доходили до вас быстрее и без сбоев. Он объединяет разработчиков, тестировщиков и операторов, автоматизируя рутинные шаги и следя за сервисом в режиме реального времени. Звучит хорошо, но на практике автоматизация закрывает далеко не всё.

В статье рассмотрим, что за зверь такой DevOps. Когда работает, а когда спотыкается и где автоматизация работает, а где нужна платформа и процессы. Даже если вы не айтишник — переходите под кат.

Читать далее

+60

@yalosev 30 сен в 07:03

NeuVector в современной Kubernetes-инфраструктуре: почему мы не рекомендуем его для production

8 мин

4.9K

Блог компании ФлантСистемное администрирование * Open source * Kubernetes * Информационная безопасность *

Обзор

Недавно мы реализовали интеграцию NeuVector с Deckhouse Kubernetes Platform по запросу сообщества. Тем не менее наш практический опыт показывает, что NeuVector нельзя считать надёжным инструментом обеспечения безопасности кластеров и контейнеров в production-средах.

В статье ~~набрасываем на вентилятор~~ приводим аргументы, подтверждающие эту позицию, несмотря на отдельные сценарии, когда использование NeuVector может быть оправдано. А ещё предлагаем современные и надёжные Open Source-альтернативы.

Читать далее

+17

@lyova 29 сен в 14:17

Как мы в Авито автоматически лечим ноды в Kubernetes

Средний

9 мин

15K

Блог компании AvitoTechKubernetes * Системное администрирование * DevOps *

Кейс

Привет, Хабр! Это Станислав Егоркин, инженер юнита k8s департамента разработки Infrastructure в Авито. В одной из своих прошлых статей я описал, как мы детектируем проблемы на нодах Kubernetes-кластеров. Логичным продолжением этой работы стала автоматизация их лечения. В этой статье я расскажу, как у нас устроены механики Auto Healing.

Читать далее

+39

@badcasedaily1 29 сен в 07:21

Планирование на основе фактического потребления: VPA в Kubernetes

Простой

8 мин

5.4K

Блог компании OTUSKubernetes * Программирование *

Обзор

Привет, Хабр!

Помните тот момент, когда вы в очередной раз выставляли requests и limits для вашего пода, основываясь на... чем, собственно? На глазок? На данных «ну там вроде 128 мегабайт хватает»? На результатах пятиминутного стресс‑теста, который показал, что под нагрузкой нужно 2 ядра? Мы все через это проходили. Получается классическая ситуация: либо мы недодаем ресурсов, и наш падает от OOMKilled в самый неподходящий момент, либо мы перестраховываемся и заливаем в него гигабайты памяти и ядра, которые он использует раз в год под Новый Год, а кластер тем временем плачет от нехватки нод.

Горизонтальное масштабирование (HPA) — наш спаситель, он известен всем и каждому. Увеличилась нагрузка — запустил еще пару копий приложения. Красиво. Но что, если само приложение не очень‑то умеет работать в несколько копий? Или если нагрузка не «всплесковая», а просто приложение со временем начало есть больше памяти из‑за роста данных? Тут подходит менее раскрученный, но полезный коллега — Vertical Pod Autoscaler (VPA).

Идея VPA до проста: он смотрит на фактическое потребление ресурсов вашими подами и говорит: «твоему приложению на самом деле нужно не 100 милликор, а стабильно 150, давай исправим эту несправедливость». А в продвинутом режиме он не просто говорит, а берет и делает. Главная загвоздка, из‑за которой многие плюются — для применения новых лимитов под нужно перезапустить, это downtime, но эту проблему можно и нужно грамотно обойти.

Читать далее

+7

@yimgzz 25 сен в 13:44

Как мы подружили Tarantool с Kubernetes

Средний

11 мин

5.9K

Блог компании BercutTarantool * DevOps * Kubernetes * Базы данных *

Кейс

Привет, Хабр! Я — Калашников Сергей, DevOps‑инженер в Центре Перспективных Разработок (ex. R&D) компании Bercut. Cегодня поделюсь опытом внедрения систем на базе Tarantool и Tarantool Vshard в оркестратор Kubernetes.

Tarantool — платформа, которая включает в себя in‑memory базу данных, а также встроенный сервер приложений. На базе этой платформы наша команда разрабатывает различные информационные системы, расширяя функциональность с применением языков Lua, Rust, C\C++.

Несмотря на все очевидные плюсы Tarantool, он не является тривиальным в части конфигурирования и bootstrap. Это привело нас к разработке Operator для Kubernetes, который обеспечивает развертывание и конфигурирование кластеров на базе Tarantool и Tarantool Vshard.

Читать далее

+18

@runity 25 сен в 11:30

Kubernetes упрощает жизнь. Но какой ценой? Helm, KaaS и выводы из практики

Простой

6 мин

8.6K

Блог компании РунитиОблачные сервисы * Облачные вычисления * Разработка публичных облаков * Kubernetes *

Мнение

Привет, Хабр! На связи Тимур Парфёнов, директор департамента эксплуатации Рунити. Сегодня поговорим о Kubernetes. Точнее — о том, почему он стал стандартом де-факто для оркестрации контейнеров и зачем большинству проектов нужен Kubernetes как сервис (KaaS). Статья будет особенно интересна тем, кто еще не знаком с K8s или только планирует его использовать в разработке. Ну, а старичков приглашаю тоже — присоединиться к обсуждению болей и радостей этой технологии.

Читать далее

+3

@monreve 24 сен в 11:00

Как снять метрики со служебных подов кластера Kubernetes

Средний

9 мин

8.1K

Блог компании SelectelKubernetes * IT-инфраструктура * Облачные сервисы *

Туториал

Мониторинг служебных компонентов Kubernetes в пространстве kube-system часто остается за пределами первоначальной настройки кластера. Однако стабильность таких компонентов как kube-apiserver, kube-scheduler и kube-controller-manager напрямую определяет работоспособность всей системы. Сбор метрик с этих подов требует точной настройки механизма обнаружения и безопасного доступа к их эндпоинтам.

Привет, Хабр! Меня зовут Катя Низовцева, я системный администратор в Selectel. В этой статье я покажу практическую методику развертывания vmagent с помощью Helm и настройки конфигураций для сбора метрик с ключевых системных компонентов. Это обеспечит видимость их состояния без избыточной сложности. Мы увидим в Victoria Metrics Cluster метрики, снимаемые с подов в служебном неймспейсе kube-system. Но обо всем по порядку.

Читать далее

+42

@randall 23 сен в 13:36

Безопасность Kubernetes: статьи и руководства про защиту кластеров

Простой

4 мин

7.6K

Блог компании MWSDevOps * Kubernetes * Информационная безопасность * Системное администрирование *

Обзор

Недавно мы представили MWS Container Platform — платформу для управления приложениями и инфраструктурой на базе Kubernetes. А сегодня в статье предлагаем взглянуть на гайды по теме ИБ при работе с оркестратором: базовые материалы для начинающих, референсы для опытных инженеров и разборы распространенных ошибок. В целом материалам будет полезен системным администраторам, DevOps-инженерам и тем, кто начинает работать с Kubernetes.

Читать далее

+6

@aiko158 21 сен в 15:45

Как мы внедряли Dynatrace в банке для мониторинга Kafka, БД и Java/C++ сервисов

Средний

15 мин

8.3K

Java * DevOps * Kubernetes * C++ *

Из песочницы

Я работаю в одном крупном российском банке, где занимаюсь разработкой распределённых систем. За последние несколько лет наша архитектура заметно усложнилась — часть сервисов работает в OpenShift, часть на виртуалках, а кое-что до сих пор крутится на «железе».

Основная боль заключалась в том, что у нас не было единой системы мониторинга. Метрики мы собирали из разных источников: где-то стоял Prometheus, где-то — Zabbix, в Kafka писали свои дашборды, а для C++ приложений вообще не было нормального мониторинга. Каждый инцидент превращался в расследование: мы переключались между тремя-четырьмя консолями, сверяли логи, писали временные скрипты для выгрузки метрик. В среднем на поиск корневой причины (root cause analysis) у нас уходило от нескольких часов до пары дней.

Читать далее

+6

@kubelet 19 сен в 06:57

Как Vertical Pod Autoscaler пошёл вразнос и уронил наш кластер

Средний

10 мин

5.6K

Блог компании ФлантKubernetes * DevOps * Системное администрирование *

Кейс

Autoscaler призван оптимизировать ресурсы CPU и памяти кластеров. Но что, если он сам становится источником проблем? Обычный алерт о пропавших метриках обернулся расследованием на всю ночь. Шаг за шагом команда выясняла, почему VPA начал агрессивно пересоздавать поды, пока не дошла до скрытой настройки, едва не похоронившей кластер. Подробности в статье.

Читать далее

+16

@ylismir 18 сен в 10:21

Автомасштабируем узлы кластера Kubernetes. Часть 2

11 мин

4.4K

Блог компании Cloud.ruIT-инфраструктура * Облачные сервисы * Kubernetes * DevOps *

Всем привет! Это вновь Илья Смирнов, архитектор решений из Cloud.ru. В прошлой статье мы рассмотрели традиционные подходы к масштабированию подов и узлов кластера Kubernetes. Но остался нерешенным вопрос — как масштабировать приложение по событиям из внешней системы? Ведь мы хотим, чтобы каждое новое сообщение в очереди RabbitMQ масштабировало нагрузку вверх, реализовать event-driven подход и масштабировать приложение не по метрикам утилизации ресурсов, а по факту появления новых событий от внешних систем. Так как же быть?

Я предлагаю использовать решение KEDA 😉

Читать далее

+1

@Russtech 17 сен в 13:00

DOOH и RTB: как Russ развивает программатические закупки в наружной рекламе

Простой

7 мин

5.7K

Блог компании Wildberries & RussBig Data * Kubernetes * .NET *

Обзор

Привет, Хабр! С вами команда Russtech. Сегодня мы хотим рассказать о работе Russ Programmatic, нашего подразделения, разработавшего систему продажи рекламного инвентаря с помощью аукционов в реальном времени. Программатик в DOOH имеет ряд отличий от традиционного digital-программатика. В этой статье мы обсудим эти ключевые особенности и поделимся нашим опытом внедрения программатических продаж.

Читать далее

+5

@fourwingedsun 17 сен в 08:47

Технологии высоких нагрузок: как обеспечить стабильность сервиса в пик активности

Сложный

5 мин

4.4K

Блог компании ЮMoneyВысоконагруженные системы * Тестирование IT-систем * Платежные системы * Kubernetes *

Кейс

Привет, меня зовут Анатолий, я руковожу группой нагрузочного тестирования в ЮMoney. Началась осень, и не за горами сезон распродаж: магазины уже готовятся к пиковым нагрузкам, продумывают акции и спецпредложения, обновляют ассортимент, договариваются с поставщиками. ЮKassa, наш сервис электронных платежей, тоже в ожидании сезона скидок. В этой статье я расскажу, как мы к нему готовимся, что помогает нашей системе выдержать пиковые нагрузки и как сделать так, чтобы все клиенты остались довольны.

Читать далее

+4

@nastyakopi 12 сен в 08:00

Кастомные флейворы, интеграция с сервисом логов в DBaaS и другие апдейты августа в продуктах Selectel

3 мин

7K

Блог компании SelectelИнформационная безопасность * IT-инфраструктура * IT-компанииKubernetes *

В августе мы добавили аддоны в Managed Kubernetes, обновили конфигурации выделенных серверов и парольную политику в IAM. И не только. Все подробности — под катом.

Читать далее

+53

@Borislitv 10 сен в 07:00

Всё переписать: запускаем Cilium dualstack overlay поверх IPv6 underlay

Средний

8 мин

7.7K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureKubernetes * IT-инфраструктура * Сетевые технологии *

На связи Борис Литвиненко из команды NOCDEV в Yandex Infrastructure — наша группа занимается автоматизацией сетей всего Яндекса. В прошлом году я уже рассказал о том, как и почему наши сетевые сервисы живут на отдельном железе с развёрнутым k8s‑кластером, избегая кольцевых зависимостей с остальной инфраструктурой компании. Среди прочего на тот момент мы использовали Calico VXLAN — с нашим разнообразным железом нам был нужен overlay, а Cilium тогда не умел работать с IPv6 для VXLAN. Однако всё меняется.

В 2025 году попытка включить Calico eBPF в нашем K8s‑кластере вылилась в запуск Cilium, в новом релизе которого как раз добавили поддержку IPv6 underlay для VXLAN. Поэтому сегодня я расскажу, как мы вместе с Кириллом Глушенковым @kglushen протестировали новый Cilium 1.18 — а заодно перешли с самописных salt‑рецептов для kubeadm на kubespray, столкнулись с не такими уж простыми особенностями dualstack, а ещё немного повайбкодили. Под катом — все наши приключения с нелинейным сюжетом.

Читать далее

+29

@mkv_rinat 9 сен в 08:05

Canary-деплой в Kubernetes с использованием Argo Rollouts и Istio

Средний

12 мин

7.6K

Блог компании ФлантDevOps * Kubernetes * IT-инфраструктура *

Туториал

Мы не раз разбирали в своём блоге теорию и практику по разным стратегиям развёртывания новой версии приложения в Kubernetes. Сегодня рассмотрим ещё одну реализацию канареечного деплоя: с пассивными healthcheck и использованием Argo Rollouts и Istio. Этот вариант подойдёт, если к вашему приложению обращаются не через Ingress, а ходят внутри кластера по адресу service. Или если вы хотите видеть, что происходит с пользовательским трафиком на каждом из этапов обновления.

Читать далее

+31

@kubelet 5 сен в 07:16

От минут к секундам: как в Sealos сократили время активации для 20К+ доменов

Средний

8 мин

5.2K

Блог компании ФлантKubernetes * DevOps * Системное администрирование *

Кейс

Перевод

Sealos удалось сократить время активации доменов на Kubernetes с 10 минут до всего 5 секунд. В статье раскрыты технические детали оптимизации Ingress с помощью Higress, Istio и Envoy, а также оригинальные алгоритмы и подходы, которые помогли преодолеть узкие места и улучшить масштабируемость кластера. Читайте, как повысить производительность и надёжность своей инфраструктуры.

Читать далее

+4

4

5 6 ...