Все потоки

Kubernetes *

ПО для работы с контейнерными приложениями

СтатьиПостыНовостиАвторыКомпании

@npoxopob 4 дек в 13:00

Кто следит за сторожем? Безопасная архитектура Gatekeeper в Managed Kubernetes

9 мин

7.1K

Блог компании VK TechБлог компании VKKubernetes * Разработка публичных облаков * Облачные сервисы *

Привет! Меня зовут Александр, я ведущий разработчик VK Tech в команде, которая занимается сервисом Kubernetes в нашем публичном облаке. Все чаще провайдеры отказываются от модели, где пользователь получает полный контроль над кластером и всеми управляющими компонентами, в пользу управляемых (managed) решений. В такой архитектуре вы остаетесь администратором внутри своего кластера — создаете неймспейсы, деплоите приложения, настраиваете RBAC, — но инфраструктура, control plane и системные компоненты полностью управляются провайдером и скрыты от глаз пользователя.

В начале декабря наша команда выпустила новый сервис managed-k8s, в котором как раз реализован такой подход. Я расскажу вам про то, как выглядит наш Kubernetes с точки зрения архитектуры и каким образом Gatekeeper делает архитектуру безопасной.

Читать далее

+17

@n1z3r 3 дек в 12:27

Как Karpenter помогает управлять динамическими нагрузками в Kubernetes

16 мин

7.2K

Блог компании SelectelKubernetes * Облачные вычисления * IT-инфраструктура * IT-компании

Туториал

Представьте ситуацию: ваше приложение в Kubernetes работает стабильно, но внезапно начинается пиковая нагрузка. Поды пытаются масштабироваться, HPA увеличивает их количество, но... они висят в статусе Pending. Почему? Потому что в кластере недостаточно ресурсов на нодах. Cluster Autoscaler должен добавить новые ноды, но процесс занимает много времени, иногда нода не создается из-за проблем с облаком. За это время пользователи уже получают ошибки 503, а вы теряете деньги. Знакомо?

А теперь обратная ситуация: нагрузка спала, поды удалились, но ноды продолжают работать вхолостую. Вы платите за простаивающие ресурсы, потому что Cluster Autoscaler слишком консервативен в удалении нод или не может оптимально «упаковать» workloads.

Есть ли способ сделать это быстрее, умнее и экономичнее? Меня зовут Даниил Кондрашов, я разработчик Managed Kubernetes в Selectel. В этой статье познакомлю вас с Karpenter — современным решением для автоматического управления нодами в Kubernetes, которое решает эти проблемы принципиально иначе. Подробности под катом!

Читать далее

+26

@ya-makariy 3 дек в 08:00

Планируем GPU-нагрузку в Kubernetes: от стандартных механизмов до кастомных решений

Средний

27 мин

5.6K

Блог компании Yandex Cloud & Yandex InfrastructureKubernetes * DevOps * IT-инфраструктура * Облачные сервисы *

Обзор

Привет, Хабр! Меня зовут Макарий, и как Senior SRE в Yandex Cloud я не только участвовал в разработке Managed Service for Kubernetes, но и всегда любил в свободное время посмотреть, что интересного понавыпускали для «кубика». Kubernetes, как де‑факто стандарт оркестрации контейнеров, предлагает базовые механизмы для управления вычислительными ресурсами. Однако стандартный планировщик Kubernetes (kube‑scheduler) разрабатывался с учётом общих принципов балансировки нагрузки и не специализирован для уникальных особенностей рабочих GPU‑нагрузок.

Предлагаю рассмотреть весь спектр возможностей — от встроенных механизмов шедулинга K8s до специализированных планировщиков, таких как Volcano, Apache YuniKorn и KAI‑Scheduler. Проанализирую конкретные сценарии, в которых каждый из этих инструментов демонстрирует свои преимущества, и предложу рекомендации по выбору оптимального решения для ваших рабочих GPU‑нагрузок.

Читать далее

+16

@Andrey_Biryukov 2 дек в 15:26

От CI к каталогу Kubernetes: создание компонуемой платформы с помощью GitOps и vCluster

Средний

7 мин

5.8K

Блог компании OTUSKubernetes * DevOps *

Обзор

Перевод

Многие команды уже построили вокруг Kubernetes свои внутренние платформы, но со временем они превращаются в свалку YAML’ов и разрозненных Helm-чартов. В статье показывается, как собрать из этого аккуратный «конструктор» из трёх уровней компоновки (инфраструктура, сервисы платформы, приложения), завязать всё на GitOps через Argo CD и vCluster, а затем скрыть сложность за шаблонами и CRD, чтобы разработчику было достаточно описать один WebApp-ресурс вместо возни с десятком сущностей Kubernetes.

Читать далее

+4

@anyu87 2 дек в 15:04

IPsec, GRE, BGP и немного автоматизации для высокой доступности вашей сети

Сложный

21 мин

8.1K

Блог компании VK TechБлог компании VKKubernetes * DevOps * IT-инфраструктура *

Туториал

Построение отказоустойчивой гибридной сети между локальной инфраструктурой и облаком — одна из ключевых задач при миграции. Стандартных решений здесь не существует: выбор архитектуры и технологий зависит от требований безопасности, производительности и желания избежать vendor lock-in.

Я хочу показать один из способов решения такой задачи на примере облака VK Cloud с учетом специфики его SDN-сети. Отдельно хочется добавить, что рассматриваемый в статье подход к построению сетевой связности может быть успешно применен не только в VK Cloud.

В основу статьи легли вопросы и задачи, с которыми клиенты часто обращаются к командам Presale архитекторов и Professional services VK Cloud, когда они хотят построить надежное гибридное решение для своего бизнеса.

Мне хотелось написать статью, которая будет не научно-популярным повествованием, а практическим руководством, систематизирующим имеющиеся знания по разным продуктам и сетевым технологиям.

Читать далее

+19

@CTSG 2 дек в 13:44

Как создать решение в области контейнерной безопасности: подводные камни, проблемы и их решение

Средний

9 мин

7.1K

Блог компании Crosstech Solutions GroupKubernetes * IT-инфраструктура * IT-компании

Ретроспектива

Всем привет! На связи Александр Синичкин, ведущий архитектор CTCS – CrossTech Container Security – решения для обеспечения комплексной безопасности контейнерных сред: от сканирования образов до контроля запуска рабочих нагрузок и реагирования на инциденты в средах выполнения. Сегодня я расскажу, как и почему мы решили разрабатывать продукт CTCS, с какими сложностями столкнулись и каких ошибок могли бы избежать, куда планируем развиваться.

Читать далее

+8

@genie_zs 2 дек в 12:45

Kprobes и где они обитают

Средний

25 мин

7.5K

Блог компании Positive TechnologiesИнформационная безопасность * Kubernetes * Облачные сервисы * Программирование *

Туториал

Про eBPF уже сказано и написано достаточно много, поэтому я хочу сделать следующий шаг и чуть глубже рассмотреть практические аспекты работы c таким механизмом, как kprobe, который позволяет использовать функции ядра Linux для динамического запуска пользовательского кода.

Статья поможет ответить на вопросы:

- Как понять, какую функцию ядра выбрать для использования с механизмом kprobe?

- С чего начать ее поиск?

- Какими инструментами пользоваться?

kprobe — это, по сути, ловушка, или брейкпоинт, который можно установить почти в любом месте кода ядра Linux.

Читать далее

+14

@endevir 2 дек в 09:00

Как и зачем мы написали собственное опенсорс-решение для бэкапов CloudNativePG в Stackland

Средний

11 мин

6.5K

Блог компании Yandex Cloud & Yandex InfrastructurePostgreSQL * Kubernetes * DevOps * Open source *

Всем привет! В этой статье поговорим про бэкапы PostgreSQL в Kubernetes через призму самого популярного опенсорс-оператора для этой СУБД — CloudNativePG. Мы расскажем о том, как внедрение нового решения на основе WAL-G позволило ускорить резервное копирование и восстановление больших баз данных и поделимся своим опытом доработки CloudNativePG.

На связи Иван Архипов, ведущий разработчик в команде платформы данных в Yandex Cloud, и я приглашаю под кат всех, кому интересна эксплуатация PostgreSQL в Kubernetes!

Читать далее

+28

@MaxRokatansky 29 ноя в 11:17

Управление сервисами в Kubernetes или как заставить их общаться

Простой

5 мин

7.4K

Блог компании OTUSKubernetes * DevOps * Системное администрирование *

Туториал

Kubernetes — это фундамент современных микросервисных архитектур, оркеструющий миллионы контейнеров по всему миру. Но что происходит, когда одному сервису нужно «поговорить» с другим? Как они находят друг друга в динамической среде, где поды постоянно создаются и уничтожаются?

Управление сервисами в Kubernetes — это мост между изолированными контейнерами, обеспечивающий надежную коммуникацию в условиях постоянных изменений. В этой статье мы разберем ключевые абстракции для управления сетевым взаимодействием в Kubernetes на примере миникуба (minikube).

Разобраться с k8s

+3

@chemtech 29 ноя в 08:04

Инструкция по настройке Удостоверяющего Центра (CA) на базе HashiCorp Vault и OpenSSL в Kubernetes

Средний

15 мин

7.7K

DevOps * Kubernetes * Информационная безопасность *

Туториал

Эта инструкция представляет собой полное руководство по развертыванию отказоустойчивого кластера HashiCorp Vault в Kubernetes и настройке двухуровневой Public Key Infrastructure (PKI). Корневой сертификат и промежуточный CA создаются через OpenSSL, но промежуточный импортируется и настраивается в Vault для повседневного выпуска сертификатов. Инфраструктура интегрируется с cert-manager для автоматического управления жизненным циклом TLS-сертификатов.

Читать далее

+12

@kubelet 28 ноя в 06:38

Завис PVC? Виноват финализатор

4 мин

7.5K

Блог компании ФлантDevOps * Kubernetes * Системное администрирование *

Перевод

Почему kubectl delete pvc не всегда приводит к удалению тома? В статье — детальный разбор механизма финализаторов, роль PVC Protection Controller, типичные причины зависаний и безопасные способы диагностики и восстановления.

Читать далее

+11

@ilya-lesikov 27 ноя в 12:09

Nelm vs Helm 4: что изменилось с новым релизом Helm и почему Nelm всё ещё лучше

Средний

7 мин

9.5K

Блог компании ФлантOpen source * Kubernetes * DevOps * IT-инфраструктура *

Обзор

Helm 4 принёс пользователям единственное значимое изменение — внедрение Server-Side Apply вместо 3-Way Merge. Это решает проблемы с некорректными обновлениями ресурсов, но многих возможностей Helm по-прежнему не достаёт.

Nelm — наша современная альтернатива Helm 4 — ушёл вперёд по фичам, исправлениям и улучшениям. В статье смотрим на новые возможности обоих проектов, детально разбираем их отличия и объясняем, что ждёт Nelm дальше.

Читать далее

+25

@Up4Soft 27 ноя в 10:17

Масштабируемый мониторинг: Настраиваем VictoriaMetrics в HA-конфигурации с VMAgent и Grafana

Средний

6 мин

5.7K

DevOps * Системное администрирование * Kubernetes * Базы данных * Распределённые системы *

Сегодня мы построим масштабируемую, отказоустойчивую систему, которая будет расти вместе с вашей инфраструктурой и не сломается в самый неподходящий момент.

Вместо 3 часов дебага падающего Prometheus вы смотрите дашборд, который показывает 99.9% uptime вашего мониторинга.

Это реальность с правильно настроенным стеком на основе VictoriaMetrics.

Читать далее

+2

@JCD3nt0n 26 ноя в 08:38

Tetragon: лучшие практики и нюансы разработки Tracing Policy

Сложный

29 мин

6.9K

Блог компании Positive TechnologiesИнформационная безопасность * Kubernetes * Сетевые технологии * Настройка Linux *

Туториал

Привет! Меня зовут Виталий Шишкин, я эксперт продукта PT Container Security. За годы работы над продуктом MaxPatrol 10 мы строили аудит Linux на базе подсистемы auditd, которая решала свою задачу и достаточно просто настраивалась, но ситуация поменялась с появлением контейнеров, которые auditd корректно поддерживать не умеет. Поэтому эта задача потребовала не просто смену решения для аудита системы, но и создание целого продукта, который сможет учитывать особенности Kubernetes и используемые им технологии ядра Linux.

Читать далее

+11

@fishday 25 ноя в 07:35

Обзор Moco — MySQL-оператора для Kubernetes

Простой

15 мин

5.8K

Блог компании ФлантDevOps * Kubernetes * MySQL * Базы данных *

Обзор

В Kubernetes короткий жизненный цикл подов — норма. Но когда лидер-узел MySQL внезапно исчезает, рискуешь потерять не только доступность, но и согласованность данных. Оператор Moco предлагает решение: полусинхронная репликация, автоматический failover и восстановление с PITR — всё это без боли миграции на полностью синхронную репликацию.

В статье — детали репликации, бэкапов, PITR, switchover и нюансов работы с пользовательскими образами. А также честно — чем он лучше (и хуже) альтернатив, и стоит ли его рассматривать для продакшена.

Читать далее

+7

@ZiminAV 21 ноя в 07:41

Cloud Native LVM: как автоматизировать поиск и разметку локальных дисков в Kubernetes

Простой

13 мин

8.2K

Блог компании ФлантСистемное администрирование * Kubernetes * Open source * Хранение данных *

Всем привет, меня зовут Александр Зимин, я руковожу разработкой подсистемы хранения данных в Deckhouse. Сегодня хочу поговорить о хранении данных на локальных дисках в Kubernetes и поделиться тем, как мы автоматизируем их поиск и разметку для администраторов и пользователей.

Читать далее

+13

@sergbe 21 ноя в 07:04

Рецензия на книгу «Инжиниринг платформ: техническое и управленческое руководство»

Простой

9 мин

7.6K

Блог компании SSP SOFTОблачные сервисы * Kubernetes * DevOps * Системное администрирование *

Мнение

На календаре 2025 год, и термин platform engineering прочно вошел в лексикон всех инженеров и менеджеров, занимающихся вопросами ИТ-инфраструктуры предприятий — примерно так же, как когда-то «DevOps», а еще раньше «Agile». К слову, предыдущие тренды порой превращались в модный хайп, под которым каждая компания понимала свое видение процессов разработки и развертывания. Но платформенная инженерия сегодня — это не просто набор практик, а системный ответ на тот уровень сложности, к которому индустрию привели облака, микросервисы, CI/CD, SRE и бесконечный поток обновлений в экосистемах OSS (Open Source Software, мир open-source инструментов).

Читать далее

+16

@RMEngy 20 ноя в 10:27

Вооружаемся против мусорных кластеров: как автоматизировать уход за Kubernetes

7 мин

6.7K

Блог компании Cloud.ruСистемное администрирование * Облачные сервисы * Kubernetes *

Привет! Меня зовут Роман Христевич, я DevOps-инженер в Cloud.ru, занимаюсь плагинами и безопасностью для кластеров Kubernetes. Сегодня расскажу, как я сражался с ветряными мельницами — мусором в кластерах Kubernetes после тестирования релизов, рандомных Helm Chart и просто в автотестах. И как я эти мельницы все-таки одолел.

Если вы DevOps, SRE или системный администратор, то вам не раз и не два приходилось вычищать кластеры от отработанных Jobs в статусе Complete или Configmaps с Secrets, которые создали руками для уже раскатанного Helm Chart. Разовая акция не вызывает особых забот, а вот если это надо делать несколько раз в неделю, это уже проблема или даже боль.

Под катом я расскажу, как прошел путь, усеянный граблями, от самописных решений до K8s-cleaner, и почему я теперь доволен. Если ты еще не прошел мой путь, приглашаю под кат!

Интересно

+9

@CocaineMaster 20 ноя в 03:48

Мой путь в IT: от iOS до техлида в Альфа-Банке

Простой

2 мин

4K

IT-компанииIT-инфраструктура * Kubernetes * Аналитика мобильных приложений * Интервью

Обзор

Когда-то я просто хотел писать мобильные приложения. Никаких планов «стать техлидом», «управлять командами» или «строить архитектуру» у меня не было. Я просто любил разбираться в технологиях и доводить фичи до ума.

Но как это обычно бывает, если долго и упорно копать в одном направлении — горизонт начинает расширяться.

Расскажу коротко, как это произошло у меня.

Читать далее

-9

@sysbes 18 ноя в 12:42

Сколько производительности съедает Kubernetes: сравниваю native PostgreSQL и CloudNativePG в Yandex Cloud

Средний

14 мин

13K

DevOps * PostgreSQL * Kubernetes * Системное администрирование *

Кейс

В этой статье я руками сравнил производительность PostgreSQL на «голой» VM в Yandex Cloud и в кластере CloudNativePG в Kubernetes. Один и тот же конфиг, одинаковые ресурсы, fio и pgbench, несколько типов хранилищ — и просадка до ~40% при работе через cnpg.

Разбираемся, где теряются TPS: на диске, в сети или в оболочке k8s, показываем все цифры в таблицах и схемах прохождения запроса «до VM» и «до Pod’а» — и в конце честно отвечаем, стоит ли игра свеч.

Читать далее

+9

1

2 3 ...