Articles / Profile of GRADDATA / Habr

Станислав Погоржельский@GRADDATA

ИТ Архитектор

Rating

Subscribers

ProfileArticles11PostsNewsComments148

GRADDATA Jul 3 at 06:45

Создание кластер-осведомлённого ИИ-агента с Kubernetes, Argo CD и GitOps

Medium

7 min

7.2K

VK Tech corporate blogKubernetes * DevOps * Development Management * Machine learning *

Retrospective

Translation

Команда VK Cloud перевела разбор запуска self-hosted (размещаемого на собственных мощностях), read-only ИИ-агента внутри кластера Kubernetes, где всю цепочку CI/CD обслуживают GitHub Actions и Argo CD Image Updater. Никакие данные не покидают кластер, облачные ИИ-провайдеры не задействованы.

GRADDATA Jun 23 at 09:17

Легаси-ОС как тормоз виртуализации: что меняет современный стек РЕД ОС в VK Cloud

Easy

11 min

9.5K

VK corporate blogVK Tech corporate blogVirtualization * Development for Linux * System administration *

Retrospective

Представьте гиперноду облака. Гипернода — это физический сервер с запущенным гипервизором, на котором работают виртуальные машины клиентов. Под дисками этих машин лежит программно определяемое хранилище Ceph: распределенная система, где данные размазаны по многим серверам с копиями, без отдельного дискового массива. Меняем на ноде одну переменную — операционную систему. Виртуальные машины не пересобираем, кластер хранения не трогаем, диски и сеть те же. Ни одной новой железки, ни строчки нового кода в приложении. После переключения дисковая подсистема ВМ ведет себя ощутимо иначе.

VK Cloud активно использует РЕД ОС от РЕД СОФТ — в том числе в VK Secure Cloud, аттестованном контуре для значимых объектов критической информационной инфраструктуры (ЗОКИИ). На ее примере покажу, как поднять производительность гипервизора, просто обновив легаси и не трогая железо. Вместе с дистрибутивом на ноду приезжает свежий стек целиком: ядро, эмулятор, клиент хранилища, системные библиотеки. Каждый слой подтягивает свой кусок. А для тех, кто застрял на CentOS, ушедшем в EOL, у истории есть вторая часть: обновление закрывает технический разрыв и регуляторику одним движением. Ниже разберу механику по слоям с командами, которые можно выполнить на своей системе.

+40

GRADDATA Jun 1 at 10:38

Как строить отказоустойчивые кластеры Kubernetes: краткий разбор от команды VK Cloud

Easy

8 min

VK corporate blogVK Tech corporate blogKubernetes * DevOps * IT Infrastructure *

Review

Миграция в облако и переход к микросервисной архитектуре сделали Kubernetes (k8s) де-факто стандартом для управления контейнерами. По данным 2025 года, технологию уже применяют 60% крупных российских компаний, а ещё 15% планируют внедрение в будущем. Причем 59% компаний называют отказоустойчивость ключевым критерием при выборе Kubernetes, но лишь единицы реализуют его на практике. Проблема кроется в недооценке системных рисков — от отсутствия резервирования control plane до некорректных таймингов readiness-проб, пропускающих «полуживые» поды в балансировщик.

В этой статье мы кратко разберем ключевые принципы проектирования и эксплуатации отказоустойчивых кластеров, типовые сценарии сбоев и рекомендации по исключению рисков на всех уровнях.

+26

GRADDATA May 28 at 12:47

Zero Trust для подрядного доступа: четыре слоя Identity, Device, Access и Monitoring

Medium

28 min

12K

VK Tech corporate blogVK corporate blogServer Administration * IT Infrastructure * Information Security *

Tutorial

По данным BI.ZONE, почти треть инцидентов с шифрованием в России в 2025 году пришлась на атаки через подрядчика.

Не через FW-периметр, а через легитимный канал: учетку внешнего исполнителя, общую сеть, привилегии, выданные под задачу и оставшиеся навсегда. Это разбор-практикум: как избежать подобного с помощью модели Zero Trust и как строится подрядный доступ, и как собрать такой контур у себя. Без теории ради теории — каждый слой идет с конкретными шагами, готовыми скриптами и проверкой, что у вас уже работает, а что нет. Материал для тех, кто проектирует или эксплуатирует доступ внешних исполнителей: ИБ-инженеров, архитекторов, системных администраторов.

Zero Trust для подрядного доступа строится по четырем слоям: Identity (кто подключается), Device (с какого устройства), Access (к чему и как) и Monitoring (что делал). Пройдем каждый слой по шагам: от IdP и MFA до Posture Check, ZTNA и VDI, PAM и мониторинга на SIEM, UEBA (User and Entity Behavior Analytics, аналитика поведения пользователей и сущностей) и SOAR, с кейсами, цифрами, схемами и двумя рабочими bash-скриптами для Linux.

Начать можно за одну рабочую неделю: аудит учеток, MFA на sudo, первые отчеты по забытым доступам. Полный контур занимает от нескольких месяцев до пары лет в зависимости от масштаба. К концу статьи у вас будет карта всех четырех слоев и понятный первый шаг, который реально сделать на своей инфраструктуре уже завтра.

+38

GRADDATA May 27 at 12:09

Дезагрегированный инференс LLM в Kubernetes: префилл, декодирование и планирование подов

Medium

20 min

7.4K

VK Tech corporate blogCloud computing * Machine learning * IT Infrastructure * Kubernetes *

Retrospective

Translation

С ростом сложности рабочих нагрузок инференса больших языковых моделей (LLM) единый монолитный процесс обслуживания упирается в свои пределы. У префилла и декодирования принципиально разные профили вычислений, но традиционные развёртывания заставляют их работать на одном оборудовании. В итоге GPU недозагружены, а масштабирование — негибкое.

Дезагрегированный инференс решает эту проблему: разбивает конвейер на отдельные этапы — префилл, декодирование и маршрутизацию. Каждый этап работает как независимый сервис, который можно обеспечивать ресурсами и масштабировать на собственных условиях.

Команда VK Cloud перевела статью, в которой разбирается, как развернуть дезагрегированный инференс в Kubernetes. Здесь мы посмотрим на разные решения экосистемы, как они работают в кластере и что дают «из коробки».

GRADDATA Feb 4 at 09:52

Миграция с VMware в 2026. Архитектурное сравнение альтернатив

Medium

16 min

13K

VK Tech corporate blogVirtualization * IT Infrastructure * Cloud services * DevOps *

Retrospective

По оценкам iKS-Consulting, в 2018 году платформу VMware использовали 78,8% компаний, которые применяют виртуализацию. Весной 2025 года в аналогичном исследовании указано, что доля отечественных решений в ПО виртуализации достигла 60,2%, а доля VMware оценивается в ~39% (оценка по данным анализа 19 крупнейших российских облачных провайдеров). То есть VMware-решения все еще заметны, но уже не доминируют так, как несколькими годами ранее

За несколько лет VMware в России прошла путь от «платформы по умолчанию» среди тех, кто виртуализирует, до одной из заметных, но уже не ведущих опций. Рынок быстро перераспределяется в пользу отечественных платформ — ради доступности поддержки и обновлений, управляемости процессов и соответствия требованиям в российских контурах.

В этой статье разберемся, как выбрать платформу виртуализации. Для этого вспомним краткую историю VMware и сравним подходы и классы платформ (On-Prem и у провайдера) с точки зрения эксплуатации, безопасности и миграции. В конце вас ждет чек-лист требований (включая ИБ/комплаенс) и таблица выбора по сценариям, чтобы быстро отсеять неподходящие варианты и собрать план перехода без сюрпризов на согласованиях с ИБ.

+10

GRADDATA Jan 20 at 11:04

Мультизональный PostgreSQL своими руками: декомпозиция трудозатрат

Medium

15 min

12K

VK corporate blogVK Tech corporate blogDatabase Administration * IT Infrastructure * Data storage *

Tutorial

Разговор о собственном PostgreSQL-кластере обычно начинается с фразы: «Да там поставить — день работы». Технически это правда. Установка PostgreSQL на два сервера в разных ЦОДах действительно занимает несколько часов. Проблема в том, что установка — это меньше 10% работы до Production-ready-состояния.

В этой статье мы декомпозируем все задачи, которые стоят между идеей развертывания и работающим кластером с отказоустойчивостью между ЦОДами. Все с оценками в человеко-часах, чтобы можно было собрать для себя TCO и сопоставить свои затраты. Учтите, что если все это вы делаете в первый раз, то по всем шагам время увеличивается втрое.

Параллельно покажем те же временные и трудозатраты при выборе Managed-решения, DBaaS (базы данных как сервис), чтобы вы могли сравнить и выбрать — делать дальше самим или передать это на аутсорс.

+41

GRADDATA Mar 27 2025 at 09:56

Объектное хранилище S3: практическое руководство без лишних слов

Easy

4 min

22K

VK Tech corporate blogVK corporate blogDevOps * Data storage *

Tutorial

✏️ Technotext 7

Объектное хранилище S3 стало стандартом для работы с большими объемами данных в облаке. Оно позволяет хранить файлы любого типа, легко управлять доступом и интегрироваться с другими сервисами. Но давайте без маркетинговых лозунгов: зачем это действительно нужно?

Меня зовут Станислав Погоржельский, я технологический евангелист VK Cloud, и в том числе в рамках своей работы рассказываю про наши облачные и on-prem решения. В этой статье мне захотелось поделиться, как именно объектное хранилище S3 помогает решать реальные задачи.

+36

GRADDATA Mar 18 2025 at 09:53

Оптимизация промышленных видеокарт для машинного обучения и нюансы тюнинга на примере A30, A100, L4 и L40s

Medium

10 min

4.4K

VK corporate blogVK Tech corporate blogCloud services * Video cardsCloud computing *

Tutorial

Чтобы эффективно осваивать вложенные в покупку или аренду GPU ресурсы, важно использовать весь потенциал видеокарт. Первые сложности возникают при настройке оборудования в контексте его потенциальных возможностей. С одной стороны — недостаточная утилизация ресурсов, с другой — бесконечное горизонтальное масштабирование и кратное удорожание ИТ-инфраструктуры.

В этой статье мы разберем базовые принципы и настройки оптимизации проверенных моделей GPU, чтобы эффективнее справляться с задачами машинного обучения. Посмотрим, как настраивать драйверы и библиотеки, управлять памятью, активировать Tensor Cores для ускорения вычислений, использовать технологию MIG для распределения задач и проводить разгон GPU для получения максимальной производительности. Следуя этим рекомендациям, вы сможете ускорить вычислительные процессы и сократить затраты на оборудование, увеличив эффективность работы с большими данными. Разбираться будем на примерах популярных моделей NVIDIA: A30, A100, L40s и L4.

Хочу больше знать

+34

GRADDATA Dec 22 2014 at 01:18

Как Ubuntu помогает сохранить ваш бизнес. Практика внедренца

5 min

27K

Configuring Linux *

Как Ubuntu помогает сохранить ваш бизнес. Практика внедренца.

Всем привет!
Всем мы знаем, как строить свой бизнес и даже уже успешно его ведём, но часто мало кто понимает, где можно и нужно экономить на ИТ обеспечении офиса, используя максимально эффективные инструменты.

Данная статья предназначена всем желающим перейти в открытый мир ИТ, а также внедренцам свободного программного обеспечения на рабочие станции.

UBUNTU вам поможет

Создание кластер-осведомлённого ИИ-агента с Kubernetes, Argo CD и GitOps

Легаси-ОС как тормоз виртуализации: что меняет современный стек РЕД ОС в VK Cloud

Как строить отказоустойчивые кластеры Kubernetes: краткий разбор от команды VK Cloud

Zero Trust для подрядного доступа: четыре слоя Identity, Device, Access и Monitoring

Дезагрегированный инференс LLM в Kubernetes: префилл, декодирование и планирование подов

Миграция с VMware в 2026. Архитектурное сравнение альтернатив

Мультизональный PostgreSQL своими руками: декомпозиция трудозатрат

Объектное хранилище S3: практическое руководство без лишних слов

Оптимизация промышленных видеокарт для машинного обучения и нюансы тюнинга на примере A30, A100, L4 и L40s

Рекомендации по выбору ЦОДа в России. Ликбез по услугам Дата-Центров

Как Ubuntu помогает сохранить ваш бизнес. Практика внедренца

Как Ubuntu помогает сохранить ваш бизнес. Практика внедренца.

Information

Specialization