Инфраструктура для ИИ-ассистента: как собрать рабочую систему
AI-ассистенту нужна не только языковая модель. Чтобы сервис стабильно отвечал пользователям, работал с корпоративными документами и выдерживал нагрузку, важно заранее продумать вычисления, хранение данных, контекст, безопасность, мониторинг и масштабирование.
В новой статье разобрали, из каких компонентов состоит инфраструктура для AI-ассистента. Показали, где достаточно CPU и внешнего API, а когда нужны GPU и собственный инференс. Отдельно рассказали про хранение документов и истории диалогов, векторный поиск, RAG-пайплайны, контейнеризацию, Kubernetes и различия между MVP и production-архитектурой.
Сервер для PyTorch: как выбрать конфигурацию под обучение и инференс
PyTorch запустится почти на любом сервере, но между «запустится» и «работает стабильно под нагрузкой» — большая разница. Частая ошибка — выбирать VRAM по размеру модели, но видеопамять занимают контекст, KV-cache, размер батча и служебные расходы фреймворка.
В новой статье разобрали, когда хватает CPU и в каких сценариях нужен GPU. Показали, как заранее проверить совместимость драйвера NVIDIA и версии CUDA, как эмпирически измерить фактическое потребление VRAM и сколько RAM закладывать под DataLoader с несколькими воркерами. И собрали ориентиры по конфигурациям — от прототипирования и небольшого инференса до обучения на 2–4 GPU и больших моделей.
В апреле провели Демо день, добавили пользовательские образы и ИИ-инференс на vLLM, расширили географию защиты от DDoS. Ниже — главное.
Демо день Рег.облака
16 апреля собрались в Центре событий РБК. Показывали развитие облачной платформы, GPU-инфраструктуру, инструменты для ИИ-нагрузок и сценарии масштабирования IT-инфраструктуры. В программе — продуктовые анонсы, технические доклады и практические сессии про эксплуатацию облака, отказоустойчивость, хранение данных и оптимизацию ресурсов. После выступлений участники тестировали сервисы вживую и обсуждали задачи с нашими разработчиками.
Делимся записями обоих треков:
Бизнес-трек — оптимизация стоимости IT-инфраструктуры, соответствие 152-ФЗ, гибридные конфигурации и экономика ИИ-проектов.
Практикум — Terraform для бизнеса, пользовательские ОС-образы, защита от DDoS в один клик и внутренняя кухня S3-хранилища.
Создание серверов из пользовательских образов
Добавили загрузку собственных образов виртуальных машин. Пользователь импортирует заранее подготовленный образ из своего S3-хранилища в облаке и разворачивает на его основе ВМ в нужном регионе.
Сценарии: миграция инфраструктуры из других облаков и локальных площадок, собственные сборки ОС и специализированные окружения, контроль над конфигурацией и версиями образов. Подробности — на странице продукта.
AI-платформа и ИИ-инференс на vLLM
Для тарифной линейки с GPU добавили ИИ-инференс — готовую виртуальную машину с vLLM для запуска LLM-моделей на выделенной видеокарте. Пользователь сразу получает рабочую среду без настройки драйверов и фреймворков, а к модели обращается через OpenAI-совместимый API (endpoint + ключ).
ИИ-инференс — часть бета-версии AI-платформы. В нее также входят сценарии разворачивания LLM-моделей, автоматизация процессов через n8n, ИИ-ассистент и JupyterHub.
Расширенная защита от DDoS L3–L7 в трех новых регионах
Услугу подключили в Москве-2 (30 марта), Санкт-Петербурге (8 апреля) и регионе ФЗ-152 (15 апреля). Подробности — на странице продукта.
Желаем продуктивного месяца и спасибо, что следите за обновлениями Рег.облака!
Образ сервера для деплоя: golden image, immutable infrastructure и многослойная сборка
Образ сервера — это основа предсказуемого деплоя. Одна и та же конфигурация на всех инстансах, развертывание за минуты вместо часов, никаких расхождений между средами. На этой идее держатся immutable infrastructure, сборка образа как финальный шаг CI/CD и подход cattle, not pets.
В новой статье разобрали, чем образ отличается от snapshot и бэкапа. Показали, где в CI/CD место Packer, Docker и cloud-init. Рассказали про многослойную сборку и отдельно — про работу с секретами через переменные окружения и регулярную пересборку базового слоя.
Переезд в облако больше не влечет за собой пересборку инфраструктуры. Теперь достаточно снять образ диска с текущего сервера, загрузить его через S3-совместимый интерфейс, запустить ВМ — и все пакеты, конфиги и настройки сервисов переедут вместе с системой.
Поддерживаются форматы qcow2 и raw, максимальный размер образа — 30 ГБ (по запросу в поддержку увеличим). Пригодится не только для миграции: на пользовательских образах удобно собирать golden image, разворачивать кастомные сборки ОС и автоматизировать всё через CI/CD.
Как подключить сетевой диск к серверу: SMB, CIFS, fstab и не только
Подключить SMB-шару — рутина, которая решается за минуту. Ровно до момента, когда на свежей Windows 11 прилетает 0x80070035 из-за отключенного по умолчанию SMBv1, опечатка в /etc/fstab оставляет систему без загрузки, а 445-й порт оказывается выставлен в интернет напрямую.
В новом тексте пошагово разобрали подключение сетевого диска в Windows, Linux и macOS. Читайте на сайте Рег.облака.
QEMU-агент: установка на Linux и Windows, типовые проблемы и рекомендации по эксплуатации
Если гипервизор не может корректно выключить виртуальную машину, снапшоты создаются без гарантии целостности данных, а получить информацию о состоянии гостевой системы без SSH невозможно — скорее всего, не установлен QEMU-агент.
Разобрали, как работает агент, как его установить на Debian/Ubuntu, RHEL-based дистрибутивах и Windows, и что делать, если после установки он не отвечает на команды со стороны гипервизора.
SpaceWeb добавил в каталог VPS четыре open-source инструмента для внутренней инфраструктуры
SpaceWeb запустил в каталоге готовых решений четыре новых образа для установки в один клик: Moodle, Vaultwarden, iRedMail и OpenClaw.
Moodle — обучающая платформа или база знаний. Vaultwarden — менеджер паролей и доступов. iRedMail — корпоративная почта на собственном сервере. OpenClaw — self-hosted ИИ-ассистент для рабочих сценариев.
По данным SpaceWeb, 33% пользователей VPS уже используют панели управления, 22% — контейнеризацию. VPS всё чаще становится базой для внутренней инфраструктуры, а не просто хостингом для сайта. Новые образы продолжают эту логику: всё в едином контуре, без внешних SaaS и ежемесячных платежей за сторонние сервисы. Всего в каталоге SpaceWeb сейчас более 40 приложений — от CMS и панелей управления до систем мониторинга и баз данных.
Узнать подробности и выбрать свой open-source инструмент можно на сайте SpaceWeb.
Установка Apache Kafka 4.1.1 в режиме KRaft: пошаговые инструкции для Ubuntu, Windows и macOS
Режим KRaft убирает из архитектуры ZooKeeper — меньше компонентов, проще эксплуатация. В статье Рег.облако собрал инструкции по установке Kafka 4.1.1 в этом режиме для всех основных ОС: от Ubuntu и CentOS до Windows и macOS.
Отдельно разобрали настройку systemd-сервиса, конфигурацию безопасности через SASL и ACL, подключение мониторинга через JMX Exporter и Prometheus, а также типовые проблемы в эксплуатации.
DNS-сервер не отвечает: что делать владельцу сайта
Когда пользователи не могут открыть сайт из-за DNS-ошибки, первый импульс — искать проблему у себя. Но причина часто на стороне владельца: истек домен, сбились NS-записи после смены хостинга или DNS-серверы провайдера легли под DDoS-атаками.
В новой статье собрали диагностику для обеих сторон — и для пользователя, и для администратора сайта: как быстро локализовать проблему, проверить NS-записи и DNS через nslookup и ping, и что делать, если дело все-таки в хостере.
Выделенный CPU в аттестованном облаке 152-ФЗ: новая линейка тарифов Рег.облака
Компании, которые обрабатывают персональные данные в облаке, привычно сталкиваются с одним компромиссом: либо юридически чистая инфраструктура, либо предсказуемая производительность. Рег.облако запустил линейку тарифов, которая закрывает оба требования сразу.
Новые тарифы с выделенным CPU работают в аттестованном облаке до 1 уровня защищенности по требованиям 152-ФЗ и ФСТЭК. Физические ядра процессора не делятся с другими виртуальными машинами — никакой переподписки и влияния соседних нагрузок. В основе — процессоры Intel Xeon Gold 2,8 ГГц и NVMe-накопители с низкими задержками.
Сценарий очевидный: базы данных с персональными данными — PostgreSQL, MySQL, 1С, Oracle — и любые высоконагруженные системы в регулируемых отраслях, где просадка производительности недопустима.
Как выбрать дисковую систему для выделенного сервера
Выбор накопителя определяет производительность и надежность сервера целиком. Но правильного ответа для всех не существует — конфигурация зависит от задач конкретного проекта.
В новой статье мы сравнили NVMe SSD, SATA SSD и SATA HDD, разобрали как работают дисковые массивы RAID и какую конфигурацию выбрать под разные сценарии.
Автоматизация рутины в ispmanager: скрипты, CRON и плагины
Настройка серверов, бэкапы, обновления, управление пользователями — всё это можно делать вручную. Или один раз настроить и забыть.
В новой статье разобрали, как автоматизировать типовые задачи в ispmanager: настроить планировщик CRON прямо из панели, написать скрипт резервного копирования, создать собственный плагин и подключить внешние инструменты вроде Zabbix или Git. Подробности — в блоге Рег.облака.
SpaceWeb добавил в частное облако четыре DevOps-инструмента: MinIO, Zulip, n8n и Zabbix
SpaceWeb запустил в частном облаке серию готовых open-source сервисов для командной разработки. Каждый разворачивается независимо — можно выбрать только то, что нужно под конкретную задачу. В набор вошли четыре инструмента:
MinIO — S3-совместимое объектное хранилище для бэкапов, логов, артефактов сборки и статики;
Zulip — командный чат с тематическими ветками для асинхронной работы;
Zabbix — мониторинг серверов и приложений: CPU, память, диски, базы данных, веб-серверы;
Вместе они закрывают базовые потребности небольшой ИТ-команды — хранение, коммуникацию, мониторинг и автоматизацию рутины — в едином управляемом контуре внутри частного облака. Без внешних SaaS-платформ и бесконечных интеграций между ними.
В марте было так много всего, что он пролетел незаметно : запустили DDoS-защиту, расширили DBaaS, добавили выделенные CPU в ФЗ-152 и образы Windows. Ниже — всё главное за месяц.
Запустили DDoS-защиту L3–L7 — один из главных релизов месяца
В Рег.облаке появилась профессиональная защита от DDoS-атак на базе DDoS-Guard. Сервис фильтрует трафик на уровнях L3–L7 и защищает веб-ресурсы и сетевую инфраструктуру от распределенных атак любого типа и мощности. Управление доступно прямо в личном кабинете Рег.облака — без переключения между интерфейсами. Подробности на странице продукта.
Расширили квоты S3
Самостоятельно увеличить квоту хранилища S3 теперь можно до 20 ТБ — раньше лимит составлял 500 ГБ. Если нужно больше, квота по-прежнему выдается через поддержку.
Добавили образы Windows
Теперь в Рег.облаке можно разворачивать серверы на Windows — образ доступен в личном кабинете. Подробности на странице продукта.
Добавили DBaaS в регион Москва-2
Заказать управляемые базы данных теперь можно в двух регионах. Ранее DBaaS был доступен только в одном.
Новое в документации
Добавили инструкции по миграции на ispmanager — для тех, кто переносит данные с cPanel или Plesk.
Провели два вебинара
В марте вместе с экспертами в прямом эфире разобрали две актуальные темы. Первый вебинар — про выбор корпоративного хранилища: когда брать S3, а когда сетевые диски. Запись уже доступна. Второй — про 152-ФЗ: где заканчивается ответственность провайдера и начинается ответственность клиента. Запись появится чуть позже, мы поделимся.
Желаем всем продуктивного месяца и спасибо, что следите за обновлениями Рег.облака!
Wireshark: установка, фильтры и разбор реальных сценариев
Сеть ведет себя странно, но непонятно где именно — знакомая ситуация? Wireshark в таких случаях помогает увидеть трафик изнутри: перехватить пакеты, отфильтровать нужное и найти проблему — будь то задержки, потери пакетов или подозрительная активность.
В блоге разобрали инструмент с нуля: установка на Windows, Linux и macOS, работа с интерфейсом, фильтры захвата и отображения, практические сценарии — от отладки медленного соединения до анализа VoIP-звонков.
Встроенная защита от DDoS в Рег.облаке: подключение без отдельного контура и сложной интеграции
Рег.облако договорилось о партнерстве с DDoS-Guard и интегрировало их защиту прямо в облачную платформу — подключить можно через стандартную панель управления. Актуальность очевидна: за 2025 год атаки на облачный сегмент выросли почти в полтора раза, 80% из них бьют по уровню L7 — прямо по сайтам, API и личным кабинетам.
Решение работает на уровнях L3–L4 и L7: автоматически обнаруживает атаки, запускает фильтрацию за несколько секунд и противодействует ботам через поведенческий мультивекторный анализ. Особенно актуально для интернет-магазинов, игровых платформ, финансовых сервисов и корпоративных систем — там простой стоит дорого.
Установка Git на Ubuntu: три способа и базовая настройка
Git есть почти везде, но версия из стандартного репозитория Ubuntu может сильно отставать от актуальной — и это уже повод разобраться, какой способ установки выбрать. В блоге разобрали все три варианта: через APT, через PPA и сборку из исходников — плюс базовую настройку и первые команды для старта.
Брокер сообщений для микросервисов — звучит страшно, но только пока не разберешься. NATS написан на Go, запускается за минуты и не требует сложной инфраструктуры.
В блоге разобрали, как установить NATS на Linux и Windows, настроить аутентификацию, TLS и JetStream — и сразу проверить всё это из консоли.
Доступные инструменты для миграции: Apache NiFi, Talend и Airbyte
Можно заплатить за коммерческие инструменты миграции и жить спокойно. Но зачем, если есть open-source? В блоге разобрали самые востребованные бесплатные решения для переноса данных: когда брать Apache NiFi, чем от него отличается Talend Open Studio и в каких задачах выигрывает Airbyte.