ИИ-интегратор полного цикла К2 НейроТех (входит в К2Тех) завершил создание облачной платформы на отечественном программно-аппаратном стеке для разработки и внедрения решений на основе искусственного интеллекта для Федерального государственного автономного учреждения «Цифровые индустриальные технологии» (ФГАУ «ЦИТ»). Подведомственные предприятия получили возможность развертывать ИИ-сервисы для промышленных нагрузок по модели AIaaS (ИИ как услуга) без капитальных вложений в собственную инфраструктуру, сохраняя при этом полный контроль над данными.
Проект стал продолжением сотрудничества, начатого в 2025 году: после запуска вычислительного кластера команда К2 НейроТех сформировала на базе инфраструктуры заказчика единый облачный хаб для промышленного ИИ, выполнив весь цикл работ за 2 месяца – от проектирования архитектуры до ввода в эксплуатацию. Решение направлено на устранение ключевых инфраструктурных барьеров – дефицита GPU-мощностей, длительных сроков подготовки рабочих сред, непрозрачности учета и распределения вычислительных ресурсов, а также рисков, связанных с переходом на российские решения и защитой данных.
«Перед нами стояла амбициозная задача – создать единый хаб для запуска и масштабирования промышленного ИИ. В рамках проекта мы перешли от предоставления "голых" вычислительных ресурсов к созданию полноценной платформы, охватывающей весь цикл работы с моделями — от подготовки данных и обучения алгоритмов до их промышленной эксплуатации и мониторинга. Интеграция ML-платформы KageCore от вендора AIDA tech обеспечила необходимую производительность для ресурсоемких расчетов и высокий уровень безопасности при работе в изолированном контуре», – прокомментировал руководитель подразделения К2 НейроТех Александр Рожков.
Основой реализованного решения стала ML-платформа KageCore от российского вендора AIDA tech, входящая в единый реестр отечественного ПО. Решение объединило инфраструктурные (IaaS) и платформенные (PaaS) сервисы в защищенную экосистему. В качестве аппаратного слоя использовались серверы и системы хранения данных российского производства для полного контроля над жизненным циклом оборудования и гарантий по модернизации.
Платформа KageCore обеспечивает полный цикл управления машинным обучением – от подготовки данных до развертывания моделей в промышленную эксплуатацию, предоставляя дата-сайентистам и ML-инженерам единую среду для работы с корпоративными данными при сохранении полного суверенитета над ними.
В основе архитектуры платформы – пять взаимосвязанных подсистем, обеспечивающих полное соответствие требованиям регуляторов к защите информации и технологическую независимость инфраструктуры. Портал самообслуживания представляет собой конструктор сервисов: пользователь может выбрать операционную систему, в том числе сертифицированные ФСТЭК ОС Astra Linux и РЕД ОС, необходимые компоненты и развернуть рабочую среду в одно касание. Слой виртуализации и контейнеризации развернут на отказоустойчивой конфигурации с настроенной системой мониторинга, которая собирает данные от аппаратного уровня до уровня пользовательских приложений, и максимальной утилизации GPU при обучении моделей, включая несколько центров обработки данных.
Ключевой элемент платформы – ML-среда на базе KageCore, объединяющая интерактивные блокноты Jupyter для работы дата-сайентистов и инструменты управления полным жизненным циклом моделей. Платформа предоставляет пользователям единую точку доступа — портал самообслуживания с системой квотирования и биллинга. Это дает возможность различным подразделениям и проектным группам самостоятельно и оперативно запрашивать необходимые для работы вычислительные мощности. Маркетплейс платформы включает предустановленные векторные базы данных, брокеры сообщений, инструменты безопасности и популярные ML-фреймворки — TensorFlow, PyTorch, ONNX, Kafka, MLFlow и другие компоненты, необходимые для промышленной разработки ИИ. За счет автоматизации развертывание типового рабочего окружения для задач ИИ теперь занимает менее 15 минут вместо нескольких дней ручной настройки. Ключевая особенность — гибкие сценарии работы с GPU: от выделения целиковых устройств для ресурсоемких задач обучения до гранулярного распределения vRAM объемом от 1 ГБ для инференса моделей, что позволяет экономить вычислительные ресурсы и запускать несколько моделей параллельно на одном физическом ускорителе. Замкнутый контур мониторинга в реальном времени агрегирует тысячи метрик и формирует детализированные дашборды для контроля всех уровней – от физической инфраструктуры до прикладных ИИ-сервисов.
Архитектура платформы поддерживает одновременную работу более 500 виртуальных машин и контейнеров с гарантированным уровнем доступности свыше 99%. Система функционирует в изолированном сегменте сети, что полностью соответствует требованиям по защите информации, обеспечивая технологическую независимость.
Новый облачный хаб позволил закрыть критический разрыв между инфраструктурными ограничениями и потребностями исследовательских команд. Теперь ФГАУ «ЦИТ» предоставляет ресурсы как в классическом HPC-режиме через планировщик SLURM, так и в гибких средах виртуализации и контейнеризации. Подведомственные предприятия получили не просто доступ к GPU-мощностям, а готовую среду с предустановленным стеком ML-инструментов, протестированных на совместимость и готовых к промышленной эксплуатации. Исследовательские команды могут начинать работу сразу после авторизации в личном кабинете, не тратя недели на развертывание и настройку необходимого ПО.
Платформа стала фундаментом для тестирования и разработки моделей, которые впоследствии вошли в обновленный Реестр отраслевых моделей машинного обучения и наборов данных, представленный ФГАУ «ЦИТ» в декабре 2025 года.
«Создание и сопровождение собственной высокопроизводительной инфраструктуры остается одним из главных барьеров внедрения ИИ в промышленности. Наша платформа, разработанная К2 НейроТех, позволила нам консолидировать вычислительные ресурсы и экспертизу и ускорить внедрение ИИ-решений, предоставляя предприятиям доступ к защищенным мощностям в формате сервиса», — подчеркнул директор ФГАУ «ЦИТ» Эдуард Шантаев.
