Приходите на вебинар, расскажем, как сэкономить на запуске LLM-моделей
Платите за ресурсы, которые не используются, или сталкиваетесь с ошибками из-за нехватки vRAM? Тогда этот вебинар для вас. Приходите пообщаться с нашими экспертами, они расскажут, как точно рассчитать конфигурацию для запуска LLM и настраивать параметры инференса для экономии без потери в качестве.
О чем будем говорить на вебинаре:
из чего складывается потребление vRAM;
как точно рассчитать конфигурацию GPU для выбранной модели, включая форматы квантования (BF16, FP8);
какие параметры LLM сильнее всего влияют на стоимость и производительность;
как с помощью Evolution ML Inference автоматически масштабировать ресурсы и переводить модели в serverless-режим, чтобы платить только за активную работу.
Еще будет практическая часть, на которой покажем запуск LLM с оптимальными параметрами в сервисе Evolution ML Inference. Сравним разные конфигурации по производительности и стоимости.
Ждем дата-сайентистов, DevOps-инженеров и руководителей, кому интересно узнать, как оптимизировать затраты на ML-инфраструктуру.
📅 Когда? 15 января в 11:00 мск.
📍Где? Онлайн. Зарегистрируйтесь, чтобы задать вопросы экспертам в прямом эфире.
Он уже умеет разворачивать виртуальные машины, настраивать мониторинг и алертинг, подсказывать команды для терминала VM. В следующем году он станет еще способнее.
Ищите ИИ-помощника в нижнем правом углу личного кабинета Cloud.ru.
В июне мы запустили цифровую среду для внедрения GenAI в ваши проекты, а уже в ноябре вывели все сервисы среды в коммерческую эксплуатацию. Теперь все для работы с GenAI — в одном месте.
Выпустили в общий доступ 19 сервисов платформы Cloud.ru Evolution: для работы с AI и данными, переноса IT-инфраструктуры, резервного копирования и восстановления, управления кластерами Redis, доменными зонами и репозиториями.
А еще запустили 14 сервисов в стадии тестирования — их вы можете подключить бесплатно.
В марте мы запустили в коммерческую эксплуатацию Cloud․ru Evolution Stack — платформу для создания частного, гибридного или распределенного облака. А в октябре она получила официальную сертификацию ФСТЭК России.
На онлайн-вебинарах, IT-митапах, хакатонах и конференциях про облака и AI — GoCloud и GoCloud Tech.
Уже готовим мероприятия в 2026 году, следите за новостями!
🌲Покорили рейтинги
В этом году мы стали №1 среди крупнейших игроков российского рынка AI-решений (CNews Analytics) и №1 среди крупнейших поставщиков услуг IaaS в России (TAdviser).
А еще вошли в топ-5 самых дорогих компаний Рунета (Forbes) и в топ-10 самых крупных и быстрорастущих IT-компаний России (CNews500).
Последний дайджест года: новости за ноябрь-декабрь
🚀 10 облачных сервисов вышли в общий доступ (General Availability) и стали платными. Часть из них — инструменты для работы с искусственным интеллектом:
Evolution AI Agents — cервис для разработки, развертывания и эксплуатации автономных AI-агентов в единой среде. Поддерживает полный цикл работы с агентами — от запуска до мониторинга.
Evolution Managed RAG — cервис для запуска Retrieval Augmented Generation (RAG) систем, основанных на ваших данных.
Evolution ML Finetuning — сервис дообучения больших языковых моделей с использованием технологии LoRA. Позволяет адаптировать модели к специфическим задачам, минимизируя потребление ресурсов.
Evolution Notebooks — cервис для запуска ML-среды и работы DS-специалистов в интерактивных ноутбуках с доступом к облачным ресурсам, включая GPU и высокопроизводительные CPU.
Есть и другие обновления, например, в сервисе Evolution Managed Kubernetes теперь есть плагин KEDA, чтобы настраивать event-driven автомасштабирование приложений, развернутых в кластере.
🚨Собрали чек-лист, по которому можно оценить, насколько эффективны ваши ETL-процессы. Внутри документа — опыт и лайфхаки в работе с данными от наших ведущих архитекторов.
Как это работает: пройдите чек-лист, подсчитайте баллы, определите уровень зрелости ETL-процессов и получите персональные рекомендации от эксперта Cloud.ru.
🎁 До конца декабря дарим юрлицам 35 000 бонусных рублей для работы в Evolution Data Platform. Бонусы можно потратить на управляемые сервисы для работы с Big Data и ML: Evolution Managed Trino, Evolution Managed Metastore и Evolution Managed Spark.
🎙️Провели вебинары про запуск BI за один день, про сравнение Kyverno и Gatekeeper для Kubernetes, про self-hosted и managed PostgreSQL и еще про партнерскую программу. Записи ноябрьских встреч уже доступны, а декабрьских скоро будут на сайте.
На январь и февраль тоже запланировали пару вебинаров, на них уже можно регистрироваться.
💼 В истории с тюменским девелопером «Люди» рассказали, почему компания выбрала облако вместо on-premise, как за 2 месяца перенесла IT-инфраструктуру из локальной среды в Cloud.ru и в 1,5 раза увеличила производительность баз 1С.
Как закрывать месяц в 1С не за час, а за 20 минут — история производителя тахографов
💼 Что за компания
«Новые решения драйва» (НРД) работает на рынке транспортной автоматизации. Компания производит и продает тахографы — устройства, которые регистрируют скорость, пробег, режим труда и отдыха водителя.
В каждом грузовом автомобиле массой выше 3,5 тонн и автобусе должен быть тахограф — так требует закон. Например, если водитель попадет в спорную ситуацию, данные с тахографа помогут доказать, что он работал не дольше, чем положено, и ехал не быстрее, чем разрешено.
🕵️ Задача
Раньше IT-инфраструктура НРД была построена по модели SaaS на базе ресурсов облачного провайдера. Но компания решила развивать собственную инфраструктуру, чтобы предложить новый вид сервиса для клиентов, партнеров и внутренних заказчиков.
Еще одним поводом пересмотреть инфраструктуру стало падение производительности некоторых критических систем, включая ключевую 1С. Специалисты проверили код и оптимизировали работу баз данных, но сильно лучше не стало.
Так решение строить собственную IT-инфраструктуру стало проектом года. Отдельно обсуждали вопрос о том, где эта инфраструктура будет размещена: локально на своих серверах или в дата-центре провайдера, которого тоже решили сменить.
Перенос приложений и баз данных на «железо» потребовал бы больших первоначальных вложений и регулярных затрат на поддержку и обслуживание в будущем. Поэтому победил облачный вариант, и клиент запустил два тендера: один на аренду ресурсов у провайдера, второй на поиск компании-исполнителя, которая построит новую инфраструктуру в облаке и перенесет данные.
Первый тендер выиграли мы: клиент развернул тестовые контуры у нескольких провайдеров, но только у нас коэффициент производительности 1С:ERP и других продуктов вырос с 0,475 до 0,725 — спасибо процессорам с частотой 3,0 и 3,5 Ггц. Второй тендер выиграл IT-интегратор «Протон» — он умеет проводить аудит инфраструктуры, строить новую и мигрировать программные решения в облако.
👨💻 Решение
Миграция в облако длилась три месяца и, грубо говоря, в четыре этапа:
Команда «Протона» проанализировала текущую инфраструктуру НРД и начала строить новую на платформе Облако VMware от Cloud.ru. Тестирование, уточнение деталей и настройка заняли месяц.
Связали две инфраструктуры с помощью межсетевого экрана и перенесли виртуальные машины из старого контура в новый. Для большей надежности и безопасности настроили резервное копирование.
Перенесли в облако боевые базы данных, внедрили в новую инфраструктуру учетную систему 1C:ERP, 1С:ЗУП и 1С:Бухгалтерия.
Настроили два корпоративных VPN-сервера для удаленного доступа к новой инфраструктуре. Сотрудники НРД сказали, что работать дома после этого стало гораздо комфортнее.
Когда закончилась активная фаза переноса, специалисты «Протон» продолжили заниматься технической поддержкой инфраструктуры, а команда НРД перешла к планомерной работе, доработке и донастройке всех систем.
📈 Результаты
Системы мониторинга, контроллер доменов, приложения 1С, сервер удаленных рабочих мест и другие технические серверы перенесены в виртуальный ЦОД в облаке Cloud.ru. Что ощутимо изменилось, это то, что ускорилось формирование отчетности в 1C:ERP и документооборот:
список регламентных операций открывается за 7 секунд вместо 30;
отчеты из раздела «Функции для технического специалиста» составляются за 7–8 секунд вместо 20;
месяц теперь закрывается за 20 минут, а не за час, как раньше.
Если тоже раздумываете о переносе 1С в облако, обращайтесь, у нас большой опыт такой миграции.
Как GUDDA сэкономила в три раза, развернув инфраструктуру для 1С в облаке
👨💻 Что за компания
GUDDA — это сеть ломбардов, магазинов электроники и ювелирных изделий. У компании есть филиалы в разных городах России, например Ростове-на-Дону, Азове, Батайске, Каменск-Шахтинске, Новочеркасске, Таганроге и Шахтах. GUDDA дает краткосрочные займы под залог, покупает и продает украшения, гаджеты и технику.
🕵️ Какая была задача
IT-инфраструктура GUDDA изначально строилась по подходу cloud native: часть инфраструктуры разместили в частном контуре, а в облаке — системы, нагрузка на которые возрастала по ходу развития бизнеса.
Компания хотела нарастить мощности для баз 1С, SQL-серверов и системы резервного копирования, поэтому решила реализовать мультиоблачную стратегию. Для этого GUDDA начала искать еще одного облачного провайдера.
Ключевым требованием стала отказоусточивость — даже минута простоя может стоить GUDDA миллионы рублей. Еще перед переездом в облако команда хотела протестировать сервисы на реальных задачах и оценить, насколько хорошо выстроена коммуникация с технической поддержкой провайдера.
👨🔧 Как ее решили
GUDDA в течение месяца тестировала сервисы Cloud.ru, подбирала оптимальные конфигурации процессоров и накопителей. Менеджер со стороны провайдера всегда была на связи и быстро направляла к нужным техническим специалистам, если появлялись вопросы по работе сервисов или настройке инфраструктуры.
К концу теста компания попробовала все варианты и четко знала, что реализует и сколько это будет стоить. В итоге клиент выбрал виртуальный ЦОД с высокочастотными процессорами 3,5 ГГц.
Для миграции мы предоставили GUDDA выделенный канал с гарантированной средней скоростью 500 МБ/с — это позволило быстро перенести данные в облако. Компания получила готовую облачную инфраструктуру, в которой меньше чем за час развернула и настроила нужные виртуальные машины.
📈 Что в результате
Инфраструктура в облаке Cloud.ru работает без сбоев, а команда GUDDA может масштабировать мощности через личный кабинет, не обращаясь в поддержку.
Главный финансовый результат — содержать аналогичную инфраструктуру локально обошлось бы компании в три раза дороже, чем в облаке.
GUDDA планирует перенести в облако и другие системы, включая базы 1С для круглосуточных точек, организовать катастрофоустойчивую инфраструктуру с использованием резервного ЦОД.
🗣️🎙️ Новый выпуск подкаста: говорим про парадоксы AI, AGI и будущее программистов
В гостях у Cloud.ru — Сергей Марков, исследователь ML и AI с 20-летним опытом и руководитель команды исследователей в Сбере. А еще Сергей — автор SmarThink, одной из сильнейших шахматных программ начала нулевых, и книги об искусственном интеллекте «Охота на электроовец».
Выпуск идет всего час, а взамен — море полезного и «на подумать» с острия AI-индустрии.
✍️ О чем поговорим:
AI — смерть программирования? Нет, и Сергей расскажет почему.
Что такое общий искусственный интеллект (AGI) и возможно ли его создать.
Как поменялось общественное сознание после появления ChatGPT.
Три кита ML: GPU, данные и правильная инициализация весов.
Почему Chain-of-Thought — костыль для решения сложных задач.
Человеческий труд — а с ним что? Канет в лету или окажется на вес золота?
Автоматизация с AI разрушает индустрии или все же создает новые?
Этика и моральный выбор при использовании AI.
Смотрите подкаст на удобной площадке: в VK Видео или на YouTube.
Кейс: «Жива Технологии» арендует в облаке виртуальные машины с GPU для приложения с AI 🤖💬
👨💻 Что за компания
«Жива Технологии» — разработчик приложения JIVA, ассистента с AI, который помогает вести здоровый образ жизни. В приложении можно составить план, чтобы достичь поставленной цели: рассчитать норму воды, построить график тренировок или поправить технику упражнений.
А еще искусственный интеллект рассчитывает по фото питательность блюда: вес порции, количество калорий, белков, жиров, углеводов, микро- и макро-нутриентов. В результате такого анализа AI-помощник в JIVA советует, что можно заменить или добавить, чтобы прием пищи стал полезнее.
🕵️ Какая была задача
Искусственный интеллект внутри JIVA — это AI-модели для распознавания нутриентов по фото, встроенный AI-ассистент на базе LLM и каскад моделей по детекции и распознаванию физических упражнений. Все модели разработчик собрал на open source.
Клиенту были нужны видеокарты с GPU для инференса и обучения этих моделей. Закупать свои графические процессоры оказалось невыгодно, и он решил арендовать их в облаке. «Жива Технологии» хотел использовать виртуалки с GPU и другие облачные сервисы, чтобы мониторить работу моделей и управлять ресурсами в одном месте.
📈 Результат
Клиент использовал набор сервисов Cloud.ru, чтобы развернуть в облаке бэкенд приложения, тестовую и продовую среду и сами модели:
Развернул бэкенд и модель для подбора упражнений на пяти ВМ платформы Cloud.ru Advanced. Там же подключил сервисы для мониторинга, логирования и работы с базами данных.
Тестовую среду развернул на виртуальных машинах Evolution Compute c GPU с гарантированной долей vCPU 30% 8vCPU 16GB RAM. Для тестирования взял одну GPU-карту A100 — она позволяет экспериментировать при обучении и тестировании LLM.
Для продовой среды выбрал виртуалки с такими параметрами: 20 vCPU 117 GB RAM 1 × A100 NVIDIA 80 GB.
🚀 Что дальше
В планах «Жива Технологии» — ускорить распознавание нутриентов по фото с 8–9 до 2–3 секунд, не арендуя при этом дополнительные GPU. У Cloud.ru есть сервисы, которые помогают в инференсе моделей, их дообучении и не только. Например, для запуска и развертывания ML-моделей предложили клиенту протестировать сервис Evolution ML Inference.
Участвуйте в онлайн-хакатоне AI DevTools Hack, чтобы выиграть до 1 500 000 рублей 🙌
Хотите прокачать навыки AI и инженерное мышление? Тогда собирайте команду и регистрируйтесь на онлайн-хакатон AI DevTools Hack. За две недели вы создадите AI-ассистента или мультиагентную систему с использованием облачных сервисов, пройдете экспертные сессии и защитите свой проект в финале.
В призовом фонде хакатона — 1 500 000 рублей. Есть за что побороться 🙂
Что ждет участников:
➡️Настоящие инженерные задачи
➡️ Обратная связь от экспертов
➡️ Опыт работы с экосистемой облачных сервисов
Успейте зарегистрироваться до 5 декабря. Если у вас нет команды — мы поможем ее найти.
Честно сравним два подхода и разберем, с какими сложностями и скрытыми рисками можно столкнуться при переходе с on-premise на Managed PostgreSQL в облаке. И, главное, как их избежать.
Поговорим о разделении ответственности за кибербезопасность между облачным провайдером и клиентом. Расскажем, какие задачи лежат на каждой из сторон и как модель разделенной ответственности помогает избежать инцидентов.
Сложное развертывание, тонкая настройка и постоянная зависимость от IT-специалистов растягивают внедрение бизнес-аналитики. На вебинаре покажем, как развернуть полнофункциональную BI-систему в облаке за день.
Включаем турборежим перед Новым годом: 3 шага к запуску AI-проекта до января
Костры рябин сгорели, настала очередь дедлайнов и годовых KPI. Чтобы войти в Новый год с новыми проектами, а не с техдолгом, объявляем скидку на аренду графических ускорителей. Рассказываем, как выжать максимум пользы:
Воркшопы конференции AI DevTools Conf, которых не будет в трансляции
Если сомневаетесь, слушать онлайн или потратить время на поездку на конференцию, то вот аргумент в пользу офлайн-визита: воркшопов с экспертами не будет в трансляции и записях после мероприятия.
AI DevTools Conf — практическая конференция про AI в разработке. С докладами выступят наши и приглашенные эксперты, они расскажут про AI-процессы, мультиагентные системы, эффективную инфраструктуру и управление уязвимости. Еще будут демозоны, на которых вы сможете потестить сервисы Evolution AI Factory, нашей цифровой среды для работы с GenAI.
📍 Где: онлайн или очно в Москве: Варшавское шоссе, 33с3, AG Loft.
AI-Agent для развертывания и обслуживания инфраструктуры
Разберем, как подобрать нужную конфигурацию AI-агента и быстро развернуть продукт. Настроим сбор метрик и логов с приложения и инфраструктуры, а еще сформируем алерты.
Управляемая AI-разработка: как генерировать код быстро и с минимумом техдолга
Рассмотрим, как внедрить AI-инструменты в разработку, не потерять в качестве и обеспечить безопасность. На реальных кейсах обсудим, как настроить инфраструктуру для контролируемой генерации кода.
👨💻 → Александр Константинов. Технический эксперт по облачным технологиям, Cloud.ru 17:50 – 18:20
Marimo Notebooks: как выйти за рамки Jupyter
Расскажем, как работает реактивная модель marimo, и покажем, как решить с ней проблемы низкой воспроизводимости, зависимости от порядка выполнения ячеек и сложностей с версионированием.
👨💻 → Владимир Килязов. Технический эксперт по машинному обучению, Cloud․ru 18:40 – 19:10
Как тестировать LLM-агента: от юнит-тестов до комплексных сценариев
Разберемся в архитектуре агентных систем, дадим рекомендации, как измерять эффективность их работы. Обсудим стратегию e2e оценки на основе подхода LLM as a judge.
👨💻 → Михаил Дремин. Технический лидер Data Science, Cloud․ru 19:10 – 19:40
Современные средства тестирования безопасности AI
Посмотрим, какие бывают промпт-атаки на AI и современные средства тестирования. Сгенерируем вредоносный контент и извлечем системный промпт. А еще обсудим возможные атаки на AI-системы тех, кто придет на воркшоп.
👨💻 → Юрий Лебединский. Разработчик, HiveTrace․red 19:40 – 20:10
Приходите на вебинар, чтобы узнать об обновлениях в партнерской экосистеме Cloud.ru
relieved face
Наши эксперты расскажут, что мы пересмотрели в нашей классической модели и на чем делаем акцент, чтобы создавать с партнерами сложные и интересные проекты.
Обсудим:
в чем суть обновленного формата сотрудничества;
какие инструменты и механики используем, чтобы запускать проекты быстрее;
варианты, как участвовать в партнерской программе;
как выстроена система мотивации и вознаграждений;
как оказываем системную поддержку, от пресейла до совместного продвижения.
Ждем CEO и C-Level, руководителей развития бизнеса, тимлидов, архитекторов, продакт-менеджеров и всех, кто ищет точки роста, отвечает за технологии и развитие направлений.
AI-чат — уже не просто модное словечко, а необходимый инструмент. Он облегчит коммуникацию, поможет автоматизировать задачи и повысить эффективность работы.
Зовем на вебинар, где расскажем, как развернуть собственное решение, чтобы оно отвечало требованиям безопасности и стабильно работало в вашем контуре.
Что еще обсудим:
Из каких open source решений на рынке мы выбирали и на чем в итоге остановились.
Почему свой AI-чат лучше SaaS? Приведем весомые аргументы.
Как собрать AI-чат, чтобы все было безопасно и не нарушало закон.
Какие архитектурные решения мы протестировали и к каким выводам пришли.
Будет интересно системным администраторам, IT-директорам, разработчикам и всем, кто хочет автоматизировать внутренние процессы с помощью корпоративного AI-чата.
Открыли полный доступ к Evolution AI Factory для создания GenAI с минимальными затратами 🚀
Вчера на AI Journey объявили о коммерческом запуске Evolution AI Factory — облачной среды с готовым набором сервисов для работы с GenAI. Мы разрабатывали ее так, чтобы пользователям с любым уровнем навыков программирования и погружения в машинное обучение было удобно и понятно.
В Evolution AI Factory шесть взаимосвязанных сервисов:
🧠 Foundation Models — каталог из 20+ моделей, включая GigaChat-2-Max, Qwen3-Coder, MiniMax и другие. Работают по OpenAI-совместимому API.
⚡ ML Inference — инструмент для быстрого запуска собственных ML-моделей или развертывания готовых из HuggingFace.
🤖 AI Agents — агенты для автономного выполнения задач и интеграции с другими системами.
📓 Evolution Notebooks — запуск нужной вам среды разработки в облаке: JupyterLab, VS Code Server, ComfyUI, n8n и другие. Возможность экспериментировать на CPU или GPU без ограничений.
🎯 Managed RAG — инструмент для повышения точности выдачи LLM с учетом ваших корпоративных данных.
🔧 ML Finetuning — дообучение LLM под задачи вашего бизнеса с использованием LoRA-адаптеров.
Сервисы доступны с гарантированным SLA, поддержкой 24/7 и возможностью масштабировать нагрузку. И все по доступным ценам: открытые LLM из каталога Foundation Models сейчас стоят в среднем 35 рублей за входной и 70 рублей за выходной миллион токенов.
Выбирайте подходящие инструменты и реализуйте проекты в облаке!
Ждем вас на AI DevTools Conf — практической конференции про AI в разработке 🎤
Встретимся, чтобы обсудить, как выстраивать сложные AI-процессы, строить мультиагентные системы, делать собственных агентов без кода и управлять их уязвимостями. Регистрируйтесь на конференцию, чтобы послушать экспертов Cloud.ru и приглашенных спикеров. Обещаем, в программе самое прикладное и интересное 😉
Ждем разработчиков, AI- и ML-инженеров, архитекторов, техлидов и всех, кто уже активно работает с AI или хочет его внедрить.
Где? Онлайн или очно в Москве: Варшавское шоссе, 33с3, AG Loft.
Когда? 4 декабря в 16:00 мск.
Если будете офлайн, сможете потестить в демозоне возможности наших сервисов Evolution AI Factory, посетить нетворкинг, выиграть классный мерч и сходить на воркшопы — о них расскажем в следующих постах.
А сейчас — подробнее о каждом докладе на AI DevTools Conf ↓
Доклад 1 💻 Разворачиваем сервисы просто: DevOps-агент в деле Разберемся, как DevOps-агент автоматизирует настройку и запуск приложений на облачных ВМ. Обсудим архитектуру и фишки агента: как задеплоить его из GitHub, проконтролировать безопасность, покажем быстрый обзор состояния ВМ и другие фичи.
👨💻 → Эмиль Мадатов, Data Science инженер в Cloud․ru
Доклад 2 🛡️ Уязвимости агентных систем и методы защиты Спикер расскажет о типовых уязвимостях, которые встречаются в агентных системах: от перехвата задач и утечек данных до атак на память и reasoning. А еще покажет примеры атак, методы защиты от них, фреймворки и гайды OWASP, которые применимы к Agentic AI.
👨💻 → Евгений Кокуйкин, CEO HiveTrace, руководитель лаборатории AI Security ИТМО
Доклад 3 🔧 Собираем агентов без навыков программирования Покажем, как с помощью n8n-совместимого редактора можно строить сложные AI-процессы, подключать модели и сервисы, отслеживать выполнение и масштабировать решения. Разберем реальные сценарии и покажем, как собрать своего первого агента всего за несколько минут.
👨💻 → Артемий Мазаев, Менеджер продукта в Cloud․ru
Доклад 4 🤖 Как мы автоматизировали процесс Code review в Авито при помощи LLM Эксперт поделится реализуемым пайплайном, который поможет автоматизировать ревью кода. А еще он покажет, как внедрить этот пайплайн во внутренние сервисы.
👨💻 → Марк Каширский, DS Engineer в команде LLM, Авито
Приходите на вебинар — наш юрист расскажет, как выбрать облако, которому можно доверять 🛡️💻
При выборе облачного провайдера возникает много резонных вопросов. А если данные в облаке плохо защищены? Справится ли инфраструктура провайдера со взломом? Можно ли выгрузить в облако персональные данные клиентов и не переживать, что это нарушит закон?
Обо всем этом (и не только) поговорим на вебинаре со старшим юрисконсультом Cloud.ru Анастасией Ильхановой.
Что обсудим:
Какие сертификаты и лицензии должны быть у ЦОД облачного провайдера, как проверить их подлинность.
Как хранить данные в облаке, не нарушая 152-ФЗ «О персональных данных», и как в этом помогает провайдер.
На что внимательно смотреть в договоре: SLA, пункты о разграничении ответственности, компенсации за простои.
Зоны ответственности облачного провайдера и клиента.
Ждем всех, кто хочет разобраться в правовых вопросах при выборе безопасного облачного провайдера.
📅 Когда? 25 ноября в 11:00 мск.
📍Где? Онлайн. Регистрируйтесь на странице встречи и не забудьте поставить напоминание.
Вендинговый оператор перенес mission-critical инфраструктуру в облако Cloud.ru и настроил резервное копирование базы данных 💽
👨💻 Что за компания
UVENCO — крупнейший оператор вендинговых автоматов бренда UNICUM в России, обслуживает 20 000 торговых аппаратов, включая микромаркеты и кофе-поинты, в 65 городах страны.
Все автоматы оборудованы системой онлайн-телеметрии, которая помогает удаленно мониторить их работу, планировать маршрут и график обслуживания, контролировать продажи и остатки товаров. Так оператор в режиме реального времени видит состояние всего парка оборудования и может обеспечить одинаково высокое обслуживание во всех городах, где стоит вендинг UVENCO.
🕵️ Какая была задача
Система онлайн-телеметрии на 20 000 автоматов — это тысячи транзакций в секунду, постоянные записи в базы данных и высокая чувствительность к задержкам. Для UVENCO это mission-critical система: любая деградация ядра телеметрии отразится на продажах и сервисе по всей стране.
Ранее телеметрия работала на локальных серверах. Но для требуемого SLA пришлось бы резервировать вычислительные кластеры, систему хранения данных (СХД), сеть и питание — это дорого и сложно в сопровождении. Масштабирование под ввод новых автоматов тормозилось бы капитальными затратами.
👨🔧 Как ее решили
IT-специалисты UVENCO развернули виртуальные машины и перенесли сервисы телеметрии на платформу Облако VMware. Миграция выполнялась средствами VCDA без изменения архитектуры приложений. После оценки производительности инженеры Cloud.ru предложили перейти на выделенный хост, чтобы исключить шум соседей и закрепить ресурсы только за UVENCO.
📈 Что в результате
Телеметрия работает стабильно, БД регулярно и корректно резервируется. Переезд снял риск простоев и дал UVENCO возможность оперативно масштабироваться под рост нагрузки.
🚀 Открыли регистрацию на AI DevTools Conf — практическую конференцию про внедрение AI-инструментов в процесс разработки. Спикеры расскажут, как строить сложные AI-процессы, собирать мультиагентные системы, создавать эффективную инфраструктуру и управлять уязвимостями. Изучить темы докладов и зарегистрироваться.
💳 Сделали модели в Evolution Foundation Models доступнее. Теперь цена — 35 рублей за миллион входных и 70 рублей за миллион выходных токенов.
Недавно мы добавили:
GigaChat 2 MAX — самую мощную LLM линейки GigaChat, которая обошла GPT-4o и Claude 2 в тесте MMLU-RU.
Qwen3-Next-80B-A3B-Instruct, которая сочетает высокоскоростные блоки для длинных последовательностей и точные attention-слои, а также использует спарсовую архитектуру Mixture of Experts с 512 экспертам.
GLM-4.6 с высокой производительностью при написании кода в Cline, Roo Code и Kilo Code.
Whisper large-v3 — продвинутую модель от OpenAI для распознавания речи. Модель не надо дообучать, а еще ее можно использовать в коммерческих целях — она распространяется под свободной лицензией Apache-2.0.
MiniMax-M2 — компактную, но мощную модель для работы с кодом и агентами. №1 среди open source моделей в бенчмарке Artificial Analysis, которая умеет планировать цепочки действий, работать с окружением, извлекать данные и работать с внешними инструментами.
🚨 С внедрением AI рынок кибербезопасности и облаков стремительно меняется.Если неправильно настроить облачную среду или не учесть специфику AI-моделей, последствия для бизнеса могут быть разными: от утечек данных до создания злоумышленниками вредоносного контента, который ударит по репутации и снизит доверие клиентов.
Чтобы избежать всех этих сложностей, скачайте гайд и используйте AI в облаке без рисков для безопасности, клиентов и бизнес-решений.
⚙️ Обновили наши облачные платформы и сервисы. Например:
Evolution ML Inference
Появился каталог с готовыми моделями, которые доступны для инференса. Среди них — Qwen, DeepSeek, Gemma и не только.
Стал доступен тестовый вызов модели в Model RUN через OpenAPI. Во вкладке OpenAPI найдете полную спецификацию API, описание эндпоинтов, параметров, моделей, запросов и ответов.
Evolution Notebooks
Что мы добавили в сервис:
CLI-утилиту, чтобы управлять Conda-окружениями. Инструмент облегчит работу с версиями окружений, поддержкой чистоты и согласованности IDE.
Управляйте контейнерными приложениями в Kubernetes 1.33 — теперь Evolution Managed Kubernetes поддерживает и эту версию. Что в ней есть:
В бета-тесте — использование образов Open Container Initiative (OCI) в качестве томов в подах, а еще In-place resource resize для вертикального масштабирования подов.
Общедоступными стали поддержка Sidecar-контейнеров, Multiple Service CIDRs, нового бэкенда nftables для kube-proxy, subresource для kubectl. Полный обзор изменений есть в официальном блоге Kubernetes.
Надежность наших сервисов подтверждена регуляторами. Платформа Cloud.ru Evolution теперь в реестре отечественного ПО (РОПО), а еще она получила сертификаты PCI DSS и ФСТЭК России.
🎙️ Провели несколько интересных вебинаров и подкастов — каждый из них вы можете посмотреть в записи:
Хотите узнать, как беcшовно внедрять AI-инструменты в рабочие процессы и создать безопасную и эффективную облачную инфраструктуру? Тогда приглашаем на AI DevTools Conf 😏
AI DevTools Conf — это практическая конференция, на которой мы будем обсуждать внедрение AI-инструментов в процесс разработки.
Спикеры расскажут, как строить сложные AI-процессы, собирать мультиагентные системы, создавать эффективную инфраструктуру и управлять уязвимостями. Темы докладов можно посмотреть в программе.
Кроме них вас также ждут:
воркшопы, которые мы не будем транслировать и записывать: только практический опыт, который можно получить прямо сейчас;
демозона сервисов Evolution AI Factory, на которой вы сможете в реальном времени протестировать возможности наших сервисов;
секретный доклад и презентация эксклюзивной коллекции мерча;
afterparty и нетворкинг в расслабленной предновогодней атмосфере.
Сохраняйте гайд по безопасности AI в облаке 🛡️ Для IT-администраторов, разработчиков, специалистов по ИБ и не только
С внедрением AI рынок кибербезопасности и облаков стремительно меняется. По данным Stanford HAI, более 60% компаний считают, что конфиденциальность — главная проблема при использовании AI, а количество инцидентов с AI выросло на 56,4% с 2023 по 2024 год.
🚨 Если неправильно настроить облачную среду или не учесть специфику AI-моделей, могут возникнуть угрозы. Например:
манипуляции с моделями через промпт‑инъекции;
несанкционированный доступ к ресурсам из-за того, что отсутствует изоляция окружений;
атаки на инфраструктуру из-за уязвимостей поставщиков;
искажение датасетов для обучения.
Последствия для бизнеса могут быть разными: от утечек данных до создания злоумышленниками вредоносного контента, который ударит по репутации и снизит доверие клиентов.
✍️ В гайде рассказали, как избежать этих проблем. Вы узнаете:
Как интегрировать в облако GenAI так, чтобы исключить риски для данных.
Про контроль доступа и логирования для эффективной защиты сервисов.
Как обеспечить безопасность AI-сервисов.
Про безопасную работу и средства защиты в Evolution AI Factory — цифровой среде нового поколения для создания, запуска и масштабирования приложений на базе GenAI.
Забирайте руководство и используйте AI в облаке без рисков для безопасности, клиентов и бизнес-решений.