Обновить
602.33

IT-инфраструктура *

Инфоцентры + базы данных + системы связи

Сначала показывать
Порог рейтинга

Задача о габаритном файле и ошибке

Привет, Хабр! Попробуйте решить задачу. Особенно интересно будет бэкенд-разработчикам, которые работают с микросервисной архитектурой и регулярно сталкиваются с неожиданным поведением инфраструктуры.

Условие

В компании «Доки.Онлайн» выкатили обновление: теперь пользователи могут загружать PDF-файлы с отсканированными договорами. Все работало отлично в локальной среде — разработчик протестировал загрузку больших файлов, убедился, что API обрабатывает их корректно, и спокойно отправил изменения в продакшн.

Но радость была недолгой. На боевом сервере при попытке загрузить файл система выдавала ошибку 413 Request Entity Too Large. Причем происходило это до того, как пользователь получал какой-либо отклик от самого приложения.

Разработчик Геннадий Завров начал искать причину. Он проверил логи всех четырех компонентов системы:

  • фронтенда;

  • API Gateway (определяет, в какой микросервис послать запрос);

  • микросервиса загрузки файлов;

  • микросервиса обработки документов.

Во всех логах пусто, будто никакого запроса и не было. Ни один сервис даже не попытался начать обработку файла.

Геннадий начал подозревать сетевые сбои, перегрузку API Gateway и баг в коде фронтенда. Однако простые тесты с маленькими файлами работали стабильно. Проблема проявлялась только при загрузке чего-то «потяжелее».

В какой-то момент он задал себе вопрос: а точно ли запрос доходит до приложений?

Задача

Почему при загрузке большого файла система возвращает ошибку 413, если сами сервисы даже не видят входящий запрос? Кто может остановить запрос еще до бэкенда?

Делитесь своим ответом в комментариях. А посмотреть полное решение можно в Академии Selectel.

Теги:
Всего голосов 2: ↑2 и ↓0+4
Комментарии3

Рассказываем, как технологии искусственного интеллекта в облаке помогли Wildberries подготовиться к выходу на новый рынок 🛍️

Что за компания

Wildberries — самый крупный по обороту маркетплейс в России. Доставляет заказы в несколько стран, в том числе Беларусь, Казахстан и Армению. В октябре 2024 года маркетплейс запустил продажи на одном из новых рынков

Какая была задача

Перед выходом на новый рынок Wildberries планировали быстро реализовать важные проекты:

  • автоматизировать перевод карточек товаров на местный и английский языки;

  • дообучить и запустить русскоязычную LLM на закрытом GPU-кластере;

  • разработать классификатор товаров по кодам ТН ВЭД;

  • протестировать собственную гипотезу и построить прогноз.

Как ее решили

Благодаря ресурсам Cloud.ru маркетплейс:

  • дообучил модель на специфическом корпусе текстов и с помощью LLM перевел все карточки;

  • разработал классификатор кодов с использованием языковой модели, что ускорило процесс и повысило точность моделей;

  • автоматизировал выбор таможенного кода: с помощью LLM сформировал обучающую выборку и провел инференс модели на мощных GPU в облаке, а затем на базе этой выборки построил более простую модель на процессорах CPU;

  • сэкономил на закупке оборудования: команде дата-сайентистов нужен был большой объем ресурсов, чтобы проверить гипотезы и построить прогнозы, а провайдер оперативно выделил необходимые вычислительные мощности.

Что в результате

Wildberries быстро получил гибкую инфраструктуру для оперативного решения бизнес-задач, а также сократил time to market. С помощью облачных мощностей с GPU компания смогла быстрее выйти на новый рынок и снизить затраты на подготовку в несколько раз.

Читать кейс 🔍

Теги:
Рейтинг0
Комментарии1

Храните и обрабатывайте данные в аналитической базе данных Evolution Managed ArenadataDB 🗄️

❓ Что за сервис? Evolution Managed ArenadataDB — аналитическая БД, которая поможет с хранением и обработкой структурированных и полуструктурированных данных. ArenadataDB развернута на базе open source СУБД Greenplum, а в основе лежит архитектура MPP. Это позволяет быстро и эффективно работать с большим объемом данных, в том числе в критически важных системах.

🖥 Особенности и преимущества. С Evolution Managed ArenadataDB можно развертывать инстансы без привлечения инженеров и обслуживания инфраструктуры, кластеры Greenplum разворачиваются автоматически. Конфигурации от 3 до 50 ТБ позволяют адаптировать систему под разные задачи, а высокая доступность (SLA 99,7%) гарантирует надежную работу.

ADB способна обрабатывать сложные SQL-запросы. Сервис предлагает надежные инструменты для резервного копирования и восстановления данных, включая полное и дифференциальное резервное копирование, а также восстановление на момент времени. Есть возможность создать приватный инстанс, недоступный из интернета.

👨‍💻 Кому будет полезно. Финансовым и страховым организациям, ретейлу, логистике, бизнесу и любым другим отраслям, где важна работа с большими объемами данных. Также сервис будет полезен в научно-исследовательских учреждениях и компаниях, занимающихся разработкой искусственного интеллекта, машинным обучением.

✍️ Где, как и для чего использовать. Evolution Managed ArenadataDB подойдет, чтобы создавать корпоративные хранилища данных для бизнес-аналитики и отчетности. Сервис позволяет анализировать и прогнозировать действия клиентов, сегментировать аудиторию, персонализировать акции. Еще можно хранить и обрабатывать большие объемы данных для работы с AI и ML, быстро выполнять сложные аналитические запросы.

Хотите больше узнать о сервисе? Заглядывайте в документацию, а еще смотрите дискуссию об аналитике данных в облаке с конференции GoCloud 2025.

Теги:
Всего голосов 1: ↑1 и ↓0+2
Комментарии0

«Первая Форма» заняла третье место в рейтинге no-code платформ CNews

Портал Cnews опубликовал рейтинг и обзор российских no-code платформ. No-code — это способ разработки ПО без написания кода и участия программиста. С помощью встроенного конструктора и шаблонов в таком решении можно реализовать работу с задачами, кастомизировать интерфейс и не только.

При составлении рейтинга эксперты учитывали следующие критерии:

  1. Возможности для автоматизации бизнес-процессов.

  2. Безопасность и управление доступами.

  3. Интерфейс и персонализация.

  4. Интеграция, документы и обработка данных.

  5. Аналитика, отчётность и визуализация.

BPM-система «Первая Форма» заняла в рейтинге третье место. Эксперты высоко оценили её возможности для автоматизации, интерфейс и множество инструментов для работы с данными. Решение позволяет:

  • просматривать и детализировать бизнес-процессы вплоть до полей в документах;

  • расширять библиотеку функций под потребности компании;

  • просматривать логи по сервисам для оперативного решения проблем;

  • конструировать экранные формы под любые задачи;

  • интегрировать любые внешние сервисы по API и не только.

Полный рейтинг доступен на сайте Cnews.

Теги:
Всего голосов 6: ↑5 и ↓1+4
Комментарии0

Когда тебе 19, то можно все! Готовим розыгрыш ко дню рождения Таймвеб 25 мая 🥳

Уже в эту пятницу вы сможете с помощью бота ответить на 19 вопросов про Timeweb и стать участниками розыгрыша крутых подарков.

О призах расскажем подробнее:

  • 👉Первые 5 человек, ответивших на все вопросы правильно, получат 19 000 бонусов на баланс в Клауде. Среди остальных разыграем 10 фирменных худи.

  • 👉Те, кто ответит правильно на 15 вопросов, участвуют в розыгрыше 15 спортивных бутылок.

  • 👉Среди ответивших правильно на 10 вопросов разыграем 20 классных футболок.

Следите за каналом в пятницу, чтобы не пропустить ссылку на бота. Удачи всем охотникам за призами!

Теги:
Всего голосов 7: ↑7 и ↓0+9
Комментарии0

Встречайте новый сервис — реестр контейнеров Kubernetes 🔥

Реестр контейнеров (Container Registry) — это хранилище для Docker-образов, которое позволяет их загружать, скачивать и использовать в Kubernetes и других окружениях.

Юзкейс: после сборки приложения в CI образы автоматически сохраняются в приватном реестре. Потом вы можете использовать их для деплоя в Kubernetes — релизы будут быстрее, а управление версиями проще.

Для подключения переходим в раздел «Kubernetes» → «Реестры контейнеров» → нажимаем кнопку «Создать» и выбираем нужный объем. Подробнее о подключении читайте в доке.

Цены и конфиги:

  • 🐟 На выбор шесть готовых тарифов: от 5 ГБ за 40 ₽/мес до 100 ГБ за 200 ₽/мес.

  • 🦈 Плюс конфигуратор, в котором можно настроить объем до 2 ТБ.

Добавить образы в свой контейнер в Kubernetes →

Теги:
Всего голосов 7: ↑7 и ↓0+9
Комментарии0

«Многие говорят про ИИ, а у них обычные математические модели лежат в бэкэнде»

На минувшей неделе в Центре международной торговли в Москве состоялся большой весенний форум Upgrade Retail 2025, собравший весь «цвет» российского рынка торговли. Одной из самых интересных сессий стала дискуссия «IT инфраструктура и автоматизация бизнес процессов», в ходе которой эксперты делились мнениями в том числе о практике использования искусственного интеллекта.

Выступавший в сессии руководитель отдела электронной коммерции маркетплейса здоровья «Здравсити» Александр Тюкин был настроен скептически и призвал не подменять понятия:

– Все, что для обывателя выглядит, как искусственный интеллект, на самом деле может оказаться результатом хорошо выстроенных простых алгоритмических моделей, лежащих в основе любой автоматизации. Сегодня в ритейле кейсы применения реально высоких ИИ-технологий – это скорее исключение, чем распространённая практика. Текущая стадия развития искусственного интеллекта находится на том этапе, когда его внедрение потребует значительно больших ресурсов, чем использование имеющихся аналитических инструментов для обработки данных. Поэтому, когда кто-то говорит про ИИ, на поверку может оказаться, что у них обычные математические модели реализованы в бэкэнде.

руководитель отдела электронной коммерции маркетплейса здоровья «Здравсити» Александр Тюкин
руководитель отдела электронной коммерции маркетплейса здоровья «Здравсити» Александр Тюкин

Эксперт рассказал об одном из направлений автоматизации в «Здравсити», связанном с минимизацией риска возврата товаров:

– Аптечный ассортимент, особенно термолабильный (с особыми температурными условиями хранения и подлежащий списанию, если его не выкупил клиент) требует особых подходов к логистике и контролю за выкупаемостью. Да, и в других сферах торговли есть такие товары, например, продукты глубокой заморозки. Но лекарства бывают очень дорогими, и риски списания оборачиваются большими потерями для бизнеса. Что мы делаем? Анализируем поведение покупателя, сроки получения им товаров, и если видим, что в выбранную клиентом аптеку поехал термолабильный препарат, то в таком случае автоматически срабатывают роботы колл-центра, которые получают подтверждение о намерении приобрести такой дорогостоящий термолабильный препарат, а затем напоминает о необходимости выкупить заказ. Благодаря такой автоматизации минимизируются риски списаний. Это простейшие алгоритмические модели, которые пока, в отличие от ИИ, работают четко и надежно.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

ITFB Group совместно с BPMSoft приглашает на вебинар, посвященный теме организации правильной подготовки к выбору сложных ИТ-решений на примере CRM-платформы.

Вебинар будет полезен компаниям крупного бизнеса (включая Enterprise), планирующим внедрение с нуля или замену legacy-систем как в рамках импортозамещения, так и при смене самописных решений для широкого класса ИТ-систем, автоматизирующих различные бизнес-процессы (BPM, HRM, ATS, КЭДО, SRM, СЭД и др.)

Обсудим:

⏩ Как важно подготовиться к выбору сложных ИТ-решений для крупного бизнеса на примере выбора CRM-системы

⏩ Почему запросы предложений не содержат необходимой информации для проведения точной оценки стоимости внедрения

⏩ Как методология предпроектного обследования (ППО) от ITFB Group помогает создать качественный RFP (запросы предложения)

⏩ Кейсы: ППО незначительно увеличивает сроки и бюджет, но сильно снижает риски

⏩ Как при помощи ППО и гибкого лицензирования вендора можно снизить ТСО в проекте CRM

⏩ Применение ППО для выбора других сложных ИТ-систем (BPM, СЭД, SRM, HRM, ATS, КЭДО)

Спикеры:
Николай Чекин — директор по развитию отношений с партнерами, ITFB Group
Максим Илюхин — директор по продажам, BPMSoft

Дата и время: 29 мая в 11:00

ЗАРЕГИСТРИРОВАТЬСЯ

Теги:
Рейтинг0
Комментарии0

Ежемесячный дайджест: новое за май 🌦️

☁️ Опубликовали записи докладов и дискуссий по всем трем трекам нашей масштабной конференции GoCloud 2025: инфраструктура и сервисы, AI&ML и сценарии работы в облаке. Смотреть доклады.

🤖 Приглашаем на второй Cloud․ru Tech Lab: DevOps — митап для DevOps- и SRE-инженеров. В этот раз обсудим сложности DevOps-процессов и разберем DevOps-практики на реальных кейсах. В программе крутые доклады и afterparty c нетворкингом. Присоединиться можно онлайн и офлайн.

💼 В новом кейсе рассказали, как «Литрес» — компания-лидер на рынке лицензионных цифровых книг в России и странах СНГ — построила облачное аналитическое хранилище на базе КХД Cloud.ru и сократила время обработки и анализа данных. Например, теперь «Литрес» обрабатывает простые запросы при обращении к данным за 5 секунд. 

🚀 Выпустили в общий доступ (General Availability) сервис для управления публичными и приватными доменными зонами — Evolution DNS. Он поможет управлять DNS без сложных настроек и покупки собственных серверов, создавать публичные и приватные доменные зоны, обеспечивая надежную среду для разработки и тестирования. А еще вы будете платить только за фактически использованные ресурсы.

⚙️ Обновили наши облачные платформы. Например, добавили поддержку работы с deb-пакетами в сервис для хранения, совместного использования и управления Docker-образами и Helm-чартами Evolution Artifact Registry. Подробнее обо всех апдейтах на других наших облачных платформах читайте в дайджесте на сайте.

📺 Провели вебинары, а сейчас их можно посмотреть в записи:

Также приглашаем на предстоящие вебинары: 

  • Резервное копирование в облаке: как спасти бизнес от потери данных. На вебинаре вы узнаете, как перенести операционные расходы по управлению данными на облачных провайдеров, оптимизируя процессы резервного копирования и аварийного восстановления. Мы также расскажем, как добиться надежности, гибкости и экономии в условиях растущих объемов данных. 29 мая в 11:00 мск.

  • Почему госсектору и крупному бизнесу нужны гибридные облака. На вебинаре расскажем о модульной платформе для создания частного, гибридного или распределенного облака Cloud.ru Evolution Stack. Вы узнаете, как в сжатые сроки импортозаместить и модернизировать унаследованную инфраструктуру, построить частное облако в собственном дата-центре, а также реализовать гибридные облачные сценарии. 10 июня в 11:00 мск.

🎧 В новом выпуске подкаста обсудили с Алексеем Четыркиным, директором по Data Science в Magnit Tech, как ритейл-гигант внедряет AI и какие технологии меняют будущее торговли.

🎓 В бесплатном курсе Cloud.ru Evolution Fundamentals рассказываем, как работать с IaaS-сервисами облачной платформы Cloud.ru Evolution и настраивать их под свои проекты и задачи. Курс подойдет системным администраторам, начинающим IT-специалистам и всем, кто хочет освоить облачные технологии. А еще предлагаем пройти сертификацию, чтобы официально подтвердить свои знания и навыки.

💸 Предлагаем попробовать обновленную реферальную программу: теперь рекомендовать сервисы Cloud.ru клиентам, коллегам или друзьям можно с большей выгодой. Вы получите 20% от суммы чеков приведенных пользователей в первый год и 15% — в последующие годы. Участвовать могут самозанятые, ИП и юридические лица. Присоединиться к программе можно до 31 мая.

До встречи в июне!

Теги:
Рейтинг0
Комментарии0

Новая консоль для облачных серверов

Встречайте в панели серийную консоль — быструю и с удобным копипастом.

Работает «из коробки» на серверах, установленных после 4 апреля 2024. Для остальных — одна команда в панели управления, и готово.

Из удобных фич:

➖ Поддержка Ctrl+C/Ctrl+V, скролла и мыши в терминале.
➖ Подсветка синтаксиса в один клик.
➖ Независимость от публичной сети и SSH.
➖ Мгновенный запуск и оптимизация потребления ресурсов.

✏️ VNC-консоль также остается доступной. На всех серверах, кроме тех, что с Виндой, можно легко переключаться между консолями.

Затестить новую консоль →

Теги:
Всего голосов 8: ↑8 и ↓0+10
Комментарии0

Как добиться надежности, гибкости и экономии в условиях растущих объемов данных? Расскажем на вебинаре.

📆 Когда: 29 мая в 11:00 мск

📍 Где: онлайн

В условиях стремительного роста объема информации возникают требования к использованию новых подходов к управлению и защите данных. Но облачные технологии меняют правила игры. На вебинаре вы узнаете, как перенести операционные расходы по управлению данными на облачных провайдеров, оптимизируя процессы резервного копирования и аварийного восстановления. 

В программе:

  • что такое резервное копирование и аварийное восстановление: отличия и необходимость в разных сценариях;

  • важность резервного копирования и аварийного восстановления в рамках концепции непрерывности данных;

  • причины использовать облако для обеспечения непрерывности данных;

  • дополнительные концепты для защиты информации;

  • демо: как настроить резервное копирование и аварийное восстановление в облаке.

Вебинар будет полезен всем, кого волнует обеспечение непрерывности и отказоустойчивости бизнеса: IT-директорам, системным администраторам, инженерам и архитекторам инфраструктуры.

Зарегистрироваться 👈

Теги:
Рейтинг0
Комментарии0

Митап для инженеров дата-центров. Присоединяйтесь!

Привет, Хабр! 23 мая в Москве проведем Selectel Infra MeetUp — ивент для инженеров дата-центров, которые эксплуатируют IT-инфраструктуру. Вас ждут лекции, технические демо-стенды, экскурсия по дата-центру и турнир с розыгрышем призов. Афтепати с напитками и Selectel Shop — приятные бонусы. Присоединяйтесь лично или подключайтесь онлайн!

Обсудим горячие вопросы

  • Из чего состоит оптический кабель и какие типы кабелей используются в работе современных дата-центров? 

  • Как мы создали и развиваем робота для прокладки кроссировок?

  • Что делать, если вы уже на опыте, но все еще боитесь вопроса «Кем вы видите себя через 5 лет»?

  • Какой карьерный трек выбрать инженеру дата-центра? 

Очных участников также ждет практическая часть: вы рассмотрите сервер Selectel под капотом, узнаете, зачем рынку нужен новый дистрибутив Selectel OS и пообщаетесь с инженерами, которые построили инфраструктуру продукта, объединяющего сотни мобильных устройств в одну систему. 

Участие бесплатное, нужно только зарегистрироваться.
Участвовать ➡️

Теги:
Всего голосов 2: ↑2 и ↓0+4
Комментарии0

Как связать пару тысяч ИП и маркет?

Представьте, что ваш бизнес обслуживает более 2 000 продавцов, интегрированных с крупнейшими маркетплейсами. Каждый день поступает множество запросов, и важно обеспечить стабильную работу платформы при высокой нагрузке. Как сделать так, чтобы система оставалась надежной и безопасной, а данные не терялись? 

Рассказываем на примере кейса XWAY. Переходите в Академию Selectel чтобы узнать, как компания:

  • Построила гибридную и отказоустойчивую инфраструктуру с обработкой 1 000 запросов в секунду.

  • Использует облачные серверы, Managed Kubernetes и выделенные серверы от Selectel для обеспечения высокой производительности.

  • Обеспечивает быструю и надежную сетевую связность при уровне SLA 99,98%

  • Автоматизировала управление инфраструктурой, снизив зависимость от сторонних специалистов.

Теги:
Всего голосов 4: ↑4 и ↓0+5
Комментарии0

Ближайшие события

Смотрите новый выпуск подкаста про AI и Data Science 🔥

В гостях у Cloud.ru — Алексей Четыркин, директор по Data Science в Magnit Tech. В подкасте обсудили, как ритейл-гигант внедряет AI и какие технологии меняют будущее торговли.

Также в выпуске:

  • как организовать работу с данными в ритейле эффективно,

  • для чего «Магниту» нужна собственная AI Lab,

  • какие функции могут забрать на себя AI-агенты.

Посмотреть подкаст можно на YouTube и VK Видео 👈

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Приглашаем на вебинар, посвященный последним обновлениям IVA MCU — ведущей платформы видеоконференцсвязи на российском рынке*

Вы узнаете, как новая версия помогает повысить безопасность коммуникаций, упростить внедрение и сделать работу сотрудников комфортной и продуктивной. Наши эксперты продемонстрируют интерфейс, расскажут о новых функциях с ИИ, покажут реальные кейсы внедрения и ответят на все ваши вопросы.

Спикеры

  • Дмитрий Журавлев, директор по продукту IVA MCU

  • Дмитрий Чугунов, руководитель управления поддержки продаж

Что вас ждет

  • Обзор ключевых функций новой версии IVA MCU

  • Экскурс: как мы обеспечиваем безопасность платформы

  • Примеры успешного внедрения

  • Дорожная карта развития на 2025 год

  • Ответы на вопросы

Зарегистрироваться прямо сейчас.

 *По данным CNews Analytics: Крупнейшие поставщики решений для видеоконференцсвязи 2023.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

5 книг, чтобы прокачать скиллы в SRE 📚

Со всеми, кто развивает инженерные практики, подборкой делится Антон Быстров — SRE-инженер Cloud․ru.

📖 SRE Table of Contents OT Google. Это своего рода «путеводитель» по принципам Site Reliability Engineering (SRE). Он объясняет, почему определенные методы и процессы должны использоваться в разработке и эксплуатации систем. Книги служат отличной базой для понимания философии и практических аспектов SRE, включая мониторинг, автоматизацию, управление инцидентами и многое другое.

📖 Проект «Феникс». Книга, которая рассказывает историю трансформации крупной компании через призму внедрения методов DevOps. Автор романа Брайан Дэрроу показывает, как команда разработчиков и операционных сотрудников объединяется для достижения общей цели — создания и запуска нового продукта. Хотя «Проект „Феникс“» — это прежде всего художественное произведение, оно содержит множество реальных примеров и идей, которые будут полезны как разработчикам, так и менеджерам, стремящимся внедрить современные подходы к управлению проектами и процессами.

📖 Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих — Бхаргава А. Алгоритмы играют ключевую роль в работе любой системы, и эта книга поможет вам глубже понять их принципы. Она проиллюстрирована и написана понятным языком, что делает её идеальной даже для начинающих.

📖 Запускаем Prometheus. Мониторинг инфраструктуры и приложений: Пивотто, Бразил. Одна из базовых книг по мониторингу. Она подробно описывает, как использовать Prometheus для сбора и анализа метрик, что является неотъемлемой частью работы SRE. Понимание экосистемы Prometheus значительно упростит вашу повседневную работу.

📖 Киф Моррис — Программирование инфраструктуры. Это руководство по подходу к инфраструктуре как к самостоятельному продукту. Оно охватывает как теорию, так и практику, помогая понять, как эффективно управлять инфраструктурой и обеспечивать ее надежность и масштабируемость.

Уже читали книги из списка? А какие готовы порекомендовать от себя? Делитесь в комментариях 👇

Теги:
Рейтинг0
Комментарии0

Вебинар ISPsystem: «VMmanager – мощное решение для автоматизации бизнеса»

Приглашаем вас на вебинар компании ISPsystem (входит в «Группа Астра»)!

На вебинаре вы узнаете про VMmanager – масштабируемую on-premise платформу серверной виртуализации. Продукт позволяет виртуализировать все основные составляющие современной инфраструктуры: виртуальные машины и контейнеры, виртуальные сети. При этом является коробочным решением, прост в установке и эксплуатации.

В рамках вебинара будет проведена демонстрация работы платформы. Ждем вас!

→ Дата и время: 13 мая 2025, с 10:30 (мск).

→ Спикер: Станислав Южанин, пресейл-инженер компании ISPsystem.

Зарегистрироваться

ISPsystem — российский разработчик платформ для комплексного управления ИТ-инфраструктурой. С 2004 года мы создаем софт для управления оборудованием, серверной виртуализацией, автоматизации учета и выдачи ресурсов.

Теги:
Рейтинг0
Комментарии0

Запустили Evolution ML Inference — сервис для развертывания ML- и DL-моделей в облаке 🤖

❓ Что за инструмент? С помощью Evolution ML Inference можно запускать и развертывать ML-модели из библиотеки Hugging Face на облачных мощностях с GPU, в том числе в пользовательских Docker-образах. А для более эффективного инференса также можно использовать среды исполнения vLLM, TGI, Ollama, Diffusers и Transformers.

🖥 Особенности и преимущества. Благодаря технологии Shared GPU ML-модели могут совместно использовать ресурсы графического ускорителя — это экономит ресурсы облака и повышает производительность. Масштабирование происходит динамически — если число запросов превышено, дополнительные мощности выделяются автоматически. Или наоборот, один GPU можно использовать для инференса сразу нескольких моделей. Оплата за использование — по модели pay-as-you-go.

👨‍💻 Кому будет полезно. Сервис найдет применение во всех сферах, где актуально машинное обучение. Evolution ML Inference можно использовать при создании ML- и DL-моделей для бизнеса, медицинских и образовательных учреждений, ретейла, кибербезопасности, производства и других областей.

✍️ Где, как и для чего использовать. Сервис подойдет для инференса LLM и TGI, диффузионных моделей и моделей-трансформеров, а также аудит-логирования. Какие задачи помогают решать модели:

  • распознавание объектов и речи;

  • прогнозирование поведения клиентов;

  • составление логистических маршрутов;

  • генерация текстов;

  • перевод, суммаризация и другие операции с текстом.

А больше об Evolution ML Inference можно узнать из доклада конференции GoCloud 2025 «Эволюция запуска ML-моделей» 😉.

Теги:
Рейтинг0
Комментарии0

Опубликовали программу infra.conf'25 — конференции про работу с высоконагруженными системами и инфраструктурой

Итоговая программа ежегодной infra.conf'25 объединит доклады про платформенную разработку, применение больших языковых моделей, решения с открытым исходным кодом, обеспечение безопасности, инфраструктуру для машинного обучения и мобильной разработки.

Спикерами infra.conf'25 станут ведущие инженеры и разработчики Яндекса, Купера, MTS Web Services, Positive Technologies, AvitoTech, Sber AI и других компаний. Организаторы мероприятия — команда Yandex Infrastructure, которая создаёт и предоставляет внутреннюю инфраструктуру Яндекса.

Конференцию откроет главный доклад от Андрея Година, руководителя Yandex Infrastructure, и Александра Чубинского, руководителя Yandex Platform Engineering.
Также среди спикеров infra.conf'25:

  • Александр Николаичев и Николай Гриценко из Yandex Infrastructure — «Все дороги ведут в Internal Development Platform (IDP)».

  • Роза Морозенкова из Купера — «ML‑платформа: зачем она нужна вам, нам и ML‑инженерам».

  • Кирилл Сюзев из команды платформы для разработчиков SourceCraft — «Облачный CI/CD — 5-звёздочный отель для особо опасных любимых пользователей».

  • Валерий Евдокимов из ecom.tech (ex. Samokat.tech) — «Превозмогая opensource: опыт внедрения OpenTelemetry, Qryn и Coroot для выстраивания системы наблюдаемости».

  • Виталий Шишкин из Positive Technologies — «Tetragon: лучшие практики и нюансы разработки Tracing Policy».

  • Эдуард Оболенский из Yandex Infrastructure — «Опыт построения инфраструктуры вокруг мобильной разработки».

Также гости мероприятия смогут посетить воркшоп по Surface Mount Device‑пайке — это процесс пайки электронных компонентов поверхностного монтажа к печатным платам.

infra.conf'25 пройдёт 5 июня в Москве в Loft Hall #8. Также доклады можно посмотреть онлайн на сайте конференции. Для участия нужно зарегистрироваться на сайте и получить приглашение.

Теги:
Всего голосов 9: ↑9 и ↓0+10
Комментарии0

Павел Гуральник рассказал о ситуации на рынке виртуализации в эфире AM Live

Рынок виртуализации стремительно меняется, и сегодня как никогда важно понимать, какие тренды задают тон, какие стратегии работают, а где остаются вызовы. Что на самом деле произошло в отрасли за последние годы? Какие задачи по развитию виртуальной инфраструктуры компании решают успешно, а над чем еще предстоит работать?

Павел Гуральник, генеральный директор ISPsystem, побывал в гостях у AM Live и в прямом эфире ответил на вопросы, которые сейчас актуальны для всех отраслей бизнеса. Публикуем его ответы в кратком формате.

— Какая система виртуализации используется в вашей компании и есть ли у вас спецусловия для отдельных отраслей?

— Мы используем собственное решение VMmanager. Что касается отраслей, то у всех компаний разные требования, например, к виртуализации или безопасности. Видя, что каждая отрасль требует своего подхода, мы предлагаем соответствующие редакции продуктов. ISPsystem адаптирует свои продукты под нужды каждого заказчика, включая ценообразование и лицензирование.

— Выделяете ли вы такие направления, как медицина или образование?

— Да, конечно! В «Группе Астра» образование идет отдельным треком, особенно школы: это стратегическое направление для подготовки кадров. Медицина тоже выделяется отдельно особыми условиями по продуктам.

— Чем вендорские решения лучше open source?

— Open source дает гибкость и независимость — это плюс. Можно быстро запуститься, если нет жестких требований к безопасности. Но есть и минусы. Например, нужны свои специалисты, чтобы поддерживать систему. Также проект может внезапно перестать развиваться, и тогда придется снова искать решение. Кроме того, всегда сложнее с гарантиями и долгосрочной поддержкой.

Вендорские решения — это стабильность, доработки под конкретные задачи и уверенность в том, что продукт будет развиваться.

— Что делать, если open-source-проект закроется?

— Либо вкладываться в свои компетенции и развивать его самостоятельно (что дорого и сложно), либо переходить на вендорский продукт. Мы, например, сами дорабатываем open-source-решения, чтобы они отвечали современным требованиям.

— Какие у вас есть примеры крупных внедрений?

— Один из рекордов — 700 хостов в одном кластере у заказчика. Еще есть кейс с 65 тысячами виртуальных машин, распределенных географически, но с единым управлением.

— Как выбрать подходящую систему виртуализации?

— Советуем смотреть на три вещи:

  • Реальные кейсы — у вендора должны быть примеры внедрений в вашей отрасли.

  • Тестирование — важно попробовать продукт в своих условиях, а не в идеальной среде.

  • Экосистема — как решение работает с другим ПО, которое вы используете.

— Можно ли протестировать ваш продукт без долгих согласований?

— Да, у нас есть пробная версия, которую можно скачать и использовать месяц без регистрации. Сертифицированные редакции (например, для госсектора) требуют оформления и, соответственно, ввода хотя бы минимальных данных.

— Как устроена ваша техподдержка?

— Мы работаем и напрямую с заказчиками, и через партнеров. Поддержка — это не только «починить сломанное», но и канал для обратной связи. Если у клиента появляются новые потребности, мы дорабатываем продукт.

— Какие у вас модели лицензирования?

— У нас разные модели: подписки для облачных провайдеров и бессрочные лицензии для госсектора. Сейчас мы перешли на лицензирование по сокетам, хотя изначально работали по ядрам.

— От чего зависит стоимость?

— От редакции продукта, масштаба внедрения и дополнительных модулей. Например, решения для медицины или госсектора могут иметь особые условия.

Посмотреть видео целиком можно на Rutube.

Теги:
Всего голосов 1: ↑1 и ↓0+2
Комментарии0

Вклад авторов