Апскейлим видео без регистрации через сервис video2x. Проект использует модели Super-Resolution и не требуют больших мощностей. Можно запускать на слабом компе. Устанавливается за один клик. Никаких лишних сервисов и программ — только апскейлер. Работает только локально, никто не получит доступ к сведениям о видео.
Проект Pentaract позволяет сделать Telegram бесконечное хранилище файлов и превратить мессенджер в личное облако. Основа — PostgreSQL. Технология максимально экономит место, не создаёт лишний мусор, таблицы или списки. Работает без ограничений и без нарушений политики и целостности Telegram.
Клиент YouTube для Android под названием Download YT PRO весит всего 60 кБ (48 кБ в архиве). Приложение не требует Root-прав, убирает рекламу, даже спонсорскую. Видео не ставится на паузу, если свернуть приложение или заблокировать экран. Есть встроенный загрузчик видео и шортсов. Добавлен ИИ Gemini, который сразу сделает саммари даже часовых лекций и выдаст факты и советы по контенту.
Приходите на вебинар, расскажем, как сэкономить на запуске LLM-моделей
Платите за ресурсы, которые не используются, или сталкиваетесь с ошибками из-за нехватки vRAM? Тогда этот вебинар для вас. Приходите пообщаться с нашими экспертами, они расскажут, как точно рассчитать конфигурацию для запуска LLM и настраивать параметры инференса для экономии без потери в качестве.
О чем будем говорить на вебинаре:
из чего складывается потребление vRAM;
как точно рассчитать конфигурацию GPU для выбранной модели, включая форматы квантования (BF16, FP8);
какие параметры LLM сильнее всего влияют на стоимость и производительность;
как с помощью Evolution ML Inference автоматически масштабировать ресурсы и переводить модели в serverless-режим, чтобы платить только за активную работу.
Еще будет практическая часть, на которой покажем запуск LLM с оптимальными параметрами в сервисе Evolution ML Inference. Сравним разные конфигурации по производительности и стоимости.
Ждем дата-сайентистов, DevOps-инженеров и руководителей, кому интересно узнать, как оптимизировать затраты на ML-инфраструктуру.
📅 Когда? 15 января в 11:00 мск.
📍Где? Онлайн. Зарегистрируйтесь, чтобы задать вопросы экспертам в прямом эфире.
Открытый проект SpotX позволяет бесплатно слушать Spotify без рекламы и со всеми Premium-опциями. Всё, что нужно — актуальная версия Spotify и запустить на ПК одну команду.
Для Windows пишем в Powershell: iex "& { $(iwr -useb 'https://raw.githubusercontent.com/SpotX-Official/SpotX/refs/heads/main/run.ps1') } -new_theme".
Для MacOS, пишем в Терминале: bash <(curl -sSL https://spotx-official.github.io/run.sh).
Представлен локальный и бесплатный сервис BentoPDF для работы с PDF. Вся обработка происходит в браузере. Умеет объединение, разделение, поворот, удаление страниц и кроппинг, а также в нём можно быстро добавить вотермарку, сделать нумерацию страниц и поменять текст в файлах. При этом бесплатно, без лимитов и даже регистрацию не просят.
Инфраструктура, платформы и эксплуатация — темы, к которым в 2025 году вы возвращались чаще всего. Мы собрали эти материалы в один дайджест, чтобы к ним было удобно вернуться в любой момент.
Обновлён проект Python Scripts, где более 60 Python-скриптов для любых задач, включая алгоритмы по парсингу, работе с видео и фото, клонированию сайтов, скачиванию с сайтов и другие популярные решения.
Открытый проект mail2telegram позволяет перенаправляет электронную почту сразу в Telegram. Можно настроить фильтры пересылки, выбрать группу, в которую будут падать письма и автоматом отсеивать весь спам.
Частные охранные фирмы в США нанимают по аутсорсу индийских сотрудников для управления роботособаками во время патрулирования улиц. Полицейские встретили такого робопса, который с индийским акцентом объяснил, что всё в порядке, он следит за районом.
Он уже умеет разворачивать виртуальные машины, настраивать мониторинг и алертинг, подсказывать команды для терминала VM. В следующем году он станет еще способнее.
Ищите ИИ-помощника в нижнем правом углу личного кабинета Cloud.ru.
В июне мы запустили цифровую среду для внедрения GenAI в ваши проекты, а уже в ноябре вывели все сервисы среды в коммерческую эксплуатацию. Теперь все для работы с GenAI — в одном месте.
Выпустили в общий доступ 19 сервисов платформы Cloud.ru Evolution: для работы с AI и данными, переноса IT-инфраструктуры, резервного копирования и восстановления, управления кластерами Redis, доменными зонами и репозиториями.
А еще запустили 14 сервисов в стадии тестирования — их вы можете подключить бесплатно.
В марте мы запустили в коммерческую эксплуатацию Cloud․ru Evolution Stack — платформу для создания частного, гибридного или распределенного облака. А в октябре она получила официальную сертификацию ФСТЭК России.
На онлайн-вебинарах, IT-митапах, хакатонах и конференциях про облака и AI — GoCloud и GoCloud Tech.
Уже готовим мероприятия в 2026 году, следите за новостями!
🌲Покорили рейтинги
В этом году мы стали №1 среди крупнейших игроков российского рынка AI-решений (CNews Analytics) и №1 среди крупнейших поставщиков услуг IaaS в России (TAdviser).
А еще вошли в топ-5 самых дорогих компаний Рунета (Forbes) и в топ-10 самых крупных и быстрорастущих IT-компаний России (CNews500).
В Китае цифровые валюты центральных банков (CBDC) хотят привязать к цифровой идентификации пользователя. Мужчину, который ехал без шлема, полицейский подключил к дистанционным диспетчерам с помощью небольшого устройства и в режиме реального времени списал с цифрового кошелька штраф — 25 юаней.
Готово ли ваше облако к 2026 году? Быстрый FinOps-чек-лист
Облачные расходы растут, а контроль и прозрачность часто не поспевают. Чтобы понять, насколько процессы готовы к следующему году, эксперты из Практики FinOps подготовили короткий чек-лист.
Это бесплатный инструмент в формате гугл-таблицы. Прохождение занимает 5–7 минут.
Что дает чек-лист:
видно, где процессы уже работают, а где есть пробелы
понятно, на каких этапах теряется прозрачность расходов
есть конкретные шаги, что имеет смысл внедрять дальше
Чек-лист можно пройти одному, например CTO или Head of Engineering, либо вместе с командой, инженером, архитектором и финансовым специалистом.
Результат, понятный срез текущего состояния и ориентиры, как корректировать облачные расходы в 2026 году.
Команда разработки Хабра запустила культовую игру Doom прямо на профильном ресурсе для IT-специалистов. Это открытая версия Chocolate Doom, доступная в браузерах на ПК и мобильных устройствах.
Управление на ПК стандартное, также работает мышка (поворот, движение, выстрел). В мобильной версии (в горизонтальной ориентации) также добавлены контролы для удобного управления.
Academic Earth — огромная библиотека бесплатных курсов обо всем на свете от ведущих специалистов мира. От обучения химии и информатике до бизнеса и психологии;
Classcentral — самый удобный поисковик по бесплатным курсам на любую тему;
Edx — тут собраны обучающие курсы от самых топовых ВУЗов мира, таких как Гарвард, Стэнфорд и Массачусетский технологический институт. Разумеется, бесплатно;
Google Garage Courses — библиотека бесплатных курсов от Google с возможностью получить карьерный сертификат от технологического гиганта;
Khanacademy — лучший сайт для углубленного изучения математики и других прикладных наук;
Udemy — для тех, кто планирует работать в «диджитале»: отличные курсы по программированию, дизайну, веб‑разработке, графике;
Treehouse — мастхэв для будущих программистов. Простые и понятные курсы по Python, Data Science, React и другим темам.
Хотите выяснить, где учиться IT? В экосистеме Хабра есть маркетплейс курсов на Хабр Карьере, на котором собраны сотни онлайн‑обучений в самых разных специализациях: программировании, аналитике, дизайне, менеджменте и других. Чтобы пользователи могли проверить качество курсов, там показаны отзывы от тех, кто уже прошел обучение — изучайте и выбирайте лучшее для себя.
Пользователи по всему миру в режиме онлайн могут наблюдать за полетом волшебных саней Санта-Клауса в сервисе Flightradar.
Санта-Клаус вылетел из Северного полюса 23 декабря около 15:00 мск и, по состоянию на 17:50 мск, пролетает над территорией Финляндии на высоте 18,2 км и движется на юго-запад.
Cloud GPU: как работает и для каких задач используется
GPU в облаке — это вычислительный ресурс для задач с высокой долей параллельных операций. Такие серверы используют, когда стандартных CPU недостаточно по производительности или времени выполнения. Ниже — как устроен Cloud GPU и для каких задач его применяют на практике на примере сервиса в Рег.облаке.
Cloud GPU — это виртуальный сервер с подключенным графическим ускорителем. Он используется для:
обучения и использования моделей ИИ;
обработки изображений, видео и звука;
3D-моделирования и рендеринга;
параллельных вычислений и аналитики.
Инфраструктура Cloud GPU построена на серверах с процессорами AMD EPYC и накопителями NVMe SSD. Используются видеокарты NVIDIA A4000 (16 ГБ), A5000 (24 ГБ) и A100 (80 ГБ). Для работы доступен готовый образ Ubuntu GPU с предустановленными библиотеками и инструментами для ML и ИИ. Управлять серверами можно через облачную платформу.
Сервис работает по модели pay-as-you-go — пользователь оплачивает только фактическое время работы GPU. Такой формат подходит для сценариев с переменной нагрузкой: обучение и дообучение моделей, периодические расчеты и inference.
количество пользователей Cloud GPU выросло на 189%;
среднее время выполнения задачи на одном сервере составило 15 часов в сутки;
среднее количество дней использования GPU на одного клиента выросло в два раза;
48% пользователей повторно заказывают Cloud GPU для новых задач.
Cloud GPU используют в e-commerce, розничной торговле и сфере услуг для аналитики, рекомендательных систем и автоматизации процессов. Наиболее востребованной видеокартой за последние шесть месяцев стала NVIDIA A5000 (24 ГБ) — ее выбрали почти 60% пользователей как сбалансированный вариант для ML- и inference-задач.
Больше о технических параметрах сервиса, доступных конфигурациях и условиях использования GPU Cloud можно узнать на сайте Рег.облака.
Проект с открытым исходным кодом bookhunter позволяет охотиться за книгами. Не нужно искать по сети и натыкаться на ограничения. Решение имеет удобный интерфейс.
OpenAI теперь позволяет пользователям напрямую регулировать уровень энтузиазма ChatGPT. Пользователи могут настраивать теплоту, энтузиазм и использование эмодзи чат-бота. Эти параметры (а также аналогичные настройки использования заголовков и списков в ChatGPT) теперь отображаются в меню «Персонализация» и могут быть установлены на «Больше», «Меньше» или «По умолчанию». Они позволяют пользователям дополнительно настраивать тон ChatGPT, помимо существующей возможности установить «базовый стиль и тон» — включая профессиональный, откровенный и необычный тона, которые OpenAI добавила в ноябре.
Тон ChatGPT был постоянной проблемой в этом году: OpenAI отменила одно обновление из-за того, что оно было «слишком льстивым», а затем скорректировала GPT-5, сделав его «теплее и дружелюбнее» после жалоб некоторых пользователей на то, что новая модель стала более холодной и менее дружелюбной.
Обновили PaaS в Рег.облаке: конфигуратор DBaaS и Kubernetes 1.34
В Рег.облаке мы постоянно развиваем наши PaaS-сервисы, чтобы давать пользователям больше гибкости и контроля для удобства работы с IT-инфраструктурой. Сегодня представляем два крупных обновления: гибкий конфигуратор для управляемых баз данных в облаке и свежую версию Kubernetes в нашем KaaS. Разбираем, что изменилось и как это упростит работу с IT-проектами.
1. DBaaS: забываем про готовые тарифы. Привет, конфигуратор!
Раньше для Managed PostgreSQL и MySQL в Рег.облаке был доступен набор готовых конфигураций. Это просто, но не всегда идеально: где-то не хватало RAM, где-то были дополнительные vCPU, а для нестандартных нагрузок приходилось брать тариф с запасом. Теперь DBaaS можно точно калибровать под свои бизнес-требования и бюджет.
Что поменялось: мы запустили полностью гибкий конфигуратор. Теперь вы сами собираете кластер, как конструктор:
выбираете точное количество vCPU (от 1);
задаете нужный объем RAM;
определяете размер диска.
В цифрах: это дает 2 761 возможную конфигурацию для точного подбора ресурсов. А значит — точное соответствие вашей задаче:
Платите только за то, что действительно используете. Для тестового стенда — минимум ресурсов, а для высоконагруженного продакшена — мощная конфигурация без компромиссов.
Баланс производительности: теперь можно тонко сбалансировать соотношение vCPU/RAM/Диск под специфику своей нагрузки (CPU-bound или I/O-bound задачи), добиваясь оптимальной цены и скорости.
Горизонтальная и вертикальная масштабируемость: по мере роста нагрузки можно увеличить или уменьшить количество vCPU и RAM (масштабирование «вверх-вниз») и расширить дисковое пространство.
2. KaaS: встречаем Kubernetes 1.34
Kubernetes-as-a-Service (KaaS) обновили до актуальной версии Kubernetes 1.34. Релиз принес 58 улучшений, и мы уже интегрировали его в нашу платформу Рег.облака. Основные направления — безопасность, стабильность и операционная гибкость.
На что обратить внимание:
Усиление безопасности: появились новые декларативные политики безопасности, которые помогают контролировать доступ к ресурсам кластера на более тонком уровне. Это еще один шаг к Security-by-design.
Стабильность API: критически важные интерфейсы стали еще надежнее, что уменьшает риски при обновлениях и работе сторонних инструментов.
Улучшения в управлении ресурсами и производительности: под капотом — множество оптимизаций в работе с подами, узлами и сетевыми плагинами, которые положительно скажутся на отзывчивости и эффективности кластеров.
Теперь кластеры становятся быстрее, стабильнее и безопаснее. Вы получаете доступ к современному стеку технологий, не тратя время на самостоятельное обновление и отладку control plane.
Все новшества уже доступны в панели управления Рег.облака. Нам важно ваше мнение — пробовали уже гибкие конфигурации БД, какие задачи планируете решать с помощью KaaS? Задавайте вопросы в комментариях — обсудим детали.
Только вдумайтесь в масштаб: в этот раз организаторы получили рекордные 900 заявок из 44 регионов по всей России. На этапе отбора в итоговые 22 номинации попали лишь по 6 проектов, каждый из которых в финале отсматривало экспертное жюри.
На сегодняшний день это главная награда за вклад в развитие российского интернета, и мы рады, что стали частью этой истории.
Разная тарификация. Один провайдер включает трафик в стоимость ВМ, второй берёт за каждый гигабайт отдельно. Третий считает по часам, четвёртый – по фиксу. Свести все это воедино – задачка со звездочкой.
Стоимость межоблачного трафика. Если база живёт в одном облаке, а приложение – в другом, каждый запрос гоняет данные туда-обратно.
Отсутствие прозрачности. Когда никто не знает, во что обходится работа, – это большая проблема. Ведь если не знаешь цифры, то и оптимизировать нечего.
Что с этим делать?
Закладывать мультиклауд в архитектуру сразу. Kubernetes, Terraform, инфраструктура как код — это не модные словечки, а реальная защита от vendor lock-in.
Считать cost per unit для каждого сервиса.
Давать командам бюджеты и показывать реальные цифры. Когда разработчики видят, что их фича жрёт 300 тысяч в месяц, они вдруг начинают задумываться об оптимизации.
Нарисовать схему, где что лежит. Часто оказывается достаточно просто переставить сервисы и таким образом сократить расходы на трафик почти вдвое.
Есть что сказать по теме мультиклауд? Присоединяйтесь к нашему комьюнити Практики FinOps. Там очень ждут вашего мнения.
В Рег.облаке появился Terraform-провайдер для IaaS
В Рег.облаке стал доступен Terraform-провайдер для управления IaaS-инфраструктурой. Теперь облачные серверы и их снэпшоты можно создавать, изменять и удалять через код.
Terraform работает по декларативному принципу: пользователь описывает желаемое состояние инфраструктуры, а инструмент рассчитывает порядок действий и приводит ресурсы к нужной конфигурации через API облака.
На текущем этапе провайдер позволяет управлять облачными серверами, их снэпшотами и SSH-ключами. Через Terraform можно создавать серверы с GPU и без GPU, разворачивать их из готовых образов и снэпшотов, массово поднимать и удалять ресурсы, менять конфигурацию и тарифы, а также управлять SSH-ключами.
Использование Terraform упрощает работу с инфраструктурой: окружения для разработки, тестирования и продакшена становятся воспроизводимыми, изменения контролируются через Git, несколько специалистов могут работать над инфраструктурой одновременно, а сами ресурсы легко встраиваются в CI/CD-процессы.
В следующих обновлениях планируется расширение провайдера и добавление поддержки других ресурсов Рег.облака, включая управляемые базы данных и Kubernetes-кластеры. А уже сейчас на сайте Рег.облака можно посмотреть документацию и начать работу с Terraform-провайдером.
OpenAI представила гайд по созданию картинок в различных стилях в GPT-image-1.5, включая инфографику, карты, логотипы, копирование стиля и перенос на другие работы, создание карточек товаров и примерка одежды.
Ранее OpenAI объявила о запуске модели ChatGPT Images на базе GPT-5.2, предназначенной для генерации изображений с использованием технологий искусственного интеллекта. Новая модель поддерживает широкий спектр функций редактирования, включая добавление и удаление элементов, комбинирование и смешивание изображений, а также их транспонирование. Обновление интегрировано в приложение ChatGPT и доступно пользователям во вкладке «Изображения».
S3 редко работает в одиночку — чаще он взаимодействует с другими сервисами: Lambda, EC2 и CloudFront. Через Lambda можно автоматически обрабатывать файлы сразу после загрузки, через EC2 — работать с данными напрямую, без промежуточных копий, а CloudFront ускоряет доставку контента пользователям по всему миру.
OpenAI объявила о запуске модели ChatGPT Images на базе GPT-5.2, предназначенной для генерации изображений с использованием технологий искусственного интеллекта. Новая модель поддерживает широкий спектр функций редактирования, включая добавление и удаление элементов, комбинирование и смешивание изображений, а также их транспонирование. Обновление будет интегрировано в приложение ChatGPT и станет доступно пользователям во вкладке «Изображения».
В ChatGPT появился новый раздел «Изображения», в котором собраны все ваши картинки, а также есть набор из нескольких стилей для быстрого редактирования без составления промта.
Новый генератор изображений уже доступен бесплатно всем пользователям ChatGPT.
Несколько ключевых улучшений:
Теперь ИИ не искажает лица при редактировании изображений и точно следует инструкциям.
Улучшена работа с различными стилями. Например, можно сделать из своей фотографии новогоднюю игрушку.
Скорость работы выросла в 4 раза. Это реально заметно.
Улучшена работа с текстом. Генератор понимает Markdown и может добавлять код на картинки.
Выделенные серверы переехали в личный кабинет Рег.облака
В Рег.облаке появилась возможность управлять выделенными серверами (bare-metal) прямо из личного кабинета — рядом с облачными ресурсами. Теперь физическое железо и виртуальная инфраструктура собраны в одном интерфейсе.
Гибридное облако стало ближе
Собрать полноценную гибридную платформу: мощность физических серверов и гибкость облачных сервисов — можно в одном окне. Список выделенных серверов сейчас отображается вместе с виртуальными машинами, хранилищами и сетевыми ресурсами. А это значит, что не нужно переключаться между системами — все услуги сразу под рукой.
Что уже доступно в новом интерфейсе
Выделенные серверы. Раздел находится рядом с облачными ресурсами — удобный шаг к общему реестру всех услуг.
Управление серверами. Статусы, характеристики, перезагрузка, доступ к IPMI и IP-KVM.
Доступы и сетевые настройки. Логины, пароли, DNS-настройки, управление доступами к ОС.
Работа с IP-адресами и сетями. Просмотр, заказ дополнительных IPv4/IPv6, настройка сетей и PTR-записей.
Что будет дальше
Мы продолжаем развивать интерфейс. В ближайших обновлениях появятся:
продление услуг в новом кабинете;
заказ резервного копирования;
встроенный мониторинг метрик;
заказ лицензий ispmanager;
виртуальный дата-центр VMware;
расширенный функционал для работы с ЛК.
Новый интерфейс уже доступен в личном кабинете Рег.облака. Тестируйте и делитесь впечатлениями: что понравилось, что стоит улучшить и каких функций пока не хватает. Пишите нам на team@reg.cloud — обратная связь особенно важна на этом этапе.
OpenAI представила официальный гайд по промптингу новой модели GPT-5.2. Внутри ждут готовые промgты, советы и лучшие кейсы использования — всё это можно адаптировать под свои задачи.
OpenAI представила свою новую модель — GPT-5.2. Модель прокачали в офисной рутине, она умеет создавать хорошие презентации и таблицы. Также в ней улучшен кодинг и контекст. Теперь модель дольше и лучше помнит, о чём общалась с пользователем. Свежие знания до августа 2025 года. Модель почти не ошибается: на 30% меньше галлюцинаций по сравнению с GPT-5.1.
Как GUDDA сэкономила в три раза, развернув инфраструктуру для 1С в облаке
👨💻 Что за компания
GUDDA — это сеть ломбардов, магазинов электроники и ювелирных изделий. У компании есть филиалы в разных городах России, например Ростове-на-Дону, Азове, Батайске, Каменск-Шахтинске, Новочеркасске, Таганроге и Шахтах. GUDDA дает краткосрочные займы под залог, покупает и продает украшения, гаджеты и технику.
🕵️ Какая была задача
IT-инфраструктура GUDDA изначально строилась по подходу cloud native: часть инфраструктуры разместили в частном контуре, а в облаке — системы, нагрузка на которые возрастала по ходу развития бизнеса.
Компания хотела нарастить мощности для баз 1С, SQL-серверов и системы резервного копирования, поэтому решила реализовать мультиоблачную стратегию. Для этого GUDDA начала искать еще одного облачного провайдера.
Ключевым требованием стала отказоусточивость — даже минута простоя может стоить GUDDA миллионы рублей. Еще перед переездом в облако команда хотела протестировать сервисы на реальных задачах и оценить, насколько хорошо выстроена коммуникация с технической поддержкой провайдера.
👨🔧 Как ее решили
GUDDA в течение месяца тестировала сервисы Cloud.ru, подбирала оптимальные конфигурации процессоров и накопителей. Менеджер со стороны провайдера всегда была на связи и быстро направляла к нужным техническим специалистам, если появлялись вопросы по работе сервисов или настройке инфраструктуры.
К концу теста компания попробовала все варианты и четко знала, что реализует и сколько это будет стоить. В итоге клиент выбрал виртуальный ЦОД с высокочастотными процессорами 3,5 ГГц.
Для миграции мы предоставили GUDDA выделенный канал с гарантированной средней скоростью 500 МБ/с — это позволило быстро перенести данные в облако. Компания получила готовую облачную инфраструктуру, в которой меньше чем за час развернула и настроила нужные виртуальные машины.
📈 Что в результате
Инфраструктура в облаке Cloud.ru работает без сбоев, а команда GUDDA может масштабировать мощности через личный кабинет, не обращаясь в поддержку.
Главный финансовый результат — содержать аналогичную инфраструктуру локально обошлось бы компании в три раза дороже, чем в облаке.
GUDDA планирует перенести в облако и другие системы, включая базы 1С для круглосуточных точек, организовать катастрофоустойчивую инфраструктуру с использованием резервного ЦОД.
Прошли аттестацию высшего уровня защиты данных УЗ-1 🛡
Официально подтвердили максимальный уровень защищенности нашей инфраструктуры.
Теперь вы можете размещать медицинские системы и работать с любыми специальными категориями данных (здоровье, биометрия).
➖ Локации: Москва, Санкт-Петербург, Новосибирск ➖ Защита: аппаратные межсетевые экраны, IDS/IPS, сканирование уязвимостей, контроль целостности среды виртуализации
Представлен открытый проект для подготовки презентаций с помощью нейросетей Paper2Slides. Решение извлекает ключевые идеи исследований, делает саммари текстов и размещает их на слайдах, готовит картинки с приятным визуалом, подбирает шрифты и типографику. Проект поддерживает все популярные форматы файлов: PDF, Word, Excel, PowerPoint и другие.
Подключайтесь к вебинару сегодня в 16:00 мск. Разберем, как эффективно управлять IT-инфраструктурой в 2026 году и почему bare metal снова становится ключевым элементом для стабильности и производительности. Покажем инструменты, которые помогают автоматизировать рутину и ускорять развертывание сервисов.
Google представил топ лучших расширений для Chrome в 2025 году:
HARPA AI: позволяет автоматизировать любую работу в интернете: мониторинг сайтов, напоминания, боты, поиск, скрапинг;
Quillbot: если работаете с текстом — это вам. Проверка орфографии, рерайт ИИ‑текста, подборка синонимов и даже проверка осмысленности текста;
Monica и Sider: добавляют в браузер боковую панель с самыми полезными нейронками. Удобный доступ к сразу нескольким чат‑ботам, быстрой генерации картинок и видео, проверке и переводу документов;
Fireflies и Bluedot: помогут в создании заметок и автоматической расшифровке бесконечных созвонов;
QuestionAI и eJOY: школьники и студенты, а это вам — помощник по выполнению домашних заданий и разбору тем по любым предметам.
Adobe Photoshop: быстрый доступ к Фотошопу. Веб‑версия проще, но там есть все нужные инструменты для редактирования фотографий, в том числе ИИ‑фотошоп;
Phia: шопинг‑расширение с ИИ для автоматического сравнения цен при покупках в браузере. Идеально, если все ещё мечтаете найти дешёвые ОЗУ.
Кейс: «Жива Технологии» арендует в облаке виртуальные машины с GPU для приложения с AI 🤖💬
👨💻 Что за компания
«Жива Технологии» — разработчик приложения JIVA, ассистента с AI, который помогает вести здоровый образ жизни. В приложении можно составить план, чтобы достичь поставленной цели: рассчитать норму воды, построить график тренировок или поправить технику упражнений.
А еще искусственный интеллект рассчитывает по фото питательность блюда: вес порции, количество калорий, белков, жиров, углеводов, микро- и макро-нутриентов. В результате такого анализа AI-помощник в JIVA советует, что можно заменить или добавить, чтобы прием пищи стал полезнее.
🕵️ Какая была задача
Искусственный интеллект внутри JIVA — это AI-модели для распознавания нутриентов по фото, встроенный AI-ассистент на базе LLM и каскад моделей по детекции и распознаванию физических упражнений. Все модели разработчик собрал на open source.
Клиенту были нужны видеокарты с GPU для инференса и обучения этих моделей. Закупать свои графические процессоры оказалось невыгодно, и он решил арендовать их в облаке. «Жива Технологии» хотел использовать виртуалки с GPU и другие облачные сервисы, чтобы мониторить работу моделей и управлять ресурсами в одном месте.
📈 Результат
Клиент использовал набор сервисов Cloud.ru, чтобы развернуть в облаке бэкенд приложения, тестовую и продовую среду и сами модели:
Развернул бэкенд и модель для подбора упражнений на пяти ВМ платформы Cloud.ru Advanced. Там же подключил сервисы для мониторинга, логирования и работы с базами данных.
Тестовую среду развернул на виртуальных машинах Evolution Compute c GPU с гарантированной долей vCPU 30% 8vCPU 16GB RAM. Для тестирования взял одну GPU-карту A100 — она позволяет экспериментировать при обучении и тестировании LLM.
Для продовой среды выбрал виртуалки с такими параметрами: 20 vCPU 117 GB RAM 1 × A100 NVIDIA 80 GB.
🚀 Что дальше
В планах «Жива Технологии» — ускорить распознавание нутриентов по фото с 8–9 до 2–3 секунд, не арендуя при этом дополнительные GPU. У Cloud.ru есть сервисы, которые помогают в инференсе моделей, их дообучении и не только. Например, для запуска и развертывания ML-моделей предложили клиенту протестировать сервис Evolution ML Inference.