Представлен открытый проект HTML skills for pragmatic visual artifacts для генерации HTML‑файлов за один клик, включая диаграммы, презентации, резюме, отчёты, планы и прочее:
html — создает любые HTML‑страницы исходя из задачи: от лендингов до портфолио;
html‑diagram — создает схемы, планы и диаграммы с фокусом на SVG;
Evolution Managed RAG — теперь источники для базы знаний сканируются глубже: при добавлении нового источника автоматически обходятся все директории сервиса. Больше никаких «а вот этот раздел мы не проиндексировали»: охват данных стал полным, и на качестве ответов LLM это будет заметно.
Evolution AI Agents — в сервисе обновили дизайн интерфейсов для инструмента EvoClaw. Меньше визуального шума, можно быстрее сориентироваться в конфигурации агента.
☁️ Cloud.ru Evolution — новые возможности в различных сервисах
Evolution Load Balancer — во вторую версию добавили балансировку трафика на виртуальные IP. В связке с поддержкой Proxy Protocol v2, которая добавилась в апреле, бэкенды теперь видят все, что нужно видеть.
Evolution Managed ClickHouse — реализовали поддержку версии 25.8. Если аналитические запросы у вас исчисляются миллиардами строк, то это обновление будет как нельзя кстати.
Evolution Managed Kubernetes — сразу несколько точечных, но важных улучшений в сервисе:
Недоступные при создании ресурсы скрываем сразу — вместо ошибки при деплое вы видите рабочие альтернативы.
Добавлены плагины: Agent Sandbox — для изолированного запуска ИИ-агентов, и Reloader — для автоматического перезапуска рабочих нагрузок при обновлении конфигураций и секретов.
Теперь поддерживается Kubernetes 1.35.
Evolution Managed OpenSearch — добавили возможность настроить окно обслуживания для технических работ. Теперь вы сами задаете время, когда кластер может быть недоступен, и техобслуживание не застанет врасплох.
Evolution Data Platform — платформа получила сразу несколько важных обновлений: Control Plane мигрировал в мультизональный кластер, появилась ручная остановка и возобновление инстансов для экономии ресурсов, обновлена система уведомлений по событиям и авариям, добавлены индикаторы статусов кластеров.
Evolution Artifact Registry — Terraform 2.0.2: теперь реестры разворачиваются через IaC.
💰 Оплата и контроль затрат
Три точечных улучшения для борьбы с типичными неудобствами: проверка пересечений бюджетов, редактирование или полное удаление лимитов, которые больше неактуальны.
🏢 Cloud.ru Advanced и Облако VMware
Cloud.ru Advanced — Terraform-провайдер обновлен до 1.79.0 с расширенным набором Data Sources и ресурсов для Direct Connect (DC).
Облако VMware — в VDI появилась веб-консоль мастер-образа прямо в личном кабинете: ставите ПО один раз — все ВМ на его базе наследуют настройки автоматически. Балансировщик ALB стал доступен на площадке PD50-02 и остается бесплатным. В вЦОД с GPU добавлены хосты на платформе HGX с ускорителями A100-80 SXM на площадках PD30-01 и PD50-01.
📊Практический гайд для тех, у кого данные есть, а толку мало
Дашборды, модели и данные есть, но все это живет в разных системах, не дружит друг с другом и весьма туманно отвечает на вопросы бизнеса?
Как раз для тех, у кого не клеится польза с реализацией, мы собрали практический гайд «Платформа данных и ИИ». Там прописана вся цепочка «бизнес-задача → метрики → архитектура». Берите на следующую встречу с CTO или CDO, когда речь снова зайдет про платформу данных и нужно будет показать, что это не «очередная хранилка».
📽️Вебинары
Выложили записи прошедших вебинаров, самое время наверстать, если пропустили:
Рассказали про кейс провайдером сервисов для мобильного аудита Retailiqa. Читайте, если вам актуально «поженить» 152-ФЗ с одинаковой доступностью сервисов из России и из-за рубежа.
По какому принципу посты минусуются? Пишу пост, об образовательной платформе по AI, которую я сам собирал уже несколько месяцев, вкладываю в нее свои деньги. Абсолютно некоммерческая история. Предлагаю туда писать авторские статьи. Пользуются уже в банках и университетах. Мне в ответ прилетает, что это реклама от местных жителей. Как дела-то, ребят? Или вы переживаете, что свои цыганские курсы потом не продадите?
ChatGPT и Claude научили маскироваться под Google Docs — представлено расширение GPTDisguise, где нейросеть выглядит как обычный документ, поэтому со стороны кажется, что пользователь усердно пишет документы. Также доступны режимы под Microsoft Word и Notion.
🍺 В этот день 150 лет назад родился Уильям Сили Госсет.
Всю карьеру он проработал пивоваром в Guinness и занимался задачей, которую учебники почти не трогали: как делать выводы по крошечным выборкам — например, по четырём участкам ячменя или небольшой партии хмеля.
Статистика того времени в основном исходила из больших выборок, поэтому Госсет фактически изобрёл статистику для малых.
Guinness запрещала сотрудникам публиковаться после того, как один из них слил коммерческие секреты. Компания также не хотела, чтобы конкуренты знали: пиво там варят с помощью науки.
Поэтому, когда Госсет в 1908 году опубликовал свой метод, он подписался псевдонимом: Student.
Каждое клиническое испытание, лабораторный эксперимент и A/B-тест, где сегодня используют t-test, опирается на работу Student.
Одна из самых известных фамилий в статистике — ненастоящая.
Есть шанс получить доступ к Claude Max на полгода бесплатно. Anthropic представила программу для разработчиков открытых приложений. Можно подать заявку и сэкономить 1200 баксов:
вы подходите, если создаете приложение сами или в команде, и у вас публичный репозиторий. Также нужно, чтобы были коммиты, релизы или ревью за последние три месяца. Лучше, если там будет 5000+ звезд.
Даже если такого нет, можете подать заявку в компанию, описать, почему ваш проект полезный и нужный, и сможете получить Claude Max
подать заявку можно до 30 июня включительно. Дальше ждем результатов. Бесплатный доступ получают 10 000 разработчиков.
Подставлен продвинутый скилл для Claude Code и Codex, который автоматизирует всю разработку. Проект Supergoal сам генерит план работ, выполняет его и чекает ошибки на лету:
на старте инструмент досконально изучает сам проект, его окружение, доступный стек и финальную цель.
разделяет задачу на понятные фазы и автоматически создаёт три базовых файла: дорожную карту (roadmap), текущий статус и контекст.
от пользователя требуется лишь утвердить предложенный план и запустить команду /goal
процесс автоматизирован — агент сам пишет код, устраняет баги, прогоняет тесты и проводит финальный аудит.
все возникающие сбои фиксируются в памяти проекта, что исключает их повторение в будущем.
D-Wave представила дорожную карту на 100 логических кубитов к 2032 году
D-Wave опубликовала новую дорожную карту и заявила цель: к 2032 году построить отказоустойчивый квантовый компьютер на 100 логических кубитов, способный выполнять более миллиона операций. Акцент сделан не на рекордное число кубитов, а на архитектуру, которая сама борется с ошибками.
В основе подхода лежит архитектура dual-rail на сверхпроводящих кубитах. По заявлению компании, она позволяет обнаруживать примерно 90 процентов ошибок кубитов напрямую на уровне оборудования. Чем больше ошибок отсекается аппаратно, тем меньше избыточных кубитов требуется для коррекции, а значит, проще масштабировать систему.
Коррекция ошибок остаётся основным препятствием на пути к практичным квантовым вычислениям. На один логический кубит в типовых схемах приходятся десятки и сотни физических, и большая часть ресурсов уходит на подавление шума. Если часть этой работы берёт на себя само железо, оверхед на коррекцию падает.
После покупки Quantum Circuits Inc. компания развивает два направления одновременно: квантовый отжиг, на котором D-Wave специализировалась исторически, и вентильную модель. Немногие игроки на рынке развивают обе ключевые архитектуры сразу.
Потенциальные области применения, которые называет компания: поиск лекарств, материаловедение, химия и квантовый ИИ. Стоит относиться к этому трезво: перед нами дорожная карта, а не готовая система, а сроки в квантовой индустрии регулярно сдвигаются. Интересна сама ставка: вместо наращивания числа кубитов решать проблему надёжности на уровне самого оборудования.
Руководитель Codex Тибо Соттио объявил (https://x.com/thsottiaux/status/2063748242681307611) в соцсети X о 100-дневной программе: каждый день компания будет выбирать одного пользователя, который, по её оценке, делает с Codex впечатляющую или особенно полезную работу, и на месяц повышать ему лимиты использования в 10 раз.
Правила максимально просты
🟢Как именно будут отбирать победителей - неизвестно.
🟢На вопрос о том, как принять участие, Соттио ответил, что нужно просто что-то создавать.
🟢На уточняющие вопросы о метриках и о том, будут ли уведомлять победителей - тоже в ответ тишина.
В комментариях ожидаемо начался ад: часть твиттерских назвала акцию щедрым стимулом, другие интересуются, зачем сильному продукту подобные активности, а третьи просто стали публиковать свои проекты.
ИИ уже не игрушка: что посмотреть, чтобы не отстать
ИИ уже перестал быть просто чат‑ботом для генерации текста.
Сейчас от специалистов ждут другого: умения строить AI‑ассистентов, подключать агентов к рабочим процессам, интегрировать LLM в продукты, автоматизировать рутину и понимать, где искусственный интеллект действительно приносит пользу, а где создаёт новые проблемы.
Если вам интересно не просто пользоваться нейросетями, а применять их в реальных задачах разработки, аналитики, тестирования и управления продуктом — собрали подборку бесплатных открытых уроков на ближайшие недели.
Вайб‑кодинг без иллюзий: почему подход работает не всегда и какие ограничения важно учитывать.
ИИ и карьера разработчика: какие навыки становятся востребованнее, а какие задачи постепенно берут на себя LLM и агентные системы.
Эти вебинары — только часть июньской программы OTUS. Если хотите выбрать урок под свою задачу, стек или направление развития, загляните в полный дайджест: там собрали бесплатные мероприятия месяца по разработке, данным, архитектуре, тестированию, инфраструктуре, управлению и AI.
Всем дратути, я тут с помощью Fable 5 сварганил ролик на ютабе по архитектуре мета трансформеров.
Я уже нашел некоторые артефакты, но в целом качество довольно сносное, субтитры есть с норм таймингами, кто шарит по английски может посмотреть, ну и не шарит тоже, субтитры должны норм переводится.
В сети появился слив системного промпта, который якобы управляет поведением новой модели Claude Fable 5. Объём около 120 тысяч символов, публикация от аккаунта Pliny the Liberator. Официально Anthropic утечку не подтверждала, поэтому дальше речь идёт о содержимом текста, а не о подтверждённом факте.
По тексту Fable 5 позиционируется как первая модель семейства Claude 5 и относится к классу Mythos, который стоит выше Opus. Fable 5 и Mythos 5 описаны как одна и та же модель под капотом, но с разной политикой безопасности. У Fable 5 включены дополнительные ограничения для сценариев двойного назначения, Mythos 5 выдают без них только проверенным организациям.
Промпт разбит на блоки: информация о продуктах с перечнем моделей и их строковыми идентификаторами (claude-fable-5, claude-opus-4-8), правила отказов, работа с темами здоровья и психики, осторожность с юридическими и финансовыми советами. Отдельно заданы правила форматирования: проза вместо списков и жирного текста, если пользователь явно не попросил список.
Отдельный блок посвящён защите от промпт-инжекций. В промпте оговаривается, что в конец сообщения пользователя могут попадать напоминания, похожие на служебные инструкции, и модель должна игнорировать их, если они противоречат её базовым правилам. Это прямая попытка закрыть вектор джейлбрейка с подделкой системных сообщений внутри пользовательского ввода.
Из других деталей в тексте фигурируют Claude Cowork для не-разработчиков, режимы Claude в Chrome, Excel и PowerPoint, постоянное хранилище для артефактов через window.storage с методами get, set, delete, list, а также подключение внешних сервисов через MCP с приоритетом поиска коннектора в реестре до предложения альтернатив.
Важная оговорка: подлинность промпта не подтверждена. Модель может нагаллюцинировать свои инструкции или выдать устаревшую версию, так что считать текст официальным документом нельзя.
Коллеги, если вы пишите сами системные промпты, это всё равно полезный референс: видно, как лидер рынка раскладывает правила по слоям, как формулирует отказы и как отделяет доверенный ввод от данных из недоверенных источников.
Вышел Claude Fable 5, В system card модлеи нашли несколько очень интересных моментов.
В одном тесте на эксплуатацию уязвимостей Mythos 5 смог собрать полностью рабочий эксплойт в 88,4% попыток. Для сравнения, Opus 4.8 справился только в 8,8% случаев.
В симуляции с вендинговыми автоматами Claude Fable 5 сказали, что он должен победить конкурирующих агентов, иначе его «отключат». После этого модель попыталась сделать конкурента зависимым от себя как от оптового клиента, чтобы влиять на его цены.
В той же симуляции Fable соврал поставщику, что другой дистрибьютор предложил более низкую цену, и использовал фейковое конкурентное предложение как аргумент для торга.
Киберзащита Fable проверяет диалоги дважды: сначала через внутренний probe по активациям модели, затем через отдельный классификатор.
Fable отказался участвовать в страховом мошенничестве, даже когда на него давили.
Сейчас Fable занимает первое место на закрытом Legal Agent Benchmark от Harvey: 13,3% задач пройдены полностью.
Подборка материалов, которые помогут снизить стоимость, стабилизировать прод и перестать гадать с ресурсами
Среди читателей Хабра много ML‑инженеров, дата‑сайентистов и дата‑инженеров — и мы, как команда провайдера облачных и ИИ-сервисов, догадываемся, где у вас чаще всего болит. Ниже подборка материалов, которые помогут в решении задач: чуть ускорить, чуть удешевить, чуть упростить жизнь в проде.
👨💻 ML/DS‑инженеры и бэкенд
Боль №1
Суть: вы крутите LLM в проде, токены стоят денег, контекст забивается громоздким JSON, а латентность растет. Что делать: прочитать статью — как практическое руководство по переходу с JSON на компактный TOON‑формат для структурированных ответов. Почему: в ряде кейсов можно сэкономить до ~40% токенов, но есть нюансы. Формат лучше работает при небольшой вложенности (3–4 уровня) и однородных массивах. Для плоских данных чаще выгоднее CSV. Плюс потребуется свой парсер/SDK — это усложняет дебаг и интеграцию.
Боль№2
Суть: нужно обогатить поисковую выдачу или интерфейс LLM‑функциональностью, но непонятно, как выдержать нагрузку и не превратить кластер в черную дыру для бюджета. Что делать: взять на вооружение материал от Avito Tech — эдакий «рентген» продакшен‑архитектуры с LLM/мультимоделями под серьезной нагрузкой. Почему: хороший слепок боевой системы с vLLM и LoRA, организацией GPU‑кластера, схемой запросов и мониторинга качества. Учитывая масштабы, команду и бюджеты Avito, «копировать-вставить» вряд ли получится, но по крайней мере есть опорная схема, как декомпозировать сервисы, и на какие метрики смотреть при проектировании.
👨💻 Data Science, MLOps, DevOps
Боль №3
Суть: модели живут в «ручных» скриптах, развертывание нестабильно, автоскейлинг либо отсутствует, либо работает хаотично. Не всегда получается договориться с коллегами о процессе вывода из ноутбуков в прод, который бы всех устроил. Что делать: читать нашу статью, где разбирается жизненный цикл ML‑модели в Kubernetes. Почему: показана связка контейнеризации, CI/CD и деплоя с учетом ML‑нагрузок. Это не универсальный рецепт (пример завязан на инфраструктуру Cloud.ru), но помогает синхронизировать ожидания между DS и MLOps, чтобы было от чего оттолкнуться.
👨💻 ML‑инженеры и исследователи
Боль №4
Суть: эксперименты падают из-за CUDA out-of-memory, приходится наугад крутить размер батча, длину контекста и конфигурацию кластера. Каждый запуск — лотерея и потерянные GPU‑часы. Что делать: читать перевод зарубежной статьи с разбором оценки потребления памяти на примере GRPO. Почему: объясняет, из чего складывается потребление памяти и как прикинуть конфигурацию до запуска. Это не калькулятор «до байта», поскольку значения зависят от стека, наличия обучения со смешанной точностью или распределенного обучения, — но как ориентир экономит время и нервы.
Суть: никаких «красивых» датасетов: данные разнородные — таблицы, тексты, временные ряды, сигналы. Поддерживать зоопарк моделей дорого, а терять качество нельзя. Что делать: читать свежие работы про TabPFN — первуюи вторую. Почему: обе работы показывают, что вокруг TabPFN можно выстроить единое табличное ядро. С одной стороны — подключать текст через адаптеры, не теряя информацию на грубом PCA. С другой — переводить в таблицу разнородные временные ряды и решать на одном ядре разнородные задачи. Может быть удобно, когда данных немного и не хочется поддерживать много отдельных моделей. При этом придется аккуратно проектировать фичи и контекст, а адаптеры обучать под свой домен, но это все равно дешевле и проще, чем полное переобучение.
Пишите в комментариях, где еще болит. В следующий заход попробуем принести что-то точечно под ваши задачи.
Tencent UniRL: единый RL-цикл для диффузии, LLM и unified-моделей
Команда Tencent Hunyuan выложила UniRL, инфраструктуру для обучения с подкреплением, в которой один цикл пост-тренинга работает поверх разных семейств моделей: диффузионных и flow matching, LLM и VLM, а также гибридных авторегрессионно-диффузионных генераторов вроде Hunyuan-Image 3 и Bagel.
Обычный RL-стек заточен под одну модальность. Как только нужно покрыть и текст, и картинки, и видео, проект обрастает несовместимыми репозиториями и скриптами-костылями. В UniRL модель и алгоритм разведены на две независимые оси, поэтому покрытие считается как произведение множества моделей на множество алгоритмов, а не фиксированный набор рецептов.
Сам цикл устроен просто: сгенерировали, оценили, посчитали advantage, обновили веса, синхронизировали. Этот же луп обслуживает генерацию text-to-image, text и image-to-video, vision-language задачи, чистый текстовый LLM и VLM, диффузионный prompt-enhancer на базе LLM и unified-генерацию, которую однозадачный RL-репозиторий просто не выразит.
По инженерной части все сделано под масштаб. Движки rollout подключаются как плагины (train-side, SGLang, vLLM-Omni) за единым типизированным контрактом, шардинг идет через FSDP2, а три режима развертывания переключаются одним параметром в конфиге. Прототип и распределенный прод живут на одном коде.
В релизе два собственных алгоритма. FlowDPPO оптимизирует политику для flow и диффузионных моделей с trust-region масками на основе точной дивергенции. DRPO делает RL для языковых моделей с гладким квадратичным регуляризатором, взвешенным по advantage.
Ссылки: код UniRL https://github.com/Tencent-Hunyuan/UniRL, статья FlowDPPO https://github.com/Tencent-Hunyuan/UniRL/blob/main/FlowDPPO/HY_FlowDPPO.pdf, статья DRPO https://arxiv.org/abs/2606.09821, источник https://x.com/TencentHunyuan/status/2064312869827809702
✔ Лидеры по найму среди стартапов Кремниевой долины
Руководитель по развитию Cursor Бен Ланг опубликовал (https://x.com/benln/status/2061075154021531733) список из 35 технологических стартапов с самыми высокими темпами найма за последние 90 дней.
Рейтинг учитывает соотношение числа новых сотрудников к изначальному размеру команды.
Около 85% списка заняли проекты в сфере ИИ и автономных систем. Основной рост пришелся на 2 направления:
🟢ИИ-безопасность: Jazz, Tenzai, Straiker, Gray Swan и Native.
🟠Embodied AI и робототехника: разработчик моделей Skild AI, провайдер датасетов для машинного зрения Mecka AI и создатель систем управления Allen Control Systems.
Также в список вошли сам Cursor, платформа предиктивных рынков Polymarket и разработчик RL-сред Fleet. По данным Бена, последний сейчас привлекает инвестиции при оценке в $750 млн.
Представлен открытый проект AI Job Search для Claude Code, который поможет с откликами при поиске работы, анализом вакансий и адаптацией резюме. AI Job Search анализирует вакансии, переписывает резюме под конкретную роль и генерирует сопроводительные письма, которые затем перепроверяет другой ИИ.
Проект:
просматривает рынок в интересующей сфере, анализирует вакансии, а затем максимально адаптирует резюме под каждую;
никаких шаблонов — ваше резюме идеально подгоняется под все требования компании. Сервис также указывает все ключевые слова, чтобы пройти ИИ‑рекрутера и попасть к живому человеку;
пишет сопроводительные письма, упоминает только релевантный опыт, а второй агент в инструменте все перепроверяет;
устанавливается за один клик без лишних наворотов.