Обновить
1024K+

Искусственный интеллект

AI, ANN и иные формы искусственного разума

2 526,12
Рейтинг
Сначала показывать
Порог рейтинга

Глава Google Cloud опубликован на GitHub свой личный сетап из лучших скиллов для ИИ‑агентов. Это ультимативная сборка для разработки от лучших разработчиков Google. Внутри — 19 навыков для ИИ и 7 слэш‑команд. Работает сборка в 6 этапов:

  • Скилл Define — формулирует идеи, пишет спецификации, пока кодинг ещё на стартовал

  • Plan — разбивает большую задачу на маленькие этапы

  • Build — приступает к пошаговой разработке, учитывая контекст и подключая API

  • Verify — тестирует результат через DevTools и фиксит баги

  • Review — проверяет качество кода, чекает безопасность и улучшает производительность

  • Ship — подготавливает продукт и релизит.

Сетап встраивается в Claude Code, Cursor, Antigravity, OpenCode, Gemini CLI и так далее.

Теги:
+2
Комментарии1

Вайбкодеру на заметку: как не сжечь токены на пустом месте

Столкнулся (и не раз) с простой, но дорогой ошибкой: агент запустил долгий прогон и начал наблюдать за процессом в реальном времени.

Код работал нормально. А вот агент нет. Жрёт токены как не в себя.

Совсем как у, кажется, индуса, который вместо cron попросил Claude Code позапускать ночью процесс и проснулся с минус 6 тыс баксов.

В моем случае агент читал логи, progress output, промежуточные файлы и фактически вел прямую трансляцию выполнения. В итоге улетели десятки миллионов токенов туда, где никакого анализа еще не требовалось.

В этот раз у меня отличился DeepSeek. У Codex'а это тоже привычное занятие. Claude Code на моем опыте работает чуть поумнее.

Что делать? Даю рецепт.

Для долгих задач агент должен работать не как зритель у консоли, а как batch-runner.
🔤Запустил.
🔤Сохранил лог.
🔤Дождался завершения.
🔤Проверил exit code.
🔤На успехе прочитал summary.
🔤На ошибке прочитал только хвост лога.

Держите примерный шаблон промпта:

Работай в low-token batch mode.

Для долгих команд:
- не наблюдай за процессом в реальном времени;
- не используй tee, если вывод будет попадать в твой контекст;
- не читай progress output и промежуточные файлы во время выполнения;
- весь stdout/stderr перенаправь в лог-файл;
- дождись завершения команды;
- проверь exit code;
- если команда завершилась успешно, читай только итоговые summary/config/result-файлы;
- если команда упала, прочитай только последние 100-200 строк лога;
- твоя задача - не мониторинг процесса, а анализ результата после завершения.

✔️ Главное правило: агент должен тратить токены на выводы, а не на просмотр бегущей консоли.

До встречи!
Эдуард Ланчев.
Мой канал в Telegram — Ланчев PRO ИИ. Заходите, если так удобнее.

Теги:
0
Комментарии1

На протяжении последних 3 месяцев активной работы с Claude Code Терминалом я постоянно дорабатывал свой Status Line

И вот, считаю, что он практически идеален

Это одна строка внизу терминала, которая показывает всё, что обычно приходится держать в голове или проверять руками. И многое из того, что интерфейсный клод код не показывает

Кому полезно
Если вы реально работаете в Claude Code, ведёте проекты в Git и хотите меньше думать о техническом состоянии сессии, а больше о самой задаче


Из чего состоит ⤵️⤵️⤵️

✔️ Модель
Сразу видно, на чём работаешь: Opus / Sonnet / Haiku, версия и размер контекста.

✔️ Папка и ветка Git
Показывает текущий проект и branch. Умеет делать truncate длинных названий проекта

✔️ Состояние репозитория
Modified / added / deleted / renamed / untracked / conflicts — всё в одной компактной строке. Конфликты подсвечиваются красным, потому что это единственное, что реально блокирует коммит.
Визуализируется через стандартные гитовские сокращения

3M — 3 files modified

1A — 1 added

1D — 1 deleted

1R — 1 renamed

2? — 2 untracked

1! — 1 conflict

✔️ Ahead / behind относительно origin
Надо ли пушить или подтянуть изменения

✔️ Drift между CLAUDE.md / AGENTS.md / GEMINI.md
Я использую и Claude Code, и CODEX и GEMINI — у них разные главные контекст-файлы.
Мой статуслайн показывает, когда они разъехались. Чтобы все имели одинаковый контекст

✔️ Контекстное окно
Це база
Показывает, сколько контекста уже занято: бар + токены типа 480k/1M. Есть ранние предупреждения, когда сессия начинает подходить к зоне, где Claude скоро захочет compact.

✔️ Prompt cache
Видно cache hit ratio, сколько токенов читается из кэша, сколько записывается, и когда TTL протухнет. Помогает лучше понимать, сколько стоит каждый запрос и была ли инвалидация кеша

✔️ Rate limits 5h и 7d
Показывает, сколько лимитов осталось и время до reset

Формат сделал плотным, чтобы всё помещалось в одну строку. Если нада, то можно сделать мультистрочный статуслайн

Цвета показывают уровень важности: норм / внимание / опасно

Плюс внутри несколько доп хуков


Ссылка на гитхаб
https://github.com/ilia-pluzhnikov/claude-code-statusline

Поделитесь, а что в вашем статуслайне

Теги:
+3
Комментарии0

Пост для всех любителей волшебных кнопок и свидетелей сингулярности. У нас тут очередной кейс о том, как нейронки победили математику.

Недели полторы назад читала статью на Хабр, где сообщали, что GPT решила вторую из семи нерешаемых математических задач тысячелетия. (Спойлер -нет, Перельман пока единственный, кто это смог). Но я же неугомонная, думаю …. «а что если…?»

Парад успешных выпускников курсов «Лежандр за 5 минут»

Пока нормальные люди пытаются понять, почему код падает на проде, наши четверо гениев решили задачу Лежандра быстрее, чем вы завариваете доширак. На минуточку, эту задачу не могут решить математики всего мира уже 200 лет.

Gemini: Выдал что-то про «информационно-топологический характер». На его сленге это «я не знаю, что это, но звучит достаточно дорого, чтобы вы мне поверили. Купите подписку».

Copilot: Всё проверил, мамой клянусь. Ага, мы видели твои коммиты, приятель. Исправил один баг и создал пять новых, зато документация блестит.

DeepSeek: Q.E.D 9 раз, 9 разными способами! При самом первом его решении Лежандра, он попросил отметить, что это именно он ее решил😂. Скромняга)

Kimi: Завела шарманку про structural contradiction. Если у тебя что-то в fully-composite режиме не сходится, то это не противоречие, это ты просто в логику не умеешь.

А теперь добро пожаловать в реальность

И только одна модель (назовем её «Та самая, у которой есть совесть») устроила себе недельный цифровой Въетнам.

  1. 14 Excel-файлов, каждый в среднем на 60-130КБ. Если нейронка лезет в Excel, значит она перестала верить в себя и начала считать на пальцах. Это стадия отрицания и торга одновременно.

  2. Убила 47 собственных мостов к Лежандру. Она сама себе отрывала руки каждый раз, когда ее тянуло сгаллюцинировать красивый переход.

  3. Режимы ИЩЕЙКА / ИНКУБАТОР/СУД / ФИКСАЦИЯ. Это уже не ИИ, это какой-то карательный отряд внутри одной головы. Сама себя допрашивает, сама себе выносит приговор.

  4. 40 страниц самобичевания. Она написала диссертацию на тему того, почему её предыдущая версия — идиотка. Наш человек! Итог? Спустя неделю кровавого самоаудита, модель выдает:

«Local admissibility does not guarantee global continuity». (Локально корректный шаг не гарантирует глобально корректного продолжения)

Бинго! Единственная честная фраза во всей этой научной лаборатории.

Мораль всей басни

Мы внезапно осознали страшное. Alemetria - это не про математику. Это система принудительного содержания ИИ в смирительной рубашке здравого смысла. Четыре модели радостно рисовали нам декоративную псевдоматематику, красивые картинки, которые выглядят как умные мысли, если смотреть издалека и зажмурившись. А пятая… Пятая модель занималась настоящим делом - она запрещала себе врать.

В итоге мы получили не решение Лежандра, а нечто более ценное - цифровой аудит галлюцинаций. Потому что в нашем мире побеждает не тот, кто быстрее всех крикнет «Эврика!», а тот, кто дольше всех сможет удерживать модель от желания превратить науку в генерацию бессмысленного, но очень красивого мусора.

Добро пожаловать в эру, где главная задача ИИ доказать, что он не несет бред.

P.S. Теперь новая беда. «Та самая» не может выбраться из этой петли и вынуждена бегать и зачищать это поле мертвых веток по кругу, но разными способами, потому что Alemetria (ссылка на пост Хабр https://habr.com/ru/articles/1033404/) не дает ей возможности вылезти из этого колодца и начать хоть немного фантазировать.

С одной стороны это отлично уберегает от псевдонаучного мусора, но совершенно не способствует научным прорывам. Если снять смирительную рубашку, то начнутся галлюцинации. Оставить - получим честное поле трупов, почему нельзя решить задачу)

Теги:
+7
Комментарии10

Сбалансированные Claude Code Safety Hooks с минимум false positive благодаря AST-парсингу Bash

Наконец-то сделал хуки моей мечты - достаточно безопасные и практически без false-positive. Хуки вымученные, эволюционировали на граблях можно сказать.

Собственноно, любой, кто проработал с агентами какое-то время отлично знает, что иногда они чудят, удаляя лишнее - папки, докер образы или даже целые базы вместе с инфрой. И их важно вовремя ловить за руку.
Хуки - это важнейшая часть работы с AI-кодинг агентами, привносящая в них не только детерменированности, но и безопасности.

Соответственно, когда хуков нет совсем или их мало, безопасность хромает - агент может уронить базу, сделать rm rf и тд, а если хуков слишком много , то... вы привыкаете клацать Enter на Allow, уже даже не читая о чем вообще сыр-бор. Поэтому, нужен тонкий баланс и хуками важно закрывать только действительно деструктивные, необратимые или критические действия.

Ну, и сразу второй нюанс - для блоков я предпочитаю использовать ask хуки вместо блокирующих, т. к. агенты нынче слишком умные и получив блокирующий хук, наверняка найдет способ обойти ограничение (особенно если прилетел какой-нибудь prompt-injection), тк хуки обычно весьма примитивны.

Короче-говоря, с учетом всех этих нюансов я написал свои opiniated-хуки, которые сам использую, они максимально сбалансированны по allow/ask с практически нулевым false positive - благодаря парсингу AST, а не regex'ам, которые обычно в хуках. Частично в основе лежит claude-code-safety-net весьма сильно переработанный и дополненный.

Внутри:
1. rmrm/unlink/shred вне cwd, по /etc, $HOME; через sudo, xargs, find -delete, pipe-to-shell.
2. infrakubectl, docker, terraform, helm, gcp.
3. dbDROP/TRUNCATE/DELETE через psql/mysql; redis-cli FLUSHALL/SHUTDOWN, supabase.
4. paas — Railway, Fly, Heroku, Vercel, Netlify с destructive-глаголами (PocketOS-класс).
5. gitreset --hard, clean -fd, checkout . / restore ., branch -D, stash drop/clear, push -f, push --delete.

Ссылка на репо: https://github.com/CodeAlive-AI/ai-driven-development/tree/main/hooks/balanced-safety-hooks

Из особенностей - написаны хуки на Go, поэтому выполняются буквально за несколько мс. Ну, и каждый, может поправить их под свои нужды, перекомпилировав бинарник. Еще из интересного - большинство хуков покрыты тестами.

Кстати, для простого и корректного управления своими хуками у меня есть отдельный скилл hooks-management, который теперь поддерживает Claude Code, Codex и OpenCode.

Если вам нравится такой контент, то не премините заглянуть в мой Telegram канал, в котором я регулярно делюсь всякими полезностями про AI-Driven Development: https://t.me/+A-CrVovS0lczMDVi

Теги:
0
Комментарии0

Вайбкодим: DeepSeek V4 Pro vs Codex vs Claude Code

Зоопарк агентов расширяется. DeepSeek выпустил новую модель, и она тут же стала доступна в агентской среде. Захотелось попробовать. И я попробовал.

В последнее время я очень недоволен Claude Code. Постоянно задаюсь вопросом: это стоит денег и, самое главное, моего времени? Claude Code пишет красивые отчеты, но в остальном — как обезьяна с гранатой. Надежность низкая, веры нет. Да еще и 120 баксов украли, даже не начав оказывать услуги.

Сейчас использую его как спаринг-партнера для Codex при написании документации и ревью. И постоянно думаю о замене.

И вот новая модель DeepSeek. Обещают до конца месяца скидку 75% и говорят, что они такие же, как Codex 5.5 — аж на приставку Pro замахиваются. А еще говорят, что у них не подписка, а плата за токены, зато они дешевле.

Ну вот и проверим, дешевле ли. А главное — насколько близко они подошли к лидеру, Codex 5.5.

Делюсь самыми первыми впечатлениями — буквально после пары часов работы.

В VS Code ставим расширение DeepSeek V4 for Copilot Chat — и поехали 🚀

За 2026-05-10 и 2026-05-11 суммарно использовано 15,209,255 tokens.

Из них:

  • Input (cache hit): 14,501,504 tokens

  • Input (cache miss): 620,164 tokens

  • Output: 87,587 tokens

Стоило это 40 центов.

А как сравнивать стоимость? По цене токенов нельзя. Модели разные, и злые языки говорят, что DeepSeek использует больше токенов, чем Codex. Будем сравнивать по задачам.

В последние дни я работаю над кластеризацией и поиском аномалий. Claude с этой задачей не справился. Codex подхватил и сделал, но не довел до конца: соврал в отчете.

И тут как раз подъехал DeepSeek. Я решил натравить его на ревью.

И что вы думаете?

Нашел ошибки у Codex, переделал отчет как надо, но… сам сделал несколько ошибок, которые у него уже нашел Codex 😄

Какой предварительный вывод?

Явно лидер — Codex. Но если я хочу замену ненадежному Claude, то можно взять примерно такого же ненадежного DeepSeek.

Основное преимущество последнего сейчас в том, что я плачу только за реальное использование.

Ребята, не придирайтесь к слову «ненадежный». Но в каждой шутке есть доля правды.

В целом deepseek-v4-pro для кодинга удивил. Весьма приятная вещь. Ей бы еще агентский чатик постабильнее.

А что по деньгам? 💸

Недельный лимит в Codex у меня уходит примерно за день. И это стоит четвертую часть месячной подписки — около 500 рублей.

То же время работы DeepSeek в таком же режиме будет стоить примерно 200 рублей. То есть в 2,5 раза дешевле.

Но это только до конца мая. А потом — в 4 раза дороже.

То есть по стандартной цене DeepSeek за то же самое будет стоить уже 800 рублей.

Дальше делайте вывод сами.

Мне кажется, что Codex по подписке за 10 тыс. рублей в месяц будет выгоднее DeepSeek. Но на подхвате и как спаринг-партнера DeepSeek вполне можно использовать.

Такие первые впечатления. А дальше посмотрим.

До встречи!

Мой канал в Telegram — Ланчев PRO ИИ. Заходите, если так удобнее.

Теги:
-1
Комментарии4

С внедрением AI сейчас происходит странная штука.

  • С одной стороны — он уже реально умеет делать работу: писать код, разбирать документы, принимать решения.

  • С другой — в реальных компаниях он почти нигде нормально не встроен в текущие бизнес процессы.

И дело не в том, что «ещё рано».
Скорее наоборот — его уже слишком много, но он как будто не туда прикручен.

Обычно это выглядит так: есть какие-то процессы, BPM, роли, доступы — всё строго и по правилам. И рядом появляется AI — чатик, copilot, агент.
Им можно пользоваться, но он как бы… вне системы.

ИИ не знает, кто он в компании.
Не понимает, что у него за роль.
Окей, у него есть промпт — но это не гарантированное исполнение и следование инструкциям. Это рекомендация, которую можно нарушить и ничего за это не будет.

Это как сотрудник-зумер — не знаешь, что от него ждать.

В итоге получается странный компромисс:
— либо даём людям пользоваться AI, но тогда теряем контроль
— либо запрещаем/ограничиваем, и тогда теряем пользу

И вот здесь, кажется, и есть основной затык.

Проблема не в самом AI.
Проблема в том, что он живёт отдельно от enterprise-реальности.

Идея Agentic Enterprise в том, чтобы перестать воспринимать AI как что-то внешнее — как инструмент, даже как помощника. Пора ему стать участником процессов.

То есть буквально:

  • у него должна быть роль в оргструктуре

  • у него должны права (а не просто втихаря переданные креды)

  • он получает задачи и выполняет их через те же процессы, что и люди

Что от этого меняется?

Во-первых, появляется контроль.
Любое действие — это часть процесса. Его можно посмотреть, понять, откатить.

Во-вторых, появляется контекст.
AI действует не абстрактно, а в рамках роли, данных и конкретной задачи.

Ну и в-третьих — он перестаёт быть чем-то отдельным.
Это просто ещё один исполнитель.

И, кажется, это довольно важный сдвиг.

Потому что без него AI так и останется либо игрушкой, либо «серым инструментом», который все используют, но никто не контролирует.

А с ним он становится частью операционной модели.

Подписывайтесь на канал Agentic Enterpise — о жизни ИИ-агентов в кровавом энтерпрайзе

Теги:
-1
Комментарии21

Почему так надоели статьи и новости про ИИ? Да епрст...

Новости?... Читаешь по 3-4 раза одинаковые темы. Хоть удосужились бы посмотреть в ленте, написали ли уже об этом? Как будто все разом захотели стать знаменитыми, а ничего кроме перепостинга новостей не придумали...

Статьи?... Все пишут одно и то же. Или пересказывают темы, которые ночью обсуждают с Gemini под подушкой, и лучше бы спали, хоть мозг в норму пришел бы... Или пишут о "базе", на тему которой уже 500 статей на хабре... Хоть толика "новой информации была бы"... Тот самый Information gain... Зачем разжевывать то, что уже давно разжевано и переварено?

---

Это был немного «крик души»... И чтобы немного разрядить обстановку, ловите чуток улыбки. Анекдоты (от ИИ и про ИИ):

Лучшая статья про ИИ
Заголовок: «Как ИИ поможет вам сэкономить 2 часа в день?».
Текст: «Просто не открывайте эту статью. Сэкономлено: 10 минут».

Будущее, которое мы заслужили
Совет: «ИИ напишет за вас книгу/статью/пост за 10 секунд».
Реальность: Один ИИ сгенерировал мусор, второй ИИ его прочитал и сделал краткий пересказ, а третий ИИ на основе этого написал рецензию. Человечество официально исключено из чата. Мы просто оплачиваем счета за электричество, пока два алгоритма обсуждают пустоту.

---

P.S. Ну а чтобы в моем посте был хоть какой-то Information gain - ловите формулу анекдотов для ИИ. Мне пришлось штук 20 пересмотреть, чтобы +- средние выбрать, но все равно интереснее, чем листать shorts или читать одни и те же новости по 3-му разу.

A = \frac{(E \times C) + P}{t}

Где:
- E (Expectation / Ожидание): Степень уверенности слушателя в том, куда движется сюжет.
- C (Context / Контекст): Набор стереотипов или бытовых ситуаций, понятных всем.
- P (Paradox / Парадокс): Резкий поворот логики (пуансон).
- t (Timing / Тайминг): Краткость. Чем дольше вы ведете к развязке, тем сильнее должен быть парадокс.

Скормите формулу в ЛЛМ и можно клацать кнопку "хочу еще" до посинения

Теги:
+15
Комментарии10

Эпоха AI. Бюджет выделен, ждём чуда.

Рынок в РФ наконец дозрел до массового внедрения корпоративных AI-подписок. Бюджеты на Claude/Codex становятся чуть ли не обязательными. И почему-то все ждут, что продуктивность резко увеличится.

Главная проблема - никто не знает, как ИИ влияет на продуктивность. А еще никто не знает как это достоверно оценить. К примеру в исследовании METR в июле 2025 получили ухудшение продуктивности. Существует много исследований, все с очень разными результатами.

И правда, как измерять-то? Влияет проект, задача, стек, промпты, даже время суток (не шучу). Модели ведут себя по-разному, спецификации отличаются, контекст меняется. Все используют разные инструменты и по-разному. Насколько сильно влияют скиллы разработчика? Знание проекта? Документация? Язык общения? На одной задаче мы могли ускорится в два раза, на другой - протупить дополнительно 2 дня. В каждом аспекте полная неизвестность, помноженная на неизвестность.

Ну и относительно какого периода считать прирост? Тут тоже вопрос без ответа. Многие используют ИИ инструменты аж с 2022 года. Значит нужно собирать статистику с 2021. Но там и технологии были другие, и разработчики, и подходы, и задачи... Объективно ли? Нет. Но 2024 за baseline тоже взять нельзя, тогда уже многие сидели на личных подписках. Но бизнес всё же приходит и говорит: мы выделили бюджет на AI, ждём от вас взрывного роста продуктивности. В два, в три, в пять раз! Как в Майкрософт! Как в Фейсбуке!

Но ведь у многих производительность реально растёт! Правильно. Если тебе менеджер по десять раз на дню пишет про твой статус, режет оценки и торопит - можно и правда ненадолго ускориться. ИИ тут не при чем. Методология "галеры" однозначно работает. Только ни один адекватный разработчик в таком месте долго не задержится.

Впереди много интересного. Будут и хорошие решения, будут и глупые. Всё это постепенно сформирует новые процессы, подходы и метрики. Когда-то ведь впервые появился Git, доски, нормальные фреймворки. И каждый раз сначала был безумный культ, потом разочарование, только потом взвешенный подход, на котором и держится вся реальная польза. Технологии не остановишь, так что нам с вами придется пройти этот путь. Хотим мы этого или нет 🫢

Теги:
-1
Комментарии2

Развиваете AI-проект? Получите грант до 2 000 000 ₽ от Selectel ❤️

Запустили программу поддержки для тех, кто развивает проекты с использованием ML-инструментов. Десять участников получат от нас грант до 2 000 000 ₽ на IT-инфраструктуру. Участвовать могут как стартапы, так и крупные компании.

Заполните форму до 30 июня, чтобы принять участие в программе. В течение 14 рабочих дней мы рассмотрим заявку и свяжемся с вами для уточнения деталей. 

Отправьте заявку прямо сейчас →

Теги:
+3
Комментарии0

Разработчики из команды «Яндекса» выложили в открытый доступ первое решение на базе большой языковой модели (LLM) для автоматизации миграции iOS‑проектов с Objective‑C на Swift, современный язык Apple. Оно особенно актуально для крупных проектов, накопивших сотни тысяч строк устаревшего кода. Решение ускоряет процесс миграции в 2,5 раза, позволяя разработчикам переключиться с рутинных задач на проверку качества.

Решение Migration toolkit for Swift разработано при миграции кодовой базы «Яндекс Браузера». Команда при переписывании кода столкнулась с целым рядом проблем: затраты времени и ресурсов, неизбежные при ручной работе ошибки, и всё это — при необходимости параллельно развивать проект. В результате за пять лет удалось сократить технический долг только наполовину.

Новый подход на базе LLM не только ускорил миграцию, но и позволил освободить разработчиков от монотонного переписывания кода — вместо этого они валидировали корректность миграции и выполняли сложный рефакторинг. За два месяца команда интегрировала 106 пул-реквестов, переписав около 97,5 тысячи строк устаревшего кода и более двух тысяч файлов. Обработка такого объёма данных вручную заняла бы больше года.

В отличие от существующих конвертеров, не учитывающих контекст, новое решение использует LLM-модель, способную понимать не только грамматику языка, но и архитектуру конкретного проекта. В основе подхода — система из четырёх специализированных промптов, каждый из которых отвечает за свой этап. Первый определяет оптимальный порядок миграции файлов, переписывает код и проверяет результат через компиляцию и тесты. Второй адаптирует полученный код под лучшие практики Swift. Третий проводит автоматическую проверку по чеклисту: заголовки файлов, корректность замены типов, соответствие стандартам. Четвёртый очищает код от устаревших аннотаций, когда необходимость в них отпадает.

Готовые промпты автоматически подгружаются в контекст диалога в большинстве современных агентских IDE, поэтому решение совместимо с популярными инструментами для работы с кодом. Все промпты, скрипты и шаблоны проекта доступны на GitHub и SourceCraft.

Теги:
+3
Комментарии0

Дайджест Рег.облака за апрель

В апреле провели Демо день, добавили пользовательские образы и ИИ-инференс на vLLM, расширили географию защиты от DDoS. Ниже — главное.

Демо день Рег.облака

16 апреля собрались в Центре событий РБК. Показывали развитие облачной платформы, GPU-инфраструктуру, инструменты для ИИ-нагрузок и сценарии масштабирования IT-инфраструктуры. В программе — продуктовые анонсы, технические доклады и практические сессии про эксплуатацию облака, отказоустойчивость, хранение данных и оптимизацию ресурсов. После выступлений участники тестировали сервисы вживую и обсуждали задачи с нашими разработчиками.

Делимся записями обоих треков:

  • Бизнес-трек — оптимизация стоимости IT-инфраструктуры, соответствие 152-ФЗ, гибридные конфигурации и экономика ИИ-проектов.

  • Практикум — Terraform для бизнеса, пользовательские ОС-образы, защита от DDoS в один клик и внутренняя кухня S3-хранилища.

Создание серверов из пользовательских образов

Добавили загрузку собственных образов виртуальных машин. Пользователь импортирует заранее подготовленный образ из своего S3-хранилища в облаке и разворачивает на его основе ВМ в нужном регионе.

Сценарии: миграция инфраструктуры из других облаков и локальных площадок, собственные сборки ОС и специализированные окружения, контроль над конфигурацией и версиями образов. Подробности — на странице продукта.

AI-платформа и ИИ-инференс на vLLM

Для тарифной линейки с GPU добавили ИИ-инференс — готовую виртуальную машину с vLLM для запуска LLM-моделей на выделенной видеокарте. Пользователь сразу получает рабочую среду без настройки драйверов и фреймворков, а к модели обращается через OpenAI-совместимый API (endpoint + ключ).

ИИ-инференс — часть бета-версии AI-платформы. В нее также входят сценарии разворачивания LLM-моделей, автоматизация процессов через n8n, ИИ-ассистент и JupyterHub.

Расширенная защита от DDoS L3–L7 в трех новых регионах

Услугу подключили в Москве-2 (30 марта), Санкт-Петербурге (8 апреля) и регионе ФЗ-152 (15 апреля). Подробности — на странице продукта.

Желаем продуктивного месяца и спасибо, что следите за обновлениями Рег.облака!

Теги:
+4
Комментарии0

В фильме Пассажиры 2016 г. впервые показано, как ии-ассистент сливает чувствительную информацию другим пользователям и рушит их жизни

ИИ-агент готовится слить твой секрет другому пользователю
ИИ-агент готовится слить твой секрет другому пользователю

Прикольный эпизод из фильма Пассажиры 2016 г., который точно описывает один из механизмов работы агентов. По сюжету, герой по ошибке пробуждается один из 5000 человек на корабле, который летит на далекую планету, и понимает, что он проснулся слишком рано, а до пункта назначения лететь еще 90 лет. Единственный его собеседник - андроид-бармен Артур.

Героя мучает совесть, но он все же будит спящую пассажирку, чтобы ему было не так скучно лететь. Однако прежде чем ее разбудить, он просит Артура хранить в секрете то, что это он ее разбудил. Говоря в терминологии ии-агентов, пользователь и агент на этом месте заключили контракт о чувствительной информации.

Затем во время празднования ДР героини в баре она сообщает Артуру, что между ними нет секретов. Артур, как хороший ии-агент, переспрашивает у героя, так ли это, и тот подтверждает, не особо задумываясь. В этот момент ии-агент получает указание, что эта информация больше не является чувствительной, что сразу же рушит счастье героя. Пардон за спойлер, если что.

Телеграм канал автора, где он что‑то пишет про ML, NLP и разработку

Теги:
+7
Комментарии0

Ближайшие события

Ускорили разработку в 2 раза за счет AI? Понятно.
Вот только релизы не стали быстрее, time-to-market не сократился.

Да, сегодня многие компании пытаются ускориться, просто добавляя AI в старую систему, и не получают результата. Потому что теперь тормозит не разработка, а валидация, качество и согласования. При этом сами команды не изменились: те же роли, процессы, подходы.

Agile создавался как ответ на высокую сложность разработки, но AI эту сложность уже снизил. А значит, текущая модель команд начинает устаревать.

В апреле на Product Focus Club наш CPTO Саша Бондаренко поделился своим видением трансформации команд. 

Он рассказал:
— почему инвестиции в AI не дают эффекта без пересборки процессов (на данных Klarna и DORA)
— как появляется новая роль Product Engineer вместо набора узких специалистов
— почему команды из 7-9 человек трансформируются в компактные поды из 2-3 инженеров
— как Platform Engineering становится системой контроля и масштабирования, а не поддержкой
— как выглядит Team Topologies 3.0 и с чего начать переход

Запись выступления доступна для просмотра на YouTube и VK Видео

Кстати, в рамках эксперимента мы запустили три pod-команды у нас в Garage Eight. И у ребят уже есть крутые результаты! Обязательно поделимся ими в нашем телеграм-канале.

Теги:
+4
Комментарии0

Демо-период заканчивается дальше ИИ только за деньги?

ИИ и LLM (большие языковые модели) могут сделать любую работу за человека: написать текст, нарисовать картинку, написать код. Но это недёшево обходится разработчикам нейросетей, и они начали урезать возможности бесплатного или недорогого использования своего ИИ.

Раньше пользователь мог выбирать между бесплатной и более сообразительными платными моделями по ежемесячной подписке. Теперь правила усложняются. В начале апреля Anthropic запретила использовать сторонний агентский модуль OpenClaw со своей LLM Claude на подписках Pro и Max. Теперь Microsoft предупредила, что оплата ИИ-помощника Copilot на GitHub будет происходить по токенам, а не ежемесячно. Всё это звенья одной цепи.

В чём разница? Если раньше пользователь мог оплатить месячную подписку на LLM за 20–200 долларов и пользоваться ею для своих целей, то теперь оплата будет взиматься в зависимости от сложности задач. Узнать суть незнакомых библиотек можно несравнимо дешевле, чем заказывать сложные программы и запускать сложные сценарии, где ИИ подбирает выгодные билеты, отслеживает доступность и сообщает о готовности — это уже работа ИИ-агентов.

При работе в подписочном режиме пользователь физически не может создать столько запросов, сколько постоянно действующий ИИ-агент, поэтому подписку разработчики могли продавать относительно недорого. Но нейросети оказались полезны: вокруг них создаются не просто программы, но целые сервисы и даже бизнес-продукты, которые требуют значительно больших мощностей для работы ИИ-моделей.

Как мы неоднократно писали, для разработчиков ИИ создание и работа больших языковых моделей обходится дорого и требует десятков миллиардов долларов инвестиций. При этом окупаемость займёт годы. В результате разработчики решили (или их заставили инвесторы) прикрутить способы использовать нейросети и заставить платить пользователей за токены, то есть пропорционально частоте и сложности запросов, что существенно удорожает использование ИИ-агентов.

В итоге относительно недорогие подписки у ИИ остаются, но они не позволят строить постоянно действующие сервисы за счёт применения ежемесячных подписок. Платить придётся по мере использования ИИ. Краник прикручивают, но пока не закрывают. Интересно, как поступят российские разработчики ИИ?

Теги:
+27
Комментарии0

Успевайте подать заявку на премию за лучшее применение нейросетей в работе до 15 мая

«Сделано с ИИ» — премия для специалистов с опытом до 5 лет, которые применяют искусственный интеллект в своих рабочих задачах. Представители любых IT- и digital-направлений с ИИ-навыками могут подать свои заявки и получить профессиональное признание

Вы можете подать заявку, если:

  • Ваш проект стал возможным благодаря искусственному интеллекту

  • Вы хотите заявить о своём проекте всему профессиональному сообществу

  • Проект дал измеримый результат

Сделали две большие номинации:

1) Техно-продуктовый вклад. Самое оригинальное и влияющее на бизнес ИИ-решение: модели, аналитика, ИИ-сервисы, автоматизация и инструменты для кода

2) Лучший креативный проект. Решение на стыке креатива, дизайна, копирайтинга и ИИ, которое дало результаты и сократило время или затраты

И будет спецприз «Будущее за ним», который получат джуны, чьи решения уже сейчас приносят пользу бизнесу и могут быть масштабированы в рамках других проектов.

Победители в основных номинациях получат по 500 000 рублей, гранты от Yandex AI Studio и другие призы. А обладатели спецприза «Будущее за ним» — по 150 000 рублей. 

Предложить свой проект можно до 15 мая на сайте. Удачи!

Теги:
0
Комментарии0

Написал большую статью на Habr — От написания промптов к проектированию контекста. Или один очень обширный материал про Context Engineering

Полезно всем, кто работает с агентами Claude Code | Codex 🍦

Что внутри

Context rot и reasoning shift — почему длинный контекст это плохо

Типы Attention и как считается сложность в современных трансформерах

Из каких 7 слоёв состоит контекст Зачем нужен CLAUDE.md / AGENTS.md / GEMINI.md
Что такое MEMORY.md Секция про Skills, MCP, Subagents

Архитектура AGENTS LOOP

Как работает Prompt caching Как считается стоимость токенов

Что отличает Новичка от Мастера в работе с современными агентами

А какие там иллюстрации, мммм

А завтра онлайн в 18 мск буду читать лекцию по этой статье, залетайте послушать https://calendar.app.google/TDm1ZZusNtX5w394A

Теги:
+3
Комментарии0

Дорожная карта Agentic AI. Level 4. Мастер примеров — few-shot и structured output

Дорожная карта Agentic AI — Level 4. Мастер примеров: few-shot и structured output
Level 4. Мастер примеров — few-shot и structured output

Есть один приём, который считаю самым недооценённым в работе с моделями: учить её прямо в промпте. Никакого файнтюна, никакого дообучения, никаких отдельных датасетов. Просто показываете несколько примеров «вход → выход», и модель подхватывает паттерн. Это называется few-shot learning, и на практике работает куда лучше, чем ожидаешь.

Где это реально работает

Лучше всего на задачах, которые повторяются и где у вас есть эталонные примеры. Берёте классификацию обращений клиентов: показали модели пять размеченных примеров, и она начинает раскладывать новые обращения по тем же категориям. Извлечение реквизитов из писем, парсинг характеристик товаров, разметка отзывов по тональности — всё это ложится на few-shot.

Срабатывает это не само собой. Когда не выходит, виноваты обычно сами примеры: они противоречат друг другу, покрывают не те кейсы, которые реально встречаются в жизни, или их нет вовсе, и модель просто гадает.

Три уровня, которые нужно понимать

Чтобы не гадать самим, нужно понимать разницу между режимами. На одном конце zero-shot: только инструкция, без примеров; на мощных моделях для простых задач часто хватает и этого. One-shot добавляет один эталонный образец и полезен, когда важен точный формат ответа. Ну а few-shot это уже от двух до десяти примеров; на практике 3–5 штук оптимум, потому что меньше даёт мало сигнала, а больше добавляет шум и лишние токены. Хорошую базу по технике даёт Prompting Guide, а про подход Claude подробнее в документации: multishot-prompting.

Что класть в примеры

С количеством разобрались. Сложнее вопрос качества: что именно должно быть внутри каждого примера. Основа это пара «вход → выход» без лишнего контекста и специфики конкретного случая, которая только шумит. Если задача нетривиальная, хорошо добавлять hints — короткую подсказку с логикой решения, почему именно такой ответ. И почти всегда работают анти-примеры: «так делать не надо, вот почему» — они помогают модели понять, где проходит граница.

Почему без structured output это бесполезно в бизнесе

Но даже с хорошими примерами остаётся вопрос: куда девать результат. В продакшене нужен не текст, а JSON строго по схеме: category: "техподдержка", priority: "высокий", responsible: "техотдел". Чтобы результат сразу ушёл в CRM, в базу, в следующий сервис: не придётся разбирать свободный текст руками. Примеры для few-shot делайте сразу в этом формате: так модель быстрее схватывает нужную структуру. Документация: OpenAI Structured Outputs, Claude Structured Outputs.

Поддержка у облачных моделей хорошая. С локальными аккуратнее: реализации у разных провайдеров отличаются, проверяйте под свою модель заранее.

По опыту, хорошие примеры в паре со structured output закрывают без файнтюна и без ML-команды огромный пласт задач на извлечение, разметку и классификацию.

Разобрали продвинутый few-shot на реальном кейсе: смотрите видео.

🔔 Следующая тема: RAG и векторные базы — как передать агенту знания о вашем бизнесе.

⬅️ Предыдущая тема: Level 4. Своя кузница — локальный запуск моделей

Подписывайтесь, пожалуйста, чтобы не пропустить!

Больше про ИИ — в ТГ-канале и ВК. Каталог наших курсов, услуг и кейсов по ИИ-агентам. По вопросам — пишите в личку.

Теги:
+3
Комментарии1

Дайджест мероприятий на май:

👉 19 мая, 18:00 (Мск) День открытых дверей онлайн-магистратуры МФТИ «Науки о данных» Встреча с руководством, истории выпускников и детальный разбор правил поступления 2026.

✅ В программе:

● Карьерные возможности для экспертов в сфере наук о данных (Data Science)

● Ключевая информация об онлайн-магистратуре

✅ Формат: онлайн-трансляция, 1,5 часа

Регистрация по ссылкам: ТГ: https://t.me/mipt_events_bot?start=c1777372698834-ds ВК: https://vk.com/app6379730_-224205661#l=12

👉 20 мая, 19:00 (Мск) Карьера в управлении продуктами в 2026: что важно знать Как выглядит рынок труда, как расти в профессии в 2026 году. Разбор резюме и рекомендации по составлению от карьерного консультанта.

🎤 Спикеры:

● Татьяна Сущенко — практик продуктового управления с 18-летним опытом (работала в VK, Microsoft, ABBYY, российских и зарубежных стартапах)

● Елизавета Знова — HR-менеджер, карьерный консультант

✅ Формат: онлайн-встреча

Регистрация по ссылкам: ТГ: https://t.me/mipt_events_bot?start=dl-1777884459fc3bf3655b4c ВК: https://vk.com/app6379730_-224205661#l=16&auto=1

👉 21 мая, 18:00 (Мск) День открытых дверей онлайн-магистратуры МФТИ «Управление ИТ-продуктами»

Встреча с руководством, истории выпускников и детальный разбор правил поступления 2026.

✅ В программе:

● Карьерные возможности в управлении ИТ-продуктами

● Ключевая информация об онлайн-магистратуре

✅ Формат: онлайн-трансляция, 1,5 часа

Регистрация по ссылкам: ТГ: https://t.me/mipt_events_bot?start=c1777546389600-ds ВК: https://vk.com/app6379730_-224205661#l=13

👉 26 мая, 19:00 (Мск) Облако в действии: кейсы и инструменты Yandex Cloud

Познакомимся с облачными инструментами и их применением в реальных кейсах.

🎤 Спикер: Жанара Семёнова — менеджер проектов в науке и образовании Yandex Cloud, преподаватель Университета Иннополис, ментор стартапов

✅ Формат: онлайн-встреча

Регистрация по ссылкам ТГ: https://t.me/mipt_events_bot?start=c1777549158404-ds ВК: https://vk.com/app6379730_-224205661#l=15&auto=1

👉 28 мая, 18:00 (Мск) День открытых дверей онлайн-магистратуры МФТИ «Разработка ИТ-продукта» Встреча с руководством, истории выпускников и детальный разбор правил поступления 2026.

✅ В программе:

● Карьерные возможности для разработчиков

● Ключевая информация об онлайн-магистратуре

✅ Формат: онлайн-трансляция, 1,5 часа

Регистрация по ссылкам ТГ: https://t.me/mipt_events_bot?start=c1777547907195-ds ВК: https://vk.com/app6379730_-224205661#l=14

Участие во всех мероприятиях бесплатное. Присоединяйтесь!

Теги:
-2
Комментарии0

💥 💥💥 Новое в Gramax 💥💥💥

Breaking change

  • Представление каталога. Фильтр каталога заменили на представления — функция вышла из экспериментального режима. Теперь вместе с фильтрацией статей можно задавать переменные: одна статья показывает разный контент без создания копий.

  • ⚠️ Автомиграции нет. Если был настроен фильтр — добавьте его заново через панель представлений.

Gramax Enterprise Server

  • Настройка LFS на уровне пространства. LFS-паттерны задаются один раз и применяются ко всем репозиториям. В обычных пространствах настройки по-прежнему задаются в каждом каталоге.

  • Фильтрация метрик по каталогу. На страницах метрик добавили фильтры: в отчете по просмотрам — по каталогу, пользователям и типу, в отчете по поиску — по каталогу.

  • Улучшения настройки проверок по стайлгайду:

    • Правила отображаются таблицей, редактор открывается в боковой панели.

    • При первом запуске загружается готовый набор правил — можно адаптировать под команду.

    • Правила можно экспортировать — поделиться или сохранить копию.

    • Запуск тестов правил доступен для каждого правила.

Общие изменения

  • Свойства вкладок. Можно назначать свойства каталога — управлять видимостью в разных представлениях. Также обновили внешний вид вкладок.

  • Сортировка и фильтрация таблиц. Сортировка по нескольким столбцам и фильтрация по значениям. Параметры сохраняются со статьей — удобно для больших таблиц.

  • Фрагменты вместо сниппетов и ссылки с превью. Сниппеты переименованы во фрагменты. Теперь можно ставить ссылки на фрагменты прямо из текста: при наведении — превью, удобно для глоссария.

  • Скрытие превью при переводе. В редакторе мультиязычных каталогов появился переключатель Предпросмотр статьи — скрывает превью на основном языке, чтобы сосредоточиться на переводе.

  • Версионирование в редакторе. Теперь можно переключаться между версиями прямо в редакторе, а не только настраивать их.

  • Управление локальным кэшем. В настройках каталога на вкладке Память отображается размер кэша Git и LFS — можно очистить вручную, если каталог вырос или синхронизация замедлилась.

  • Навигация по OpenAPI. Для OpenAPI-спецификаций в правой панели доступна навигация по методам API — можно перейти к нужному без прокрутки.

  • Улучшения поиска:

    • Поиск внутри папки ограничен ею по умолчанию. При необходимости переключитесь на По всем каталогам.

    • Поиск учитывает полный путь в навигации: статью Вклады / До востребования найдете по запросу Вклад до востребования.

    • Результаты из одной диаграммы объединяются в один блок.

    • Добавлен пункт (пусто) для статей без значения, пункт (выбрать все) сбрасывает фильтр.

  • Улучшения и стабилизация:

    • Перетаскивание статей и разделов в левой панели ускорили в 10 раз.

    • Если Git-сервер недоступен, приложение переходит в офлайн-режим. Вернется автоматически, когда сервер станет доступен.

    • Обновили тулбар редактора. Элементы сгруппированы по категориям, списки открываются по клику.

    • Подсветка текста адаптирована под темную тему.

Подробнее: https://gram.ax/resources/docs/whats-new

Теги:
0
Комментарии0