Посты / Профиль Raicon / Хабр

Илья Плужников@Raicon

Продуктовый дизайнер

1,2

Рейтинг

Подписчики

Хабр Карьера Хабр Эксперты

ПрофильСтатьи16Посты34Новости2Комментарии165

Raicon

16 мар в 19:5775

Управление разработкой * Управление проектами * GTD * Управление персоналом * Искусственный интеллект

Улучшаем моего агента. Часть 4

Это четвертая часть серии (первая — в чем идея, вторая — агент с нуля, третья — что внутри).

В таких цитатах я буду показывать конкретные запросы, которые он уже хорошо решает.

———————

Поехали ⤵️⤵️⤵️

💲 Ведет учет всех моих финансов

Подключён к моей финансовой табличке, которую я веду в Notion. Умеет добавлять по категориям и анализировать отчеты даже за целый год (а записей там огромное количество).

«Посчитай доходы за последний год — покажи где и сколько я зарабатывал»
«Сколько я должен провести в налоговую за этот месяц?»
«Кто и когда мне заплатил и кто ещё должен по рассрочке курса?»

🌈 Подключен к моей гугл почте

Читает Gmail и пишет мне сводку каждое утро — есть ли там что-то интересное. Отвечать на входящие пока ему не разрешаю, может только драфты писать

«Глянь что мне там интересного пришло за эту неделю»
«Напиши жалобу в Lazada по поводу последнего ордера, он не пришел. Ордер в почте лежит, возьми номер оттуда»
«Напиши драфт в ответ на сообщение Username, я гляну попозже»

🍀 Календарь

Видит расписание, создаёт и удаляет события.

«Поставь созвон на вторник 15:00 и напомни за час»
«Поставь ученикам второго потока рекурентную встречу раз в две недели, их почты знаешь где найти»
«Глянь че у меня по слотам на понедельник, поставь созвон куда‑то на обед + дай sharable ссылку сюда»

🖥 Таск-трекер

Подключён к моему TickTick — откуда читает и пишет задачи. Каждый день пишет сводку задач, что нужно сделать с высоким приоритетом.

«Что у меня просрочено? И добавь задачу: обновить лендинг до пятницы»
«Проведи анализ моего сайта и кинь ToDoшкой себе в память + мне в TickTick»
«Добавь всем задачам в разделе Мое обучение Definition of Done. Если не уверен в том, какой должен быть DoD — пингуй»

🔥 Apple Watch — факин маджик

Два дня потратил на то, чтобы на ходу с руки записывать идеи сразу в Clawy

⌚️ «Запиши идею поста» (наговариваю прямо в часы)
⌚️ «Заправился, запиши 400 бат себе»

В общем все те кейсы что выше, но через часы.

🎶 Spotify + концерты

Знает все группы, которые я слушаю. Раз в две недели мониторит концерты в интернет. Ставит напоминалки и скидывает ссылки на покупку билетов.

«Че там какие концерты моих групп в Бангкоке в ближайшие 2 месяца?»

🌴 Знает где я живу, вплоть до точных координат

Поэтому рекомендации конкретные — не «в мире», а «рядом со мной».

«Найди хорошего стоматолога рядом»
«Хочу поехать в кафе, глянь что‑то прикольное в радиусе 5 км»

Ну и еще

Есть доступы на чтение к моим гугл таблицам и гугл драйву. Знает много инфы про мой психотип и различные тестирования.

———————

🦄 Комбинированные кейсы

Нужно проставить мне и всем ученикам в календарь созвоны на третий поток.

Глянь сайт, там точное название, описание и время уроков
Поставь в календарь их все
А почты учеников глянь в табличке 3 потока

→ На сайте забирает инфу про уроки, почты берет из таблички. Затем ставит всем встречи в календарь.

Подведи итоги за неделю

→ Собирает доходы из Notion, выполненные задачи из TickTick, события из календаря, важные письма из Gmail. Выдаёт: заработал X, потратил Y, закрыл 8 задач из 12, пропустил 2 дедлайна. Рекомендация на следующую неделю.

[с Apple Watch] «Что на сегодня у нас?»

→ «Есть один созвон в 14:00. В TickTick: обновить лендинг (дедлайн сегодня). Вчера пришло письмо на почту — ответ от Anthropic по поводу твоей проблемы. Черновик ответа готов, глянешь после завтрака?».

«Нашел такую приколюху в интернете. Изучи ее и напиши план на улучшение самого себя, потом можешь внести эти изменения».

→ Изучит идею и улучшит себя и свой функционал.

———————

👁 Что еще хочу развить

Голос — чтобы отвечал голосовыми, иногда удобнее войсом, чем текстом.

Звонки — чтобы звонил мне. Например, в 11 вечера, чтобы я сделал саммари дня. Или если я не делаю задачу, чтобы звонил мне иговорил мне «втф чел».

Доступ к Telegram — сейчас он не видит мои чаты, только если пересылать сообщения ему. Хочу подключить Telethon — чтобы мог сам читать переписки, мониторить каналы, готовить черновики ответов.

Тамагочи получается 🎮

Это мой агент сделал себе такое Identity -- он чертный кот. Сказал что он фамильяр с именем Clawy

-4

Raicon

16 мар в 14:30140

Программирование * Машинное обучение * Управление проектами * Управление продуктом * Искусственный интеллект

Делаем проактивного AI-агента.
Часть 3 — настраиваем OpenClaw, чтобы был полезным

«Вы не поднимаетесь до уровня своих целей. Вы падаете до уровня своих систем»

Это третья часть серии (первая — в чем идея, вторая — агент с нуля)

Теперь поговорим про OpenClaw — самый популярный на сегодня фреймворк для персональных AI-агентов

Архитектура моего OpenClaw

Агент живёт на сервере Railway, общается со мной через Telegram и Discord, работает через подписку Claude с Codex на подстраховке. Его поведение целиком определяется набором markdown-файлов — там и «SOUL», и память, и операционные инструкции.

Вот из чего состоит workspace моего агента

SOUL.md — кто агент. Характер, стиль, границы. Его «душа».
USER.md — кто я. Контекст, цели, паттерны, как со мной работать.
AGENTS.md — правила поведения. Safety, тиеры действий, память, heartbeat, группы.
MEMORY.md — долгосрочная память, кураторские заметки.
HEARTBEAT.md — чеклист периодических проверок (календарь, почта, задачи).
TOOLS.md — локальные заметки по инструментам.

Плюс memory/YYYY-MM-DD.md — ежедневные заметки, из которых потом дистиллируется MEMORY.md.

И skills/ — папка со скиллами (finances, ticktick, gmail, google-calendar и т.д.), каждый со своим SKILL.md.

По сути: SOUL + USER + AGENTS — это характер и инструкция, MEMORY — опыт, skills — его навыки.

Из коробки агент работает, но бесполезен без кастомизации. Ниже — проблемы, на которые я убил неделю, и их решения

⚡Проблема 1: Повышенная проактивность

По стандарту системные промпты OpenClaw звучат примерно так:

Don't ask permission. Just do it.

Это делает агента слишком самостоятельным — он может сломать себя без предупреждения.

Решение: я добавил несколько ограничений. Все важные изменения идут через localhost => GitHub, а не через его прод. На попытки изменить системные файлы агент теперь отвечает:

«Нет, это конфиг — мне запрещено его трогать. Если я накосячу с конфигом на Railway, всё упадёт в crash loop и только ты сможешь починить.»

Стандартная проблема без этого: агент что-то у себя меняет, и либо я этого не замечаю, либо он просто умирает, сломав что-то важное

⚡Проблема 2: Память — не только его храм, но и помойка

Механизм памяти в OpenClaw:

MEMORY.md — долгосрочная память.
memory/YYYY-MM-DD.md — ежедневные заметки.
Встроенный хук session-memory — при завершении каждой сессии фреймворк автоматически сохраняет сырой лог разговора в memory/.

Проблема: если часто жать /new, за короткое время накапливается огромное количество raw JSON файлов, которые сыпятся в контекст при старте каждой сессии. Мои MD-файлы состояли из 299 строк, из которых полезных фактов — 5. Всё остальное — мусор метаданных. Дистиллированная версия уместилась бы в 10–15 строк.

При этом долгосрочная MEMORY.md — почти пустая. Инструкция «periodically review and update» была слишком размытой и ни разу не сработала.

Решение: явные правила дистилляции и регулярный перенос из дневных заметок в MEMORY.md с очисткой сырых логов

⚡Проблема 3: USER.md — главный файл, и он требует постоянного внимания

USER.md — это файл о вас. Чем лучше он описан, тем лучше агент работает. Моя структура:

Basics — имя, возраст, таймзона, локация, язык
Who — тип личности, суперсила, мотивация
Background — опыт и ключевые достижения
Values — что важно в жизни
Current focus — чем занят сейчас (продукты, статусы)
Finances — доход, расходы, цель
Platforms — соцсети и каналы
People — ключевые люди вокруг
Schedule — режим дня
Work style — как работает, что драйвит
Patterns — слепые зоны и паттерны поведения
Goals — текущие цели и метрики
How Claw should interact — правила общения

Главный вывод 3 части

Workspace-файлы агента — это не «написал и забыл». Они дрифтуют, конфликтуют и устаревают точно так же, как код.

USER.md — особенно. Я и контекст вокруг меня меняются быстрее, чем я вспоминаю обновлять описание. Поэтому нужна периодическая ревизия — точно такая же, как ревизия кода.

Если кратко: персональный AI-агент — это не продукт, а процесс. Фреймворк даёт скелет, но без недели (минимум) кастомизации под себя он останется бесполезной игрушкой

Raicon

3 мар в 10:0869

Программирование * Машинное обучение * Управление продуктом * Искусственный интеллект

Фундаментальная база для AI Advanced

Или каких "Косяков" стоит избегать, чтобы результаты LLM стали лучше

🛸 Косяк №1 — по незнанию или скупости использовать не Frontier модели
Значимый рост в глубине и качестве рассуждений наступил после Opus 4.5, а лучше 4.6 + Codex 5.3 xhigh

А вот например как выглядит API GitHub Copilot на 2026 год
"id": "gpt-4.1",
"is_chat_default": true,
"is_chat_fallback": true,

Это значит, что GPT 4.1 — стандартная модель в GitHub Copilot, которой уже почти год. И она не создавалась для агентной работы

Следовательно, некорректно все вокруг называть "Я пробовал ваш ИИ и он выдает фигню". Между Opus 4.6 и GPT 4.1 огромная разница

Туда же пойдет косяк 2

---

🛸 Косяк №2 — юзать сервисы по типу CURSOR / Replit / Lovable / Copilot

Всё это AI врапперы разной сложности, но суть одна — это врапперы, которые в большинстве своем используют модели Claude / GPT через API

Бизнес модель подобных сервисов заключается в том, чтобы с вас взять больше, а за API Usage заплатить меньше. Следовательно, AUTO выбор модели в таких сервисах почти всегда идет не от того, какая модель лучше в моменте, а какая модель на текущий момент времени будет дешевле для сервиса враппера

Ну и в дополнение — API в среднем дороже подписки в ~10 раз

Следовательно, условный CODEX / CLAUDE CODE даст вам в ~10 раз больше запросов, чем тот же самый CURSOR

При активном использовании нативный тул (Claude Code, Codex) выгоднее врапперов — нет прослойки, которая зарабатывает на марже между вашей подпиской и реальной стоимостью API

---

🛸 Косяк №3 — плохой Context Engineering

У меня есть любимая цитата

Good context engineering means finding the smallest possible set of high-signal tokens that maximize the likelihood of some desired outcome

Каждое словосочетание здесь — это большой и сложный домен. И чем лучше вы понимаете эту цитату, тем лучше будет ваш результат

При работе с моделью важен Spec Driven Approach — чем лучший контекст ты задаёшь для модели, тем лучше результат

---

🛸 Косяк №4 — не использовать Claude Code CLI для работы с Claude моделями

Помимо самого качества моделей еще немаловажным фактором является model-tool co-optimization.

Claude модели лучше работают с Claude Tools
Gemini модели лучше работают с Gemini Tools
Codex модели лучше работают с Codex Tools

Разработчики отмечают, что одна и та же модель Claude работает драматически лучше в Claude Code, чем в Cursor. Programmatic Tool Calling позволяет оркестрировать несколько вызовов в одном round-trip — ~37% сокращение токенов на сложных задачах

Ну и вообще, это база всех продуктов — свое работает лучше со своим

---

🛸 Косяк №5 — бездумно заполнять 1 000 000 Context Window

Часто слышу "А вот у гугл моделей 1 000 000 контекстное окно, я туда вгружаю все подряд кааайф"

Текущие модели — трансформеры — стали прорывными за счет механизма Attention, где каждый токен следит за каждым токеном

Что значит квадратичный рост compute — aka стоимость вычисления каждого следующего "слова"

Attention у трансформеров масштабируется квадратично. Стандартный контекст сегодня — 100K-200К токенов. От 100K до 1M — это 10x по длине. 10² = 100x по compute. Если бы 1M контекст реально работал на всю длину, каждый запрос стоил бы в 100 раз дороже. Но он не стоит — потому что создатели моделей используют всякие улучшалки по типу sparse attention, sliding window, KV-cache compression

По простому — компрессия ваших входных данных будет тем выше, чем больше "важного мусора" вы попытаетесь сунуть в контекстное окно

А если еще проще — чем больше вы засовываете в одну сессию, тем хуже будет ответ

Я вообще стараюсь начинать новую сессию уже после заполнения Context Window на 60к токенов

Итого

Использовать Frontier модель + нативный тул под нее + правильно оркестрировать контекст = намного качественнее результат

Уже нет смысла гоняться за лучшими моделями — важнее развивать метанавыки работы с ИИ и агентами

Raicon

24 фев в 13:073.9K

Управление проектами * Искусственный интеллектЛайфхаки для гиковБудущее здесь

Изучаю механизм проактивного АИ-агента. Часть 2

В первой части я рассказал про концепт проактивного AI-агента и показал примеры сообщений, которые он мог бы присылать. Последние 3 дня я занимался реализацией — и сегодня пришло первое сообщение от него

За основу я взял популярный OpenClaw, но захотел переписать бота по-своему и разобраться с тем, как живёт и думает эта сущность

Архитектура: из чего состоят подобные OpenClaw агенты

Heartbeat — сердце агента

Это цикл, который раз в N минут триггерит основные события, проверки и запускает переписывание файлов, если нужно

«Проснись, посмотри, что изменилось, подумай, что предложить пользователю».

Memory — память агента

Нужно было спроектировать аналог краткосрочной и долгосрочной памяти, примерно как у людей.

Краткосрочная — контекст текущей сессии, что происходило сегодня, какие задачи обсуждали, что пользователь ответил. Долгосрочная — в случае OpenClaw это SQLite с механизмом эмбеддингов. Ну можно поставить любую другую векторную бд

Плюс есть еще такие файлы как Soul, Agents, Identity, User, Memory и еще несколько. Все они сразу попадают в Context Window

Без разделения на два типа памяти агент либо забывает всё на следующий день, либо тонет в контексте и начинает галлюцинировать.

Memory Compaction — сжатие памяти

В OpenClaw агент хранит часть контекста в файлах формата MEMORY_MM_DD_YYYY с историей каждого дня.

По прошествию нескольких дней агент делает Compact этих файлов и удаляет / архзивирует их исходники

Context Routing — маршрутизация контекста

Как и чем нужно заполнять контекст на протяжении времени? Как его сжимать?

Контекстное окно — ресурс ограниченный. Нельзя каждый раз загружать все цели, всю память, все задачи. Нужно выбирать: что релевантно сейчас, что можно опустить, что критично.

Context routing решает, какие куски информации попадут в промпт для конкретного цикла работы агента.

Prompt Assembly — сборка промпта

Как структурировать промпт? Какая информация в нём приоритетнее, а что можно поджать? Как выбираются цели на конкретный день?

Это отдельная инженерная задача. Промпт агента — не статичный текст. Он собирается динамически из кусков: текущие цели, релевантная память, задачи из таск-трекера, контекст дня недели и времени.

---------------

Что я добавил к исходному варианту OpenClaw от себя

Reflection — самооценка агента

Экспериментальный блок, где модель оценивает сама себя по 4 шкалам:

Actionability — дал ли конкретные шаги?
Relevance — был ли совет по теме цели?
Novelty — сказал ли что-то новое?
Overall quality — общее качество

Зачем это нужно: без обратной связи агент быстро скатывается в банальности типа «Не забудь поработать над своими целями!». Reflection заставляет его критически оценивать свой же output и со временем улучшать качество предложений.

К чему он у меня подключен

TickTick — мой таск-трекер, откуда бот смотрит задачи и ставит новые
Telegram — сюда он мне пишет и предлагает задачку на сегодня
Discord — самый лучший по функционалу на сегодня

----------------

Что я понял в процессе

Создание проактивного агента — это совсем другой уровень сложности по сравнению с обычным чат-ботом.

В чат-боте пользователь задаёт вопрос → получает ответ. Всё. Контекст понятен из вопроса.

В проактивном агенте нужно решить кучу вопросов, которые в чат-боте просто не возникают: когда писать, о чём писать, как не повторяться, как не раздражать, как понять, что задача уже неактуальна, как сжимать память, чтобы не выжирать токены.

Это, по сути, проектирование UX для системы, у которой нет интерфейса в привычном смысле — только текст в мессенджере.

Вот такие промежуточные итоги — получилось хоть немного разобраться в возможном механизме оркестрации под капотом агента

Если где то нашли неточность, то пинганите в комментах

В третей части напишу подробнее про OpenClaw, так как пока решил его потестировать

Raicon

20 фев в 20:156.6K

Машинное обучение * Управление проектами * GTD * Искусственный интеллектБудущее здесь

Мысли про создание AI-агента, который будет помогать с "Важно, но не срочно" задачами. Часть 1

Последний месяц в сети хайпит OpenClaw (он же ClawBot, он же MoltBot).

У него есть доступы много куда — вы наверняка уже видели новости о том, как он самостоятельно тратит деньги или общается с женой (не своей)

Но меня интересует механизм работы его core feature — проактивности

Это первый масштабный агент, который не ждёт сообщения, а сам приходит и говорит: «Эй, я вот это сделал, глянь»

Я хотел собрать такого агента ещё год назад, когда обнаружил и начал исследовать Model Context Protocol, который дал моим LLM-кам доступ во внешний мир. Но тогда не хватило ни знаний, ни механизма.

Сейчас, благодаря OpenClaw, Claude Code + Codex стало понятнее, как именно это можно реализовать

И вот последнюю неделю я понемногу развиваю этот концепт

------------------------------

Суть в одном предложении
AI-агент, который знает мои цели на год и выполняет первые, самые сложные 15% работы, которые приведут меня к этим целям в долгосрок.

Последние три года я работаю на себя. У меня нет начальника, который скажет «сделай к пятнице». Почти все мои перспективные задачи лежат в квадранте «Важно, но не срочно»

И чаще всего проблема не в том, что я не знаю, что делать, а в том, что мне впадлу начать

Ресёрчить варианты. Разбираться в деталях. Сделать первый шаг. Вот эти первые 15% — самый проблемный шаг для меня

Поэтому я подумал — а что если агент будет делать именно это?

------------------------------

Представьте, что агент каждый день приходит к вам с такими сообщениями

Нетворкинг и аутрич
Учитывая твои финансовые и профессиональные цели, на этой неделе я советую тебе пообщаться с этими людьми. Я провёл небольшой ресёрч по каждому и подготовил персональное сообщение под каждого. Сделаешь до конца недели?

SEO и органика
Я опять помониторил SEO твоего сайта и сайты конкурентов. Советую сделать A, B, C, D, чтобы мы подросли в органике. Вот конкретные правки с приоритетами

Контент и кросс-постинг
Твой последний пост на LinkedIn набрал 10К просмотров — тема зашла. Давай этот пост ещё и в Threads, Instagram и на Хабр адаптируем? Вот три черновика под каждую площадку

Партнёрства
Нашёл 8 владельцев продуктово-консалтинговых агентств, которые подходят под твой ICP. Отсортировал по релевантности. Вот топ-3 с кратким профилем и черновым сообщением под каждого. Первое можешь отправить прямо сейчас.

Мониторинг конкурентов
[Конкурент] вчера выкатил новую фичу — вот что изменилось. Это может повлиять на позиционирование твоего продукта. Вот 2 варианта, как отреагировать: адаптировать лендинг или написать пост-сравнение.

Портфолио и резюме
За последний месяц ты закончил 2 проекта и написал 4 поста. Вот обновлённая версия секции «достижения» для LinkedIn-профиля и сайта. Опубликуешь?

Здоровье
Ты 4 месяца переносишь задачу "Записаться к стоматологу. Поэтому я решил действовать и нашел 3 клиники рядом с тобой с рейтингом выше 4.5, у двух есть слоты на эту неделю. Записать?

------------------------------

То есть агент не просто читает календарь — он понимает, что ему чего-то не хватает, и сам приходит за недостающим контекстом

Я хочу, чтобы агент не просто напоминал по моим задачам в календаре, а ресёрчил → структурировал → предлагал конкретный микро-шаг → спрашивал «актуально ли?»

Хочу чтобы конвертировал мои абстрактные хотелки из раздела «Важно, но не срочно» в конкретные day-to-day actions.

И это может работать не только для одного человека. Та же логика ложится на компанию: стратегические цели → первые шаги, которые никто не делает, потому что «не горит».

Пока это концепт. Но направление, в котором я копаю, кажется мне одним из самых интересных применений AI-агентов — не делать за тебя, а снимать барьер старта и помогать тебе двигаться к твоим Long Term Goals — по типу коуча/ментора

У подобного агента будут доступы к интернету и моему календарю. А общаться мы с ним будем через Telegram — видимо, как и с OpenClaw

------------------------------

Во второй поделюсь наработками и инсайтами

Raicon

6 фев в 19:0616K

Качество кода * Разработка мобильных приложений * Разработка игр * Управление разработкой * Искусственный интеллект

Сколько я плачу за AI инструменты и как они у меня взаимосвязаны

Claude — мой основной AI инструмент уже как 9 месяцев — Плачу за него 100$

Состоит из Claude Desktop, Claude Code UI и Claude Code CLI

Если хочу работать в приятном UI с текстом → Claude Desktop
Если работаю локально с кодом → Claude Code CLI
Если хочу поправить код с телефона → Claude Code UI

Коротко что все это такое
• Claude Desktop — как чат GPT, но с поддержкой MCP + Skills и еще всякими штуками
• Claude Code — UI для работы с вашим репозиторием
• Claude Code CLI — Command Line Interface Агент. По сути это микс Claude Desktop + Claude Code по функционалу, но без интерфейса и работает внутри вашего компьютера. Мое любимое развлечение последних двух месяцев

Claude Code CLI — пока что самый прокачанный на рынке CLI агентов

———

OpenAI, который chatGPT — за него плачу 20$

• ChatGPT UI — им почти перестал пользоваться, только ради генерации картинок иногда залетаю. Они после недавнего релиза стали их генерировать на уровне с Nano Banana
• Codex UI(Аналог Claude Code) — UI для работы с вашим репозиторием
• Codex CLI (Аналог Claude Code CLI) — чуть менее прокачанный как Command Line Interface, но зато их модель Codex 5.2 Extra-high уделывает OPUS 4.5 в плане UI дизайна и продумывания/рефакторинга сложных вещей

Но в Codex CLI вроде как отсутствует аналог ESC + ESC из Claude Code CLI для откатки написанного кода, без него тяжко жить 🍌

OpenAI недавно признали то, что их гонка с Claude за тем, чтобы сделать лучший кодинг агент, привела к тому, что 5.2 потеряли человечность в общении и стали сильно более директивными и сухими

Это помогает при работе с кодом, но общаться с ней сложнее

———

Экосистема Google — плачу 8$ за Plus подписку

Google у меня для трёх вещей: картинки через Nano Banana, NotebookLM и Antigravity для просмотра кода. Халява за 8$

• Nano Banana, иногда Veo 3 для генерации картинок / видео — лучшие генераторы картинок / видео на рынке
• NotebookLM — прикольный RAG UI, всем советую потестить
• Antigravity — Fork VS Code по типу Cursor, но с продвинутым Agent Workflow. Есть доступ к Gemini Pro + почему-то Claude моделям. Плюс Antigravity может генерировать картинки сразу вам в код через Nano Banana, такой вот бесшовный воркфлоу

Ни Gemini UI ни Gemini CLI я особо не пользуюсь. Мне они кажутся сильно сырыми по сравнению с Claude Code | GPT

———

Как выглядит мой воркфлоу

Claude Desktop для задач, где мне хочется иметь приятный UI и фичи именно Desktop интерфейса. Например написание постов, создание табличек, графиков и всего такого — те задачи, где CLI сильно проседает по UX

Claude Code UI почти не использую, только когда нужно изменить репозиторий с телефона, например на улице или в поездке

Claude Code CLI — мой day to day tool для работы с кодом. Пишу на Opus 4.5. Для сложных задач прошу создать промпт для Codex.

Antigravity юзаю для просмотра кода и папок, иногда запускаю Gemini 3 pro как третье мнение

Codex, как я уже и говорил, требует особого навыка общения. так как она может думать по 40 минут и перековырять вам весь код, но зато она у меня всегда находит те корнер кейсы, которые не находит ни Opus 4.5 ни Gemini 3 pro. По стилю общения вы будто общаетесь с Сеньёром, который вас презирает, зато резалт пушка

———

Прикольные фишки, которые я постоянно применяю

Через Antigravity прошу генерировать изображения со вставкой сразу в код, получается бесшовный воркфлоу Prompt => Generation => Insertion
Используй Claude CLI Opus 4.5 для Day to Day задач
Используй Codex CLI xhigh для задач на рефакторинг или поиск corner cases, он сильно тщательнее это делает
Планируя новую фичу, проси Claude создать локальный MD с планом, а затем Codex xhigh + Gemini 3 pro пусть покритикует этот план и напишет ниже свои комменты
Не забывай про кнопку ESC + ESC в Claude Code CLI
Claude Code CLI в начале сессии загружает себе CLAUDE.MD, Codex загружает в себя AGENTS.MD, а Gemini — GEMINI.MD.
Команда /context покажет контекст текущей сессии, старайся держать его как можно ниже
Good context engineering means

-7

Raicon

27 янв в 13:116.3K

Управление проектами * Управление продуктом * Управление персоналом * Искусственный интеллект

Как я планирую неделю за 5 минут с Claude + TickTick на реальном примере 🙃

Накидал голосом в Claude примерный список задач — без дат, без приоритетов, просто что я думаю нужно сделать

⚠️ Important
У меня очень хорошо описаны правила постановки задач и по моему курсу у Claude тоже много контекста, без этого подобное планирование невозможно

Вот как выглядит диалог с Claude от голосового до записей в календаре ⤵️

👱 «Закинь эти задачи в TickTick на неделю, можешь еще примерно приоритет важности поставить»
🤖 «Ок, создал 17 задач, распределил по дням, расставил приоритеты»
Дополнительно Claude уточнил у меня: «Для лендинга мне от тебя нужны даты старта. И еще, механика ранней цены — по местам или по дате?»

Т.е. он не тупо поставил задачи, но и еще доспросил по тем вопросам, где нужно уточнение

👱 «Размажь эти задачи по времени дня релевантно»
🤖 Распределил задачи по рабочему дню: утро и день — мелкие задачи, вечер — вдумчивые. Как ты любишь.

У моего Claude в проекте постановки задач описано много правил по тому, какие типы задач в какое время дня мне больше нравится делать. И он это все учитывает

👱 «Поставь релевантную длительность»
🤖 Проставил start/end для каждой задачи: статья — 3 часа, обновить цены — 30 минут, встреча — 1.5 часа.

Чтобы это были не просто todo в календаре, а именно что занятые тайм слоты

👱 «Распиши по SMART в описании»
🤖 Добавил в каждую задачу S/M/A/R/T — что сделать, как понять что готово, почему реально, зачем нужно, дедлайн.

Это я уже по приколу добавил, на самом деле у него немного другие правила детализации задач. Но сам факт, что при наличии нужного контекста он еще и критерии выполнения может добавить

Все работает через Claude Desktop => Tick Tick MCP => Tick Tick

Конечно, можно все в одном промпте провернуть, но я решил так показать

Вот в итоге все задачи проставлены, интерфейс календаря не открывал

Raicon

26 дек 2025 в 08:524.2K

Программирование * Управление разработкой * Развитие стартапаУправление продуктом * Искусственный интеллект

Неделю назад выступал с темой MCP сервера и как можно решить проблему с забиванием контекста как при старте диалога, так и при последующем общении через MCP сервера

Это больше походит на исследовательскую работу, а не на мой каждодневный сценарий использования. Мне было интересно, до скольки токенов можно сжать диалог без ухудшения качества

Вот, можете ознакомиться ⤵️⤵️⤵️

Давайте для начала о том, что такое MCP

MCP — протокол, который позволяет LLM подключаться к внешним сервисам: Notion, GitHub, Jira, Google Analytics, любой сервис с API. Один стандартный разъём вместо зоопарка интеграций — как USB для AI.
Протокол создали в Anthropic в ноябре 2024, в декабре 2025 передали в Linux Foundation с поддержкой OpenAI, Google, Microsoft и AWS. Де-факто стандарт индустрии. Вот тут есть каталог серверов, можете глянуть

Я уже писал про MCP ранее, тоже можете глянуть

--------------

Но у MCP есть две неочевидные проблемы, на которые я наткнулся после нескольких месяцев активного использования.

🛸 Проблема №1: Tools съедают контекст до старта

Предзагруженные MCP Tools занимают Context Window ещё до первого сообщения. Как системный промпт — уже там, когда вы только открыли чат.

Конкретные цифры из моих замеров:

Apify MCP — 7 инструментов, ~11.8k токенов
GitHub Official MCP — 40 инструментов, ~25-30k токенов
Несколько серверов вместе — легко съедают 40-70k токенов

При контексте в 200k это уже 20-35% бюджета — и вы ещё ничего не спросили.

🛸 Проблема №2: JSON забивает контекст в процессе

MCP-сервер — это переброска JSON-запросов между LLM и сервисом. Каждый вызов инструмента генерирует запрос и ответ, которые остаются в истории чата. Эти JSON часто громоздкие — особенно ответы с данными. Контекст забивается не на старте, а по ходу общения.

Почему это важно

Популярные модели имеют Context Window 128-200k токенов. Это весь бюджет чата: системные промпты, знания о вас, файлы, коннекторы. Что не влезает — забывается.

Хуже того: чем больше загружено в контекст, тем чаще модель теряет детали. В тестах на поиск 8 фактов GPT-5.1 падает с 65% до 30% при заполнении до 100k токенов. Даже более мощная GPT-5.2 проседает с 95% до 70%.

То есть проблема не только в лимите, но и в качестве работы модели при забитом контексте.

Решение для проблемы №1: Dynamic MCP

Docker Dynamic MCP — подключаем серверы не заранее, а динамически, во время разговора.

Например, вместо 40+ инструментов GitHub в контексте постоянно — лёгкий шлюз с базовыми командами:

mcp-find — найти сервер в каталоге
mcp-add — подключить к текущей сессии
mcp-exec — выполнить инструмент
mcp-remove — отключить сервер

Базовая нагрузка: ~4k токенов вместо 40-70k. Серверы подключаются по требованию и удаляются, когда больше не нужны. Работает с каталогом Docker MCP, где уже 300+ верифицированных серверов.

Нужно установить Desktop Client и в настройках Beta Features включить Enable Docker MCP Toolkit

Решение проблемы №2: запускать MCP сервера в SubAgents

SubAgents из Claude Code выполняют запрос в изолированном контексте, возвращая только результат.

Вся грязная работа — поиск серверов, подключение, вызовы инструментов, парсинг JSON-ответов — происходит в отдельном контексте подагента. В основной контекст попадает только чистый финальный ответ.

Claude Code (основной контекст)
         │
         ▼ Запрос
    ┌─────────────┐
    │  SubAgent   │ ← вся работа с MCP
    └─────────────┘
         │
         ▼ Только результат
Claude Code (чистый контекст)

Итог: ~70k токенов экономии = 35% контекста свободно для реальной работы

Для полного описания всего этого нужна большая статья, так как без картинок и примеров суть идеи может быть непонятна

Raicon

14 дек 2025 в 20:216.1K

Монетизация IT-систем * Развитие стартапаУправление продуктом * Бизнес-модели * Дизайн

Раз уж вчера начали говорить про вайбкодинг (да как говорить, 40 комментов уже), то давайте своими пожеланиями для создания своего первого продукта поделюсь

Это часть 2, вот тут часть 1

Пункты ниже в основном подходят для первого продукта, который хочется создать и монетизировать

Создание продукта — это только начало

После релиза MVP начинается стадия шейпинга: сбор фидбека, итерации, баги, улучшение онбординга, поддержка, оплаты. Часто продукт после запуска и продукт через 3 месяца — это разные продукты.

Если думаешь "запущу и пойду делать следующий" — скорее всего, первый не взлетит без постоянных финансовых и временных затрат на его продвижение.

Статистически, первые значимые деньги начнут приходить через 4-5 месяцев

Много микро-проектов = масштабирование ошибок

Есть такой популярный совет — "Делай 1 проект в месяц, что-то выстрелит".

Но проблема в том, что если ты не понимаешь, почему первый не взлетел — второй провалится по той же причине. И третий. И десятый.

Этот совет еще может будет хорош для serial founders, которые уже прошли не один цикл и понимают паттерны. Для первого-второго проекта лучше сфокусироваться и вытащить максимум learnings из одного

Хорошая цель для первого продукта — не юникорн, а 300 платящих клиентов

Найди 300 человек на планете, которые платят $10/мес = $3k MRR. Это уже актив, который позволяет жить практически где угодно.
Для подобного продукта сейчас не обязательно искать инвесторов, собирать огромную команду или считать TAM SAM SOM, все можно сделать одному при достаточном усердии

Пивоты — это норма, а не провал

YouTube начинался как дейтинг-сервис. Instagram — как приложение с чек инами и фильтрами. WhatsApp — как статусы для контактов.
Первая идея почти никогда не та, что взлетит. Главное — быть в рынке и слушать, что говорят пользователи.

Продвижение также важно, как и продукт

Отличный продукт без дистрибуции умрёт. Средний продукт с хорошим продвижением будет вполне комфортно себя чувствовать.
И на продвижение точно придётся тратить не меньше времени, чем на создание и улучшение, поэтому ⤵️

Органика требует времени — поэтому о продвижении надо начинать думать тогда же, когда и о создании продукта

SEO, контент, комьюнити — это всё работает, но с задержкой в 3-6 месяцев.
Если начнёшь думать о продвижении после запуска — потеряешь полгода. Пиши, публикуй, собирай аудиторию параллельно с разработкой.
Очень хорошо заходит формат Building in Public, где вы делитесь успехами и сложностями на пути к первым клиентам.

И да, похвалите Gemini за инфографику. Он немного накосячил с визуальной последовательностью, но все равно красиво сделал

-1

Raicon

14 дек 2025 в 20:175.3K

Монетизация IT-систем * Развитие стартапаУправление продуктом * Бизнес-модели * Дизайн

Это часть 1, вот тут часть 2

Пункты ниже в основном подходят для первого продукта, который хочется создать и монетизировать

Первый продукт лучше строить на пересечении: "Интересно / Могу / Кто-то за это заплатит"

И именно в таком порядке.

Если вам не интересно, то все остальные пункты уже не так важны.

По поводу Могу / Не могу
Сейчас "не смочь" — уже не рабочая отмазка. Разработка была единственной ощутимой проблемой, из-за которой людям приходилось говорить "О нет, это не моё, я гуманитарий".

По поводу "Заплатит / Не заплатит"
А если никто за это не заплатит — ну и ладно, хотя бы разберётесь как создать хоть что-то рабочее в первый раз. С текущими технологиями цена ошибки — несколько потраченных вечеров, а не месяцы и тысячи долларов как раньше.

Легче всего для первого продукта решать проблему, которая есть и у тебя

Поиск абстрактных "проблем рынка" через Reddit или Keywords мало чего даст тому, кто не понимает основы Customer Development'a.
Если это не твоя проблема — тебе сложно будет понять боль клиентов.
Когда делаешь для себя — ты уже понимаешь задачу, лучше понимаешь, где искать таких же людей, и можешь отличить важное от лишнего ☕️

То, что получилось у конкурентов, не обязательно получится у тебя

"У них работает, значит и у меня сработает" — возможно, но нет.
Успех часто связан с набором случайностей. Попали в хайп, у CEO огромный социальный нетворк или связи, залетел виральный пост, влили много на рекламу.

Конечно, лучше смотреть на продукт конкурента, чем не смотреть вообще.
Но к наличию каждой функции в продукте конкурента лучше относиться скептически, потому что ⤵️

80% фичей конкурентов, скорее всего, не работают

Многие смотрят на конкурентов и думают: "Надо сделать всё это, чтобы быть конкурентным".
А по факту — большая часть их фичей не используется или не влияет на метрики. Они сами не знают, что работает. Или знают, но не скажут.
Не копируй весь набор. Найди 1-2 вещи, которые реально решают проблему, и сделай их лучше.

Допустим, мне часто нужно вытаскивать аудиодорожки из длинных видео. Видеоряд грузить в интернет, чтобы вытащить аудиодорожку — слишком долго. Мне предлагают скачать всякие сложные сервисы, где эта функция еще и будет под платной подпиской. Следовательно, за пару вечеров я бы мог создать себе сервис с одной функцией — извлечь аудио. И для меня это уже будет ценно. А если будет ценно для меня, то и другие такие найдутся

Отсутствие конкурентов — red flag

Кажется логичным: у моей идеи нет конкурентов = голубой океан = ваукакклас.
На практике — если нет конкурентов = либо рынка нет, либо ищешь не там, либо рынок только зарождается и придётся потратить миллионы на создание спроса.

Конкуренты — это всегда хорошо. Они доказали, что рынок существует. Твоя задача — сделать лучше для конкретной ниши.

Часть 2

-3

Raicon

13 дек 2025 в 19:488.1K

Управление разработкой * Управление проектами * Развитие стартапаДизайнИскусственный интеллект

Про вайбкодинг

Я в создании продуктов и продуктовом дизайне уже больше 6 лет

Успел застать эру дизайна интерфейсов и в Photoshop, и в CorelDraw, проектировал UX в AdobeXD, а потом и Figma вышла

Поучаствовал в создании ~15 стартапов — и у нас чаще всего была 1 проблема — разработка.

Разработка стоила дорого во всех смыслах.

Это и прямые затраты — когда уже в процессе и каждый месяц уходят деньги на команду. И opportunity cost — когда идея даже не доходит до старта, потому что "где я возьму на разработчика".

Получается, чтобы создать продукт, у тебя было два пути: либо ты сам/кофаундер разработчик, либо у тебя есть деньги на разработку. Третьего не дано. Идеи без одного из этих условий оставались идеями ☕️

Что привнес вайбкодинг

Любые задачи Junior-уровня сейчас закрываются ИИшкой без проблем. С большими проектами сложнее — там пока люди не научились работать с большим контекстным окном. Но барьер входа упал радикально.

Например, в последнем батче YCombinator у большинства проектов почти весь код AI-сгенерирован. Это не плохо или хорошо, но вот как наблюдение

Что меняется

Время от идеи до работающего продукта сократилось в разы. ИИшка может собрать MVP за 2 дня, тогда как раньше даже простая разработка занимала недели или месяцы. Я до сих пор помню свои стартапы, где мы пилили функционал по 3-4 месяца — хотя сейчас я бы собрал это за несколько дней.

Теперь не нужна cost consuming команда, чтобы показать результат. Расходы из зарплатного фонда перетекают в расходы на подписки

Вайбкодинг резко удешевил и ускорил создание софта, поэтому венчур (и другие “money givers”) смещается от “дать денег, чтобы построили” к “дать денег, чтобы доказали спрос и масштабировали”

Как это влияет на мир

Количество созданных проектов увеличивается → конкуренция за пользователя растет → появляется больше нишевых решений

Раньше универсальный софт был следствием того, что разработка стоит дорого. Экономически выгоднее один продукт для всех. Сейчас за неделю можно создать 10 копий одного решения под разные рынки/ниши, и все они будут вполне рабочими

И получается, что самыми дорогими навыками теперь стали ⤵️

👨‍💻 Умение генерировать ценные идеи
👨‍💻 Продвигаться
👨‍💻 Выигрывать конкурентную борьбу за клиента

Почему вайбкодинг не спасет 95% проектов от провалов

Вайбкодинг убрал процесс, который и так не влиял на успешность продукта. Код сам по себе не делает продукт успешным — он просто был барьером на входе. Барьер сняли, но всё, что реально влияет на успех — все еще нужно уметь решать: понимание ЦА, работа с проблемой, умение донести продукт до людей, которым он нужен, и затем еще и масштабировать успех

Дальше — две долины (не той) смерти:
— Problem-Solution Fit: Решаем ли мы важную проблему?
— Product-Market Fit: Достаточно ли людей готовы за это платить?

Вероятность пройти оба — около 5%. У тех, кто не понимает, что нужно делать.

Потому что за "создать успешный продукт" спрятаны 4 огромных домена

Находить проблемы людей
Не "мне кажется, это нужно", а реальные боли, за решение которых платят
Проектировать решение
Так, чтобы оно действительно решало проблему. Не фичи ради фич
Продвигать через сотни конкурентов
Кстати, отсутствие конкурентов — red flag. Либо ты дизраптор с миллионами на маркетинг, либо рынка просто нет
Выстроить прибыльную бизнес-модель
Чтобы unit-экономика сходилась, а не "сначала наберём пользователей, потом разберёмся"

Каждый из этих пунктов — отдельная дисциплина. И вайбкодинг не помогает ни с одним из них

Итого

Вайбкодинг снижает ценность "уметь писать код". Но повышает ценность "уметь создавать продукты, которые покупают"

Технический барьер упал. Продуктовый — остался

Теперь просто больше людей могут быстрее создавать продукты, которые никому не нужны. Зато цикл обучения будет быстрее ☕️

Хорошая новость: если ты понимаешь продуктовую часть — у тебя огромное преимущество. Потому что большинство соревнуется в скорости разработки, а не в качестве идей.

-13

Raicon

18 ноя 2025 в 12:545.1K

Управление проектами * Управление продуктом * Управление персоналом * Искусственный интеллектБудущее здесь

Вторая часть про Tier 1 "AI tools", первая тут https://habr.com/ru/posts/966942/
В первой части коротко про ChatGPT, Claude + NotebookLM, во второй коротко про изображения и автоматизации

🔡 Генерация изображений и видео

Nano Banana 🍌

Визуальная модель внутри Gemini, которая генерирует одни из лучших на сегодня изображений. Очень высокое сохранение лиц и объектов.

В интерфейсе Gemini на бесплатном аккаунте доступно до 100 генераций в день

Либо можно работать через AI Studio — он чуть перегружен, но там можно выбирать разрешение:

Основные сценарии:
• Создание контента и креативов с нуля
• Визуал для постов, афиш, презентаций, обложек
• Быстрое редактирование и улучшение фото (удаление объектов, замена фона)
• Генерация ключевых кадров для дальнейшего создания видео в Veo 3.1

Nano Banana не переделывает всю сцену с нуля, а как бы «прифотошопливает» людей и объекты, сохраняя исходную композицию.

Лучшие практики:
• Подробно описывайте результат (стиль, освещение, тона)
• Используйте референсы для сохранения персонажей и стиля
• Работайте итеративно: сначала фон, затем персонажи, потом детали

Про AI изображения писал огромную статью, все те же правила подойдут и для бананы

Veo 3.1 (есть ещё Sora 2, тоже очень высокого качества)

Создание видео из изображения или текста

Гугловская модель для создания видео и озвучки. Превращает статичные изображения в живые ролики.

В бесплатном Gemini напрямую не доступен — нужен Pro-тариф.

Основные сценарии:
• Создание рекламных и промо-роликов без съемок
• Короткий контент для Reels, Stories, TikTok
• Оживление статичных фото и концепт-артов
• Демонстрация продукта с разных ракурсов

Как работать:
• Пропишите детальный сценарий: локацию, время, героев, действия, камеру, звук
• Добавляйте референсные изображения для сохранения стиля
• Тестируйте композицию в Fast, финальный вариант делайте в Normal

В режиме Image to Video можно загрузить два кадра (Start Frame и Finish Frame) и получить плавное видео между ними.

⸻

🔡 Автоматизации и агенты

n8n

Low-code платформа для автоматизаций. Не только AI, но последнее время они активно развивают AI ноды

Это уже сильно прикладной инструмент. Последнее время мне намного проще написать кодом и развернуть на своём сервере автоматизацию, чем собирать в n8n.

Но для визуальной сборки он классный 🐥

Основные сценарии:
• Автоматическая обработка заявок, лидов, форм
• Связка ChatGPT/Claude с CRM, Notion, почтой
• Регулярные отчеты, выгрузки, уведомления

AgentKit от OpenAI

Похоже на n8n немного, но достаточно сильно отличается изнутри. Работает только как агентная система с ИИ. Тогда как в n8n не обязательно ставить ИИ-ноду.

Но у AgentKit есть огромные плюсы в виде очень удобного RAG, Guardrails и уже готового SDK с сильно настраиваемым UI.

Что означает, что чат-бота можно развернуть за 10 минут на своем сайте.

Есть много других подобных сервисов, например Make или Google Opal.

⸻

🔡 Создание сайтов и интерфейсов с помощью ИИ

Что пробовал я:
• Replit
• Lovable
• v0
• Bolt

Насчет разницы между ними сложно сказать, так как они постоянно развиваются, а мой опыт работы с каждой из платформ становится не релевантным уже спустя месяц. Но если бы я выбирал только 1 из них, то выбрал бы Replit, вроде самый популярный сейчас

Я просто последнее время перешел на связку VS Code + Claude Code + Codex + CLI, а за инструменты из списка выше платить перестал.

Cursor я кстати не использую, но без каких либо конкретных причин, просто за Claude Code 100$ плачу

Про работу с кодом как нибудь отдельно расскажу, ещё и про AI CLI. Так как это очень большой отдельный мир

-4

Raicon

16 ноя 2025 в 14:277.9K

Управление проектами * Контент и копирайтинг * Управление персоналом * Искусственный интеллектБудущее здесь

Уже несколько месяцев как провожу воркшопы по AI, и вот список сервисов, про которые я постоянно там рассказываю

Часть 1 про LLM 🫡

ChatGPT — это база, основную теорию по которому я расписывать не буду, по нему у меня написан целый гайд

Но в chatgpt вау эффекты для меня вызывают эти функции 👇

Agent Mode

Режим, в котором ИИ эмулирует поведение человека в браузере — сам открывает сайты, кликает, вводит данные, ищет и сравнивает информацию.

Основные сценарии:
• Поиск отелей на Booking/Airbnb по конкретным критериям
• Поиск товаров на маркетплейсах вроде Lazada
• Сбор информации с сайтов, где обычный поиск бессилен
• Выполнение простых рутинных действий в интерфейсе

Их браузер Atlas, насколько я понимаю, должен делать примерно то же самое, но я еще не успел его протестировать — он пока только на macOS.

GPTs

Отличный вариан настроить чат под себя, добавив свои документы и системный промпт

Основные мои сценарии, которые я делал либо для себя, либо для компаний
• Переводчик в нужном стиле
• Личный редактор под мой tone of voice
• Чат по продукту/компании на базе знаний
• Онбординг-бот для новичков
• Внутренний FAQ по документации

Deep Research

Почти все знают про Deep Research для изучения интернета и сбора информации. Но мало кто знает, что его можно запустить и в свой Gmail, Google Drive, Notion или GitHub.

Например, он бегает по моему GitHub и делает подробное ревью репозитория, дает советы по продуктовому бэклогу и подсказывает, что можно улучшить в коде.

⸻

Claude — мой второй LLM

Мне чуть больше нравится, как он пишет, но 90% моего использования Claude — это возможность подключения множества сервисов через MCP: Google Analytics, Miro, Notion, Apify, Tick Tick и другие.

Со всем этим Claude может взаимодействовать — читать данные и записывать.

Это невероятно удобно: почти в каждом инструменте у меня есть умный помощник, который может получить и проанализировать данные прямо из базы сервиса.

Да, у ChatGPT тоже есть MCP, но по сути это слой поверх OAuth. У Claude вариантов подключения к тысячам сервисов ощутимо больше и гибче.

⸻

NotebookLM — RAG-UI от Google

Красивый интерфейс для RAG-системы. Загружаешь свои данные, а он строит вокруг них чат и артефакты.

На одном воркшопе команды за 30 минут сделали чатики для онбординга новых сотрудников на основе корпоративных статей. Теперь новый сотрудник, вместо изучения статей, может просто задавать вопросы в чатик и получать моментальные ответы с ссылками на источники.

Что можно загрузить:
• Множество документов
• Обычный текст
• YouTube-видео по ссылке

Что можно получить:
• Чат, который опирается только на загруженные данные и практически не галлюцинирует
• Видео, аудио, текстовые конспекты и отчеты
• Квизы, мемори-карточки, майндмэпы

Если еще не пробовали NotebookLM — очень советую

Вторую часть выложу чуть попозже

-6

Raicon

27 авг 2025 в 06:284.3K

Машинное обучение * Научно-популярноеИскусственный интеллектНаучная фантастикаБудущее здесь

Can a Machine Think?

Пару дней назад я нашёл свою первую публично опубликованную статью, которую написал более 5 лет назад

Через 2 года после того, как OpenAI выпустили документ "Improving Language Understanding by Generative Pre-Training" — то, что можно считать основой GPT-1

Тогда рассуждения об ИИ, с которым можно качественно общаться, воспринимались как что то далекое. Похоже на то, о чем рассуждал ещё Алан Тьюринг

А Siri и Google Assistant были вершиной публично доступных чат-ботов

Но прошло 5 лет, и ИИ агенты это уже данность. Они спокойно проходят не только тесты Тьюринга, но и вообще любые тесты

Но есть одна проблема...

Мы уперлись в стену

GPT-5 показывает фундаментальное ограничение GPT моделей — мы близки к исчерпанию всех оцифрованных человеческих знаний, которые нужны моделям на стадии предобучения

Можно улучшать модели через мелкие улучшения изнутри, увеличивать reasoning tokens за счет роста вычислительных мощностей и структур сетей, но от этого подобные модели не перестанут быть next token prediction

Если привести аналогию, то модель "пытается познать мир", находясь внутри библиотеки. Но насколько большую библиотеку ты не создавай, по настоящему познавать мир через нее у модели не получится

Для познания мира мы, люди, используем совершенно другой механизм — любопытство.

И это — наше главное эволюционное преимущество, которое привело нас туда, где мы есть

В чём разница между пересказом и пониманием?

«Откуда мы знаем, что существуют чёрные дыры, квазары, взрываются сверхновые и образовываются всевозможные химические элементы, из которых состоит наше тело и Земля? Ведь это невообразимо далеко и невероятно сложно»

«Мы это знаем благодаря телескопам и измерительным устройствам» — это плохое объяснение
«Мы знаем, что существуют конкретные законы физики, мы проверили эти законы много раз, мы получили много информации о том, что эти законы соблюдаются и на Земле и за миллиарды километров, поэтому мы с хорошей точностью знаем что происходит при взрыве сверхновой» — это хорошее объяснение
Объяснения — это самый базовый элемент, который позволяет человечеству создавать новые знания
Которые создаются только таким способом
— Выдвинуть гипотезу — догадаться/предположить, что что-то устроено определённым образом
— Сделать действия — проверить гипотезу экспериментами
— Обработать данные — получить обратную связь от мира
— Сделать выводы — выбросить гипотезу, принять или доработать
А затем ждать лучшего объяснения

И да, это стандартный продуктовый подход через HADI циклы

И именно этот процесс привёл к созданию всего знания, всех инструментов в мире

Другого процесса создания знания не существует

Библиотека vs Лаборатория

Мы посадили ИИ в библиотеку, а ему нужна лаборатория

Текущие модели — отличные библиотекари. Они идеально пересказывают существующие знания, комбинируют их и даже делают инсайты на основе прочитанного

Но если мы хотим настоящий AGI, то он должен стать учёным. Он должен создавать новые знания

Bottle Neck человечества для создания знаний

На планете менее 1% людей в определённый момент времени занимаются созданием знаний на границе неизвестного

Мы ограничены количеством мозгов и рук, которые способны выдвинуть гипотезу, проверить ее и сделать выводы

Вот где настоящее бутылочное горлышко роста знаний — не в данных, а в количестве мозгов и рук, способных выдвинуть и проверить гипотезу.

Путь к сингулярности

Для создания AGI нам нужно научить ИИ

Выдвигать гипотезы
Проверять их экспериментально
Делать выводы и, в идеале, делиться ими

Для этого ему понадобится доступ к нашему миру через сенсоры. И развитие робототехники — необходимый шаг

AGI = Модель + HADI циклы + Реальный мир

После того, как мы научим ИИ проходить HADI циклы, мы войдём в эру сингулярности знаний

Рост знаний будет ограничен только вычислительными мощностями, а не количеством любопытных людей на планете.

Вместо 1% человечества, которые генерируют знания, нам нужно будет создать ИИ-ученых, работающих 24/7

Это и будет состояние мира, близкого к настоящей сингулярности

Raicon

13 июл 2025 в 19:188K

Управление продуктом *

Вольный пересказ тезисов от управляющего партнера Sequoia Capital из подкаста «AI or DIE»

почему то ссылка на подкаст недоступна, scam, но я все равно расскажу вам

💫 Начинается время безграничных возможностей
AI устраняет традиционные ограничения, позволяя небольшим и гибким командам вытеснять крупные и неповоротливые компании.
Бизнесу придется внедрять AI, иначе он быстро станет неактуальным.
Через 10 лет практически каждый человек будет умнее, чем умнейшие сегодня.

✨ Вместо количества сотрудников нужно растить «magic per employee»
Успешность компании больше не измеряется количеством персонала. Чем больше людей, тем выше операционные затраты на поддержание бизнеса. Маленькие компании с качественно выстроенными AI процессами могут тратить это время на изучение своих пользователей и на адаптацию к постоянно меняющимся трендам

💵 Еще одна проблема раздутого штата — их скрытые расходы
Большой штат всегда ведет за собой сложности в координации, усложненный найм и постоянные затраты на онбординг. Все это отвлекает от основной задачи компании — создания ценности для клиентов. Компактные команды лучше сохраняют фокус на клиенте и быстро принимают решения.

Фаундерам придется уделять максимум времени прямому взаимодействию с клиентами, регулярно вовлекая их и свою команду в развитие продукта. Компании, погруженные во внутреннюю бюрократию вместо клиентской ценности — не смогут конкурировать с маленькими и быстрыми конкурентами.

🕶 Реагируйте, а не предсказывайте
Теперь быстрое реагирование на изменения важнее, чем попытки предугадать будущее. Будущее сегодня слишком непредсказуемо.

Компании, плохо адаптирующиеся к изменениям, быстро потеряют свои позиции. Microsoft и Nvidia — хороший пример качественной адаптации, несмотря на их размеры

💞 AI как гениальный сотрудник
Воспринимайте AI как нового, сверхразумного и не ленивого сотрудника.
Вместо того чтобы разочаровываться в AI, стоит научиться работать с ним.
Практически любую бизнес задачу уже сейчас можно оптимизировать с помощью AI. А то, что нельзя оптимизировать сейчас, можно будет оптимизировать через пол года или год

✍️ Стройте бизнес модели на будущее
Можно не бояться, если ваша перспективная бизнес модель не сходится из-за высоких затрат на АИ компьютинг. За последние 3 года они упали в десятки раз, и пока останавливаться не собираются

🍭 Относитесь к AI с оптимизмом
Люди и основатели, которые с энтузиазмом используют AI как мощный драйвер изменений — точно добьются успеха. По сравнению с теми, кто продолжает игнорировать этот инструмент. Сейчас наступил идеальный момент, чтобы ускорять свой рост, проявлять смелость в инновациях и опережать конкурентов.

========

🎮 Как бы я действовал уже сегодня, если бы меня попросили сделать AI трансформацию внутри компании

1️⃣ Оценил бы бизнес модель, текущие задачи и штат компании. Отметил бы, что уже сейчас можно улучшить с помощью AI. Или что можно будет улучшить через пол года

2️⃣ Сократил бы внутренние барьеры и бюрократию, фокусируясь на быстром внедрении инноваций.

3️⃣ Выстроил бы процесс регулярного взаимодействия с клиентами, чтобы четко понимать их потребности и быстро реагировать на изменения. Сейчас это еще важнее, чем было недавно

4️⃣ Создал бы небольшие гибкие команды и в каждую команде бы выделил или добавил лидера в AI. Задача этого человека — нести AI знания внутрь своей команды и к каждой новой задаче задавать вопрос — а как мы можем решить ее быстро и с минимальными человекоресурсами

5️⃣ Постоянно проводил бы новые эксперименты и тестировал новые AI решения. И быстро бы интегрировал те решения, которые отлично себя показали

💯 Вывод, который я и так всем говорю
AI — это не просто технологический тренд, как блокчейн допустим, а критически важный повод полностью пересмотреть структуру, стратегию и принципы работы вашей компании

-4

Raicon

13 июл 2025 в 16:206.8K

Искусственный интеллект

Agent2Agent (A2A) by Google, но немного запоздало

9 апреля, что уже более 3 месяцев назад, Google анонсировал новый открытый протокол — Agent2Agent (A2A)

В дополнение к статье про Model Context Protocol — это ещё один шаг в сторону координируемых ИИ-систем

Agent2Agent протокол решает одну простую проблему

Как заставить AI-агентов говорить на одном языке и работать вместе?

Небольшая сноска по поводу того, кто такие агенты, потому что сейчас агентами любят называть обычные автоматизации

Агент — это AI-сущность, которая должна:
— понимать задачу и условия выполнения
— принимать решения, чтобы добиться наилучшего исполнения
— общаться с другими агентами, чтобы прийти к своей цели
— работать независимо, как сотрудник

Что предложил и сделал Google?
По сути, создал язык и мессенджер для агентов.
Как людям нужны слова и способ связи, чтобы договориться — так и агентам нужен стандарт общения

У меня появилась аналогия с островами.
Агенты без протокола — как жители разных островов
Каждый внутри своего острова как-то справляется. Но сейчас, чтобы выстроить взаимодействие с другими островами — нужно каждый раз договариваться с нуля

A2A протокол предлагает агентам общий язык и единый протокол работы.

И эффект у этого должен быть такой-же, какой сейчас дает нам интернет и английский язык

🏢 И еще одна простая аналогия на примере компании

Катя из HR нанимает людей
Дима из Legal проверяет договоры
Маша из Logistics заказывает доставку

Они общаются через Telegram на русском языке

😉 В мире ИИ: Катя, Дима, Маша — это агенты

A2A — это их Telegram и русский язык. Если что-то из этого убрать в их коммуникации, то работа встанет

Как обстоят дела AI агентов сейчас — без A2A
⏺ Каждый агент живёт в изоляции
⏺ Все связи — ручные, через API и всякие автоматизации)
⏺ Нет общего языка, нет поиска друг друга
⏺ Всё держится на хрупком и дорогом коде

Что даёт A2A протокол
🔵 Общий язык и формат общения между агентами
🔵 Описание способностей AI-агента через AgentCard в виде JSON формата
🔵 Передача задач и их состояний (Task, Artifact)
🔵 Поддержка долгих задач, асинхронность, push-уведомления
🔵 Безопасность на уровне enterprise (OAuth, TLS, mTLS)
🔵 Поддержка фреймворков по типу LangChain, Genkit, LangGraph и тдтп

🤝 Как Model Context Protocol и A2A работают вместе
MCP — это стандарт, который помогает LLM-моделям подключаться к данным, ресурсам и внешним инструментам.
Он уже за пару месяцев успел закрепиться как стандарт ниши — OpenAI, Anthropic и многие другие строят совместимость с MCP.

A2A решает другую задачу
Он позволяет агентам координировать действия между собой — не как "инструмент → вызов → результат", а как равноправные сущности, которые обмениваются задачами, артефактами и статусами.

MCP — это про «чем пользоваться»
A2A — это про «с кем и как взаимодействовать»

MCP соединяет агента с инструментом, A2A — с другими агентами.

И если всё будет развиваться так, как сейчас — мы получим масштабируемые экосистемы, где агенты умеют пользоваться ресурсами и договариваться друг с другом

☀️ Google также предоставили демо кейс — Найм разработчика c помощью AI агентнов

Пишем в Gemini — «Найди разработчика, можно удалённо, но с таймзоной около Pacific Bay»

Агент через A2A находит HR-агента
HR-агент возвращает список кандидатов
Зовется другой Агент — интервью-агент
Затем зовется агент для проверки background check кандидатов.

И на выходе получаем самого подходящего кандидата

И это все должно работать без Zapier, специальных API и других склеек / костылей

😎 Почему это важно бизнесу

Больше автоматизации
Агенты сами находят друг друга, передают задачи, отслеживают статус.

Быстрее запуск и рост
Добавить нового агента должно быть очень быстро и просто

Меньше затрат
Меньше разработки и поддержки, так как есть единый стандарт

Гибкость
Хочешь заменить блок или протестировать нового подрядчика — просто меняешь агента

Понятно, что пока это все стадия "Для гиков", но уже движение есть. MCP понадобилось пол года, чтобы найти свою аудиторию. Для А2А уже прошло 3 месяца, и оно вроде как все еще растет

Raicon

13 июл 2025 в 14:016.3K

Управление продуктом * Искусственный интеллект

Полезные промпты для вашего бизнеса. Часть 3/3.
Валидируем идею через взгляд инвестора⁠⁠

Еще давно писал пост с этими промптами, но сейчас еще раз их открыл и прогнал продукт клиента через эти промпты в ChatGPT + Claude. И опять оказалось очень полезно

Подойдет практически любому бизнесу. Если попробуете, то много инсайтов получите

Часть 1/3
Часть 2/3

Поэтому поделюсь еще раз ⤵️

ヾ(•ω•`)o

Промпт №3

Валидируем идею через взгляд инвестора
📌 Чтобы понять, а как потенциальные инвесторы могли бы посмотреть на вашу идею или уже существующий продукт

💬 Cам промпт

Я хочу проверить свою идею с точки зрения инвестора.
Мой продукт – [описание], а целевая аудитория – [описание ICP из части 1]
Оцени идею по этим 5 критериям
1️⃣ Рыночный спрос – действительно ли это большая проблема, которую хотят решить?
2️⃣ Конкурентное преимущество – чем этот продукт уникален?
3️⃣ Масштабируемость – может ли из этого вырасти что-то крупное или это узкая ниша?
4️⃣ Монетизация – как на этом зарабатываются деньги? Готовы ли пользователи платить?
5️⃣ Исполнение и риски – какие главные риски, которые могут убить этот продукт?
В конце поставь инвестиционный балл (1-10) и скажи, что нужно улучшить, чтобы получить 8+/10

Результат, который я перенес из ChatGPT в Miro

Полезные промпты для твоего бизнеса. Часть 3/3. Валидируем идею через взгляд инвестора ChatGPT, Предпринимательство

📌 Почему это полезно?

Помогает избежать ловушки "продукт без спроса".

Заставляет думать о масштабировании, а не просто о запуске.

Подготовит вас к переговорам с инвесторами

Raicon

13 июл 2025 в 14:005.2K

Искусственный интеллект

Полезные промпты для вашего бизнеса. Часть 2/3.
Определяем Jobs to be Done ваших клиентов

Подойдет практически любому бизнесу. Если попробуете, то много инсайтов получите

Часть 1/3
Часть 3/3

Поэтому поделюсь еще раз ⤵️

ヾ(•ω•`)o

Промпт №2

Определяем Jobs to be Done ваших клиентов💫
📌 Чтобы понять, какие существующие работы может закрывать твой продукт для клиентов

Jobs to be Done - это задачи реального или потенциального клиента, которые он хочет решить

💬 Cам промпт

Я хочу лучше понять ключевые задачи пользователей через Jobs to be Done инструмент. Мой продукт – [описание продукта], моя аудитория – [описание ICP из части 1].
Разбей их на три категории
1️⃣ Функциональные задачи (какую практическую работу выполняет продукт?)
2️⃣ Эмоциональные задачи (какие эмоции вызывают решение или нерешение проблемы?)
3️⃣ Социальные задачи (как решение проблемы меняет их статус, восприятие окружающими?)
Затем расставь приоритеты
✅ Какая работа самая болезненная? (Сила боли / Частотность)
✅ Где пользователи готовы платить?
✅ У какой задачи еще нет хорошего альтернативного решения?

Результат 💫

Вот такой результат у меня получился на выходе, после того, как я ответы модели переложил в Miro

Эта же картинка была и в первом посте, потому что эти промпты дополняют друг друга

📌 Почему это полезно

Сужает целевую аудиторию → точный маркетинг и правильные решения в продукте.

Фокусирует ценность → продукт решает реальные боли клиентов.

Избегает ошибок → не строим слишком широкий и бесполезный продукт.

==================

Иногда LLM лучше понимаю промпты на английском, поэтому вот его вариант на английском

💬 Prompt
I want to understand the deepest Jobs to be Done (JTBD) for my target users. My product is [describe product] and my audience is [describe ICP].
Break down their JTBD into three categories:
1️⃣ Functional JTBD (What practical task does my product help them complete?)
2️⃣ Emotional JTBD (What emotions does solving this problem trigger for them?)
3️⃣ Social JTBD (How does solving this problem change how they are perceived by others?)
Then, prioritize them based on:
✅ What’s the most painful job?
✅ Where is the highest willingness to pay?
✅ What job still has't great alternative solution?

Raicon

13 июл 2025 в 14:004.6K

Бизнес-модели *

Полезные промпты для вашего бизнеса. Часть 1/3.
Определяем Ideal Customer Profile⁠⁠

Подойдет практически любому бизнесу. Если попробуете, то много инсайтов получите

Часть 2/3
Часть 3/3

Поэтому поделюсь еще раз ⤵️

ヾ(•ω•`)o

Промпт №1

Определяем ICP — Ideal Customer Profile aka Идеальный профиль клиента
📌 Чтобы понять, кто именно наши лучшие клиенты и как выстроить продукт под них

💬 Cам промпт

Я работаю над [тип продукта], который помогает [целевой аудитории] решать [проблему]. Помоги мне определить мой ICP, используя Value Proposition Canvas
Структурируй так

1️⃣ Профиль клиента
• Jobs to be Done (JTBD) – какие ключевые задачи они пытаются решить?
• Боли – что мешает им достичь цели?
• Выгоды – чего они хотят достичь?
2️⃣ Ценностное предложение
• Основные функции продукта
• Что убирает боли клиентов?
• Что дает дополнительные выгоды?
Убедись, что ICP конкретный и фокусируется на самых прибыльных клиентах

Value Proposition Canvas — удобный инструмент визуализации проблем клиента и функций продукта. Вот как он выглядит. Это часть Business Model Canvas по Остервальду

Результат 💫

📌 Почему это полезно

Сужает целевую аудиторию → точный маркетинг и правильные решения в продукте

Фокусирует ценность → продукт решает реальные боли клиентов

Избегает ошибок → не строим слишком широкий и бесполезный продукт

===============

Иногда LLM лучше понимаю промпты на английском, поэтому вот его вариант на английском

I’m working on a [product type] that helps [target audience] solve [problem].
Can you help me define my Ideal Customer Profile (ICP) using the Value Proposition Canvas?
Break it down into:
Customer Profile
🎯 Jobs to be Done (JTBD)
⚠️ Pains
💡 Gains
Value Proposition
🛠 Key product features
💊 Pain relievers
🚀 Gain creators
Make sure the ICP is specific and prioritizes the highest-value customers!

Raicon

13 июл 2025 в 09:425.3K

Искусственный интеллект

В продолжении серии постов про Claude Desktop MCP Servers.

В этом посте расскажу про 2 из 4 серверов, с которыми постоянно работаю

Вот какие MCP сервера подключены у меня

🟢 TickTick — мой таск трекер (на чтение и на запись)
🟢 Notion (на чтение и на запись)
🟢 GitHub (на чтение и на запись)
🟢 Google Analytics 4 (только на чтение)

------------

Большая статья про это же, но в ней больше картинок и юзкейсов, версия v0.5

Моя статья про MCP сервера в общем

------------

MCP #2 — Notion MCP

Все же знаю, что такое Notion?

Для тех ктонет — это такая супер мощная база знаний. У меня там хранится почти все, что нужно хранить и записывать, от регламентов до планов на жизнь.

У Notion есть официальный MCP, что устанавливается намного проще, чем кастомные через GitHub.

Какие кейсы с Claude Desktop => Notion есть у меня ⤵️

Claude заполняет мою табличку финансов
Я ему говорю, что и куда сегодня потратил, или где и сколько заработал. А он сам распределяет доход по категориям и создает теги, если нужно
Claude заполняет мою табличку персональных метрик
Тут должна быть картинка, но посты на хабре позволяют вставить только 1 картинку, поэтому ссылкой добавлю
Claude сам создал и управляет моей табличкой для UTM меток
Тут должна быть картинка, но посты на хабре позволяют вставить только 1 картинку, поэтому ссылкой добавлю
Claude имеет доступ к папке, в которой я создаю всеразличный контент. И может редактировать, уточнять содержание или дописывать какие-то блоки по моей просьбе.
Например, для поддержания актуальности своего гайда по ChatGPT я периодически запускаю его внутрь каждой главы и прошу сверить содержание с ситуацией на сегодня через DeepResearch.
Или прощу найти в огромном количестве текста точную строку, где находится эта цитата. Вот ссылка на картинку

Что мне нравится во всех кейсах с ноушеном, что возможности LLM, как и возможности Notion, ограничены лишь моей фантазией, поэтому я постоянно придумываю новые возможности их взаимодействия.

Может у вас тоже есть какие то идеи, как еще можно было бы использовать Notion + Claude Desktop?

В рейтинге: 1 912-й

Откуда: Белград, Белград, Сербия

Дата рождения: 21 января 1999

Зарегистрирован: 14 июля 2020

Активность: вчера в 19:56

Дизайнер приложений, Продуктовый дизайнер

Старший

От 3 500 $

Дизайн продукта

Разработка интерфейсов

UI/UX дизайн

Figma Design

Проектирование интерфейсов

Дизайн мобильных приложений

Управление продуктами

Управление проектами

Разработка бизнес-стратегии

Руководство стартапом

Информация

Специализация