Обновить

n8n AI agent сам выбирает инструмент и передает нужные данные. Почти Джарвис?)

Кажется нащупал архитектурный паттерн, которым хочу поделиться. Он простой, но при этом бесконечно масштабируемый.

Идея такая: у меня есть AI Agent в workflow, к которому подключены "инструменты" (tools). Каждый tool - это отдельный самостоятельный workflow. AI Agent не делает ничего сложного сам. Его единственная задача - понять, что хочет пользователь, выбрать правильный инструмент и вытащить из запроса нужные данные.

Вот что происходит, когда я отправляю голосовое "Встреча с Петром завтра в три на два часа обсудить бюджет":

▪️ Whisper расшифровывает аудио в текст

▪️ AI Agent смотрит на текст и решает: тут есть человек + время - это create_event

▪️ Из текста извлекает: title="Встреча с Петром", date=нужная дата, time=15:00, duration=120, description="обсудить бюджет"

Передаёт это всё в tool-workflow, который уже сам проверяет конфликты в Google Calendar, создаёт событие, задачу в Todoist, и присылает мне красивое сообщение с кнопками

Ключевой момент: каждый tool-workflow описывает, какие параметры ему нужны. AI Agent видит эти описания и сам понимает, что и откуда достать. Agent разбирается сам, ему лишь достаточно хорошего промпта, чтобы работать безупречно и без ошибок.

Получается чёткое разделение: LLM решает ЧТО делать, а workflow - КАК. AI не лезет в API, не считает таймзоны, не ищет свободные слоты в календаре. Он просто МАРШРУТИЗАТОР.

Сейчас мой scheduler умеет создавать события и задачи голосом, искать свободные слоты при конфликтах и предлагать альтернативы, работать с приоритетами и категориями. несколько инструментов, всё через один telegram бот.

Но вот что самое интересное. Scheduler сам по себе - это workflow. А значит, он тоже может быть tool для workflow уровнем выше. Верхнеуровневый AI Agent будет решать, кому передать запрос:

▪️ Scheduler (календарь + задачи)

▪️ Notes (заметки в Notion/Obsidian)

▪️ Search (поиск информации в интернете)

▪️ Home (умный дом)

▪️ Finance (учёт расходов)

И это масштабируется бесконечно. Каждый слой просто маршрутизатор, который решает, кому передать запрос. На нижнем уровне запрос попадает в конкретный workflow и выполняется. Как дерево, где каждый узел маленький специалист.

При этом каждый workflow тестируется и работает независимо. Они просто получают параметры и делают своё дело. Хочешь добавить новый навык - пишешь workflow, подключаешь как tool, описываешь параметры. Всё.

По факту получается персональный ассистент в Telegram. Записал голосовое, а дальше оно само.

Потенциал крайне большой у этого паттерна, буду смотреть как будет по факту. На данный момент все еще прорабатываю sheduler.

Заходи в мой канал телеграм, чтобы не пропустить обновления по этому кейсу. Там не только про нейронки, там в общем о том, чем я занимаюсь, имея бекграунд разработчика.

Теги:
-1
Комментарии0

Публикации