Обновить

Как выжать максимум из подписки Google AI: параллельные агенты и кросс-модельный консенсус

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели6.3K
Всего голосов 2: ↑2 и ↓0+3
Комментарии5

Комментарии 5

ток начал разбираться в агентах, сток вещей ещё непонятно, но эта статья именно то, что я хотел увидеть, прочитать и осознать, спасибо

Рад что зашло! Если будут вопросы по настройке - пишите, помогу разобраться.

после того, что perplexity сделали со своей подпиской pro (наглухо срезали лимиты) захотел найти какое-то решение, которое бы сделало агентский браузер для автосерфинга. посмотрел разные решения, достаточно грустно: такое ощущение, что софт для ии писали вообще не те, кто остальной. какие-то кривые, сырые, странные поделия выложены как релизы. вместе с гемини допиливаем их, плюемся, особенно примечательно, что "сырое" прозвучало со стороны ии, а я такое слово в чате не писал. ну да ладно

из более-менее юзабельного нашел skyvern и поднял его в докере. может есть лучше варианты?

подключал с openrouter разные модели. впечатление противоречивое, вроде что-то работает, вроде даже бесплатное, но надо все шаги описывать подробно (то есть опыт не как с comet браузером). интересно, что сам гемини посоветовал антигравити распотрошить, но это я еще не вникал. у меня какая-то подписка plus, не знаю что, гугл сам дал бонусов при продлении диска

По поводу агентского браузера - мне тоже не нравятся интегрированные решения для работы с браузером. Они часто делают скриншоты, или гоняют повторяющиеся действия через агента - медленно и жрет лимиты.

У меня другой подход к цикличным автоматизациям: задача агента - не заниматься оркестрацией самому, а создавать сценарии. Если автоматизация уперлась в новый интерфейс - агент анализирует его и генерирует скрипт на основе логической цепочки. Дальше этот скрипт работает быстро без агента, пока не столкнется с изменением UI. Когда интерфейс меняется - срабатывает фолбэк, и агент адаптирует автоматизацию. Такое лучше делать через Chrome Extension. Подумываю опубликовать свое решение в опенсорс.

В Antigravity есть встроенный инструмент для работы с браузером - он решает практически любые задачи: клики, навигация, заполнение форм, скриншоты. Но это автоматизированный Chrome, и сайты с антибот-защитой (Cloudflare и подобные) часто ловят такие сессии и блокируют. Для Antigravity нужна подписка AI Pro ($19.99/мес) или Ultra.

Если задача - собирать информацию из открытых источников, а не автоматизировать UI, то есть вариант проще: в Gemini CLI встроен инструмент google_web_search. А в agent-pool теперь есть cron-планировщик (schedule_task). Вешаешь агента на расписание - он сам ресерчит и складывает результаты.

Сейчас делаю новую статью про свежий функционал agent-pool: пайплайны (автоматические цепочки задач) и cron-расписание для агентов. Скоро выложу.

Я бы вообще большинство задач, которые требуют браузера отправлял в puppeteer, через тот-же MCP. На мой взгляд, это гораздо более надежный способ, очень уж много глюков с расширениями и собственными тулзами агентов.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации