Comments 3
Вот я как раз хотел научиться работать с браузером, чтобы управлять с помощью AI.
В этой статье вроде бы как раз об этом и говорится. Но нет ничего про модель: какая модель управляет этими инструментами? Где она выбирается? Где UI для этого чтобы прописывать задачи?
Вот бы какой-нибудь более полный туториал для этого дела увидеть.
В этом и прелесть подхода! Первой командой устанавливается cli тул, который можно использовать из терминала. Второй добавляется скилл для кодинговых агентов, который объясняет им, как пользоваться этим тулом. И все — любой ваш агент (Claude Code, Codex, Cursor, Gemini CLI, OpenCode и т.д.) начинают пользоваться им автоматически.
А задачи уже прописываете там, где вы работаете с вашим агентом.
Интересно, как это можно прикрутить к lm studio. Статья интересная, спасибо
Как дать AI‑агенту не лом, а ключ от браузера: разбираем agent‑browser от Vercel