Comments 8
while i < max_iterations and agent_running:
просветите плиз что значит в пайтоне "<"
Интересно, что за неудачник в карму плюнул?
много раз думал о подобном инструменте, но всегда приходил к тому, что его будет неудобно использовать, если в комнате рядом с тобой есть хотя бы один человек.
Ты будешь мешать другим, другие будут мешать тебе и так далее.
В общем, кажется, нечто подобное станет востребовано только при появлении мысленного интерфейса.
Но статье плюсик: чем раньше пытаемся применять, тем скорее найдём рабочее решение :)
Интересно будет увидеть локальный запуск OmniParser (изображение => список позиций и описаний элементов) взамен разбивки экрана на квадраты.
Такое, думаю, разумно допиливать под конкретный сервис. Эй, агент, собери мне список объявлений по теме ... на Авито, потом проверил что всё ок и ... напиши им на тему ...
Вот так чтоб полностью ПК управлять и любые сервисы использовать очень сложно. Я пытался одному агенту дать задание: найди объявление Авито на тему ... в 3 любых городах. Минут 10 он бился бился, но ничего не добился. А если заточить под задачи, прописать структуру сайта, чтоб тот знал как удобно пользоваться и только анализировал страницы - вот тут реальная польза будет для тех, кому надо пользоваться сервисом.
Было бы ещё здорово написать сколько ресурсов жрёт подобный "инструмент". Опыт подсказывает, что такая сомнительная хрень отожрёт разом эдак десяток гигов оперативки.
ИИ-агент для управления компьютером: разработка умного помощника на Python