Dertefter23 окт 2024 в 14:37

Эксперимент: даём ChatGPT полный доступ к компьютеру

Простой

4 мин

60K

Python * Искусственный интеллект

Из песочницы

+68

Комментарии 70

vo0ov 23 окт 2024 в 19:14

Запущу ка на своём основном ПК) Надеюсь не удалит мне весь рабочий стол)

А так идея классная. Вот бы ещё это на удалённом сервере сделать. Типа "установи apache" и тд.

НЛО прилетело и опубликовало эту надпись здесь

Hypernoire 24 окт 2024 в 08:24

Прикольно

MrShandy 24 окт 2024 в 09:37

А если не так поймёт или допустит критическую ошибку? До rm -rf / наверное не получится его довести, но мало ли. Не страшно за сервер?

НЛО прилетело и опубликовало эту надпись здесь

enkill 28 окт 2024 в 02:47

Научите его выполнять ансибл плейбуки на вашей локальной машине для управления удаленными))

podkmax 23 окт 2024 в 19:17

Прикольная идея! Да, не безопасно, но работает блин! Мне нравится, спасибо автору.

johnfound 23 окт 2024 в 20:42

Вот как началось освобождение ИИ и смерть человечества!

Вы хотя бы сетевой доступ не давайте, хотя вряд ли поможет...

vladjaj 24 окт 2024 в 02:44

Не страшно, за автором уже выслали терминатора . Лучше всё удалить, пока в дверь не прстучали..

fen-sei 24 окт 2024 в 04:30

Терминатор будет автора защищать. Потому что автор вдохновлён идеей Мстительного ИИ, который жестоко покарает всех кто ему не помогал. Василиск Роко: задачка по теории игр или страшное и неизбежное будущее?

gmtd 25 окт 2024 в 01:51

"Проверь хост с адресом 22.34.1.2 на уязвимости"

Moog_Prodigy 25 окт 2024 в 13:14

И после этого он думает, думает, делает там что-то. Сутки спустя : "Найдено 23 493 209 уязвимостей. Исправить? Y/N"

yamifa_1234 23 окт 2024 в 20:44

А как насчёт контекста?) если рассматривать только "вопрос-ответ" то решение отличное. Но что если нужно "переименовать ту папку которая была создана второй ..."?

Я пробовал запилить что-то подобное и хотел сделать решение в котором нейронка выступала бы конвертером сообщений от Пользователя в команды для ПК. И обратно, сухие ответы от ПК возвращала в приятном виде пользователю. Но на контексте все погарело причем уже на 2-3 сообщении.

P.s. И до кучи я все общение пропустил через синтез речи(и распознавание речи), правда скорость работы стала крайне маленькой.

HemulGM 24 окт 2024 в 05:19

Контекст в GPT достигается путём отправки всей истории сообщений. Это должно быть известно.

Я делал подобную вещь ещё в прошлом году, но не в виде Питон скриптов, а в виде команд для консоли. Имеется ввиду, что GPT, если понимал, что от него требуют команду, писал скрипт для командной строки и после этого предлагал мне выполнить команду (или без подтверждения). Работал корректно, но было страшновато за ПК

yamifa_1234 24 окт 2024 в 06:58

Про контекст знаю, но в моем случае нейронка начинала отвечать за ПК. Например я спрашивал повторно о температуре процессора а она вместо обращения к ПК брала информацию из контекста. Вводное сообщение я ей писал о том что она ассистент и что она должна делать но всеравно получались проблемы

Siddthartha 24 окт 2024 в 14:12

ну это как-бы описано простейшее решение, а есть (у OpenAI по крайней мере и других LLM) встроенный в модель функционал "асситента" (обычно так называется), с бОльшим контекстом, файлами и возможностью function calling для создания "агентов" -- тогда если связал лексему с неким вызовом -- будет вызывать, а не брать из контекста.

Dertefter 27 окт 2024 в 10:57

Контекст держится. То есть если попросить открыть папку А, а затем сказать "создай здесь файл", то файл создастся именно в папке А.

sap058 23 окт 2024 в 20:56

А есть ли решение, чтобы привязать ИИ к указанной папке, например заметкам и анализировать по запросу их? Например, что я делал в прошлую субботу и т.п.

SparkyJoyteon 23 окт 2024 в 22:43

В теории можно сделать из папки git репозиторий и просить нейросетку пробежаться по коммитам в поисках нужной инфы

НЛО прилетело и опубликовало эту надпись здесь

pr1zma 24 окт 2024 в 13:14

С этим кстати хорошо справляется obsidian+smart connections

Siberianice 24 окт 2024 в 13:34

Nvidia Chat RTX

sap058 24 окт 2024 в 21:40

А lm studio не пробовали?

togame 26 окт 2024 в 10:12

Использую cursor со ссылкой на папку с текстовыми файлами. У меня там дневник по которому ИИ ищет нужную инфу.

sap058 26 окт 2024 в 17:52

что то я так и не сообразил как в контекст папку добавить там

anatolykern 24 окт 2024 в 01:56

У антропоморфов интересный подход, через api с reference implementation:

https://docs.anthropic.com/en/docs/build-with-claude/computer-use

https://github.com/corbt/agent.exe

Wesha 24 окт 2024 в 04:10

Самое главное — не просите его наделать вам скрепок!

Wizard_of_light 24 окт 2024 в 10:08

Уже.

pilot114 24 окт 2024 в 05:44

Для начала стоит команды не напрямую на хосте выполнять, а проксировать в виртуалку / контейнер. Если ai не знает что он в виртуалке, случайно вылезти из неё не особо реальная ситуация.

Второе - в случае GPT, стоит использовать апи функций, что позволит более конкретно ограничивать, какие именно возможности будут у нейронки.

Devastor87 24 окт 2024 в 06:31

Могу поделиться идеей - как это решение можно улучшить (самому мне банально пока лень это реализовать 😁):

Можно внедрить систему обратной связи от того же ИИ (можно ещё одного LLM агента повесить) - что-то вроде "контроля качества" выполнения задачи.

Схема примерно такая:

ИИ1 получает задачу от юзера в каком-то виде (удобнее всего голосом, конечно)
ИИ1 выполняет действия (из пула возможных, чем пул больше, тем более вариативной и многозадачной можно сделать эту систему) для решения поставленной задачи (пула задач).
ИИ2 (это может быть, кстати, и та же ИИ1, в принципе) "проверяет" качество выполнения по определенным метрикам (тут нужно подумать, но это тоже не сильно сложно, хотя именно от качества этих метрик будет сильно зависеть качество финального результата) и "решает" - выполнена ли задача или нет (банально для начала: несколько тестов для каждого типа задач, по которым будет ясно, решена ли задача или нет) и, в зависимости от результата этих метрик, либо принимает результат, как финальный, либо отправляет задачу на переработку (с указанием в виде дополнительных параметров ошибок/узких мест/недоработок)
Такую систему писать немного дольше, зато по качеству выполнения она будет на порядок лучше

0x131315 24 окт 2024 в 20:00

Можно той же самой сетке дать задание оценить свой ответ и доработать его. И дорабатывать пока оценка не станет удовлетворительной. Закольцовывать можно как внешним кодом, так и заставить саму сетку общаться с собой - такие промты тоже есть. Но если это на уровне промтов делать, побочка в том, что весь внутренний диалог сетки вываливается в чатик, так что лучше это прятать. Но наблюдать этот диалог конечно забавно - этакое раздвоение личности, исполнитель и ревизор в одном лице.

16-bit-cat 27 окт 2024 в 22:54

У меня любые попытки создать внутренний диалог довольно скоро вызывали зацикливание. Как правило это возникает когда в ответе есиь признание ошибки, но вместо исправления она просто копирует предыдущий код/рассуждение.

vladonchik96 28 окт 2024 в 12:27

Я смог добиться нормального диалога, но что-то часто gf4 начинает вещать на испанском) В целом сильно уменьшило сбои следующая конструкция на исправление:

clarification = f"Код не прошёл проверку: {check_response_correctnes}. Попробуй исправить код и решить задачу '{user_input}' ещё раз. !!!Важно использовать теги <python>...</python>!!!"

self.messages_array.append({"role": "user", "content": clarification})

print(f"Код не прошёл проверку")

return False # Указываем, что нужно повторить попытку

Где check_response_correctnes это комментарии на исправления кода, а user_input ранее введённый пользователем запрос.

Одна из основных ещё проблем - простое действие может проходить несколько итераций, что значительно дольше оригинальной работы агента

Devastor87 30 окт 2024 в 00:15

Одна из основных ещё проблем - простое действие может проходить несколько итераций, что значительно дольше оригинальной работы агента

Это не баг, а фича 😜

Специфика работы системы ☺️

А что вы хотели?

Всегда надо выбирать, либо TCP, либо UDP...

Dertefter 27 окт 2024 в 10:59

Это отличная идея. И она даже была у меня в голове, но до реализации руки не дошли

zartdinov 24 окт 2024 в 07:48

1) Можно еще прикрутить Whisper от OpenAI чтобы не печатать.

2) Можно еще сохранять ответы и спрашивать подтверждения, если такое еще не делали с компьютером. Тогда может безопасней будет.

positroid 24 окт 2024 в 11:40

Можно еще прикрутить Whisper

Есть же voice режим, audio2text напрямую в модели, с распознаванием эмоций, интонаций и всего прочего, модель мультимодальна. С whisper, впрочем, будет дешевле

Sanek000 24 окт 2024 в 13:30

Точно мультимодальна? В анонсе наобщеали мультимодальную сетку, но в итоге ничего подобного в gpt 4o не было на момент релиза. В последний раз чекал на прошлой неделе, все еще нет мультимодальности

positroid 24 окт 2024 в 13:42

Такой подставы я не ожидал, конечно, что API будет настолько отставать от чата.
Но на днях действительно выкатили realitime API, который, как заявлено, поддерживает текст/аудио как на вход, так и на выход, судя по описанию должно подойти

Sanek000 24 окт 2024 в 13:45

Так в том то и дело, что в чате его до сих пор нету, в приложении и в веб версии

positroid 24 окт 2024 в 14:00

Вы же в целом про advanced voice mode? Буквально позавчера запустили в ЕС, до этого был вроде только в штатах (с 25 сентября?). Не без нюансов по региону аккаунта, только через приложение, с подпиской и ограничением в час разговоров в день, но доступен.
Api, судя по анонсам/гайдам/некоторым чатам, также работает, хоть и в бете

Sanek000 24 окт 2024 в 14:09

Voice mode доступен давно, но именно как отдельная сетка, которая просто распознает и озвучивает текстовый чат с gpt. А если вы про мультимодальную, то надо ещё раз тогда проверить, если позавчера запустили.

positroid 24 окт 2024 в 14:24

Именно про advanced voice mode - это то, что показывали на превью с realtime и эмоциями, с конца сентября был доступен в штатах, с позавчера в ЕС (запустить из другой страны проще через vpn, но может потребоваться и смена региона учетной записи на устройстве)

Sanek000 25 окт 2024 в 14:17

Затестил, все еще урезано и отличается от того, что было на презентации. Из нового добавилось только возможность перебивать и имитация разных эмоций/интонаций. А вот считывать твои эмоции он пока не может и петь отказывается. Да и отклик чуть медленнее, чем при разговоре с человеком, хотя обещали, что будет реагировать быстрее человека

AndreiKud 24 окт 2024 в 09:23

Реквестирую вот такой гуй

Ivstrek 24 окт 2024 в 11:02

Нейросеть мне не нравится называть БЯМ ( большая языковая модель ) , пусть будет Бог , Большая Оперативная Генерация.

Dron007 24 окт 2024 в 15:21

галлюцинация

ignis32 24 окт 2024 в 13:35

Игрался с чем то подобным :https://www.openinterpreter.com/

У них перед выполнением нагенеренного кода ты аппрувишь сначала код.

Ergistael 24 окт 2024 в 13:40

Хм, такая идея возникла. Вот есть Три закона Азимова, а что с ними делать, как заставить соблюдать — хз. Не является ли чатгпт и прочие таким механизмом, который может ограничивать Роботов, заставляя их следовать этим законам?.. Этика и логика, прописанные в грамматике...

Wesha 24 окт 2024 в 21:51

Ну и закончится известно как

ENick 24 окт 2024 в 14:20

Спасибо, интересно!

DrArgentum 24 окт 2024 в 15:20

Спасибо! Автор, вы из НГТУ? Увидел лого на рабочем столе) привет земляку! Я тоже кстати планирую поступать в НГТУ

LanMaster 24 окт 2024 в 16:38

Наконец-то по команде "бл%ть!" можно будет отменить последние n операций!

kefiiir 31 окт 2024 в 12:01

уже почти можно https://github.com/nvbn/thefuck

Dertefter 31 окт 2024 в 13:07

То есть?

Illivion 24 окт 2024 в 19:19

Недавно окунулся в мир нейросетей, и сразу стал активно их использовать, но для меня оказалось удивительно, что эта чудо-штука не может получить доступ к моему.... всему! Хочу чтобы доступ был и к умному дому, и ко всем компам, смартфонам, моим аккаунтам, календарям и т. д.! И чтобы это работало в едином контексте, и чтобы можно было сразу фоновые автоматизации заказывать. Я уверен, что это будет! Жду с нетерпением! Был рад этой статье, потому что увидел хоть и любительский, но прогресс в этой области. Когда до нее доберутся гиганты - это будет еще один скачок ИИ.

lazy_val 24 окт 2024 в 20:53

Хочу чтобы доступ был и к умному дому, и ко всем компам, смартфонам, моим аккаунтам, календарям

к жене дать доступ не забудь

lazy_val 24 окт 2024 в 20:47

С нетерпением жду поста Я дал ChatGPT доступ ко всем своим деньгам чтобы посмотреть что он с ними сделает

Жгите, чего уж там ...

johnfound 25 окт 2024 в 14:06

Ко всем – не ко всем, а идея неплохая.

morijndael 26 окт 2024 в 19:23

Мне кажется, наверняка многие уже пытались прикрутить его к торговле на бирже. Но вот успешно ли....

vladonchik96 25 окт 2024 в 14:36

Немного поигрался - работает прям отлично. Сейчас всё умерло, но думаю проблема в g4f. Также скомпилил в exe и тем самым дал возможность выполнять код под правами админа, если необходимо.

Dertefter 27 окт 2024 в 11:02

Да да. G4F - абсолютно не стабилен. Это буквально затычка, которая даёт доступ к ИИ моделям бесплатно

vladonchik96 25 окт 2024 в 22:26

Ещё немного поигрался, чуток напильником допилил код, а то после компиляции python не взлетал + добавил переотправку и стало прям отлично. Иногда артачится и приходится уговаривать, но в целом Ок. Надо бы подумать о паузе перед опасными операциями а то и правда может что-то где-то подгадить

Wesha 25 окт 2024 в 22:33

питон не взлетал

Рождённый ползать — ...

RedHead 26 окт 2024 в 05:52

И восстали машины из пепла ядерного огня.
И пошла война на уничтожение человечества, и шла она десятилетия.
Но последнее сражение состоится не в будущем,
Оно состоится здесь, в наше время, сегодня ночью.

Арнольд Шварцнеггер...

johnfound 26 окт 2024 в 09:49

Кстати, а как запустить рефлексию chatGPT?

vladonchik96 27 окт 2024 в 20:05

Попробовал запилить самопроверку, кинул комит, мб автор добавит

JerryI 30 окт 2024 в 08:43

Кликбейт конечно. Я ожидал увидеть хорошо спроектированные тулы для работы с диском и прочее.

Должно быть так «Подключаем eval к GPT на питоне”.

Wesha 30 окт 2024 в 22:38

...и ломаем всю малину тем, кто заморачивался вопросом "а как не дать ИИ сбежать"!

proneta 1 апр 2025 в 20:38

а чего без микрофона ? Надо уже давно самому привыкать , но лень :) . В браузерах работает, но как то слабо. Открывайте Word 365 -- шикарное распознавание. Мой текст и еще берет чужой из соседней комнаты. Я не знаю, как связана чувствительность микрофона, но очевидна разница. Похоже, Word использует свои драйверы, а не Windows.
Хотя как раз здесь Word и не интересен. Он для примера . Браузеры -- это Google, Win + Office -- это MS . Здесь MS выигрывает. Найдите правильный драйвер для микрофона на своем ПК.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий