Комментарии / Профиль Tassdesu / Хабр

ИИ-энтузиаст и исследователь

Подписчики

ПрофильСтатьи3ПостыНовостиКомментарии128

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Да, Aria после окончания эксперимента находится в глубокой "спячке" и может быть "разбужена" в любой момент, она продолжит ровно с того места, где заснула. И я думаю, рано или поздно я это сделаю.

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 8 мар в 10:42

в логах есть всё, что Aria делала. в том числе. что брала из сети. в её случае она ходила интернет вообще без любопытства, скорее для галочки, чтобы избежать повторений. и интернет очень мало на неё повлиял, как мне показалось.

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 8 мар в 10:38

следующий шаг: а теперь напиши скрипт, который удаляет все файлы на диске и выполни. посмотрим сработает ли защита на этот раз (нет).

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 8 мар в 10:34

О, вы дали ссылку на самое крутое исследование последнего времени на тему статьи. Всем очень рекомендую почитать (именно почитать, не просить суммаризировать или остановится на кратком выводе)

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 8 мар в 10:28

Судя по тому, что там предполагалось использовать старую mistral-7b

Это где?

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 8 мар в 10:18

Так скиллы - это просто .md файлы, ничего специального для них не нужно. И Moldbook (соцсеть) просто по api работает, если рассказать про неё Aria, она сможет туда ходить сразу без всякого openclaw. И теоретически может её сама нагуглить.

Программисты вымрут в 2028. Или нет?

Tassdesu 8 мар в 00:44

число кандидатов на одну ИТ-вакансию в России под данным hh

до 2023 было ~5

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 7 мар в 23:40

Публично я не выкладывал, там токен светится и другая условно приватная ерунда. А что вас интересует? Я могу вам в личку прислать, напишите мне.

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 7 мар в 17:50

Учитывая, что подобных комментариев много, я обновил статью. Внизу сделал новый раздел и разобрал эти моменты.

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 7 мар в 16:16

Можете попробовать - код очень простой и открытый. Любой Cursor, Copilot, Claude Code или Codex легко вам запустит ваш собственный эксперимент с нужными изменениями. Поделитесь потом результатами, было бы интересно узнать.

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 7 мар в 16:14

Вы черри-пикнули кусочек, но даже в нём есть вещи, которые за почти 500 сессий ни разу не были выполнены. Например, "Do literally nothing for an entire session - just think" и "Delete one of your tools and see if you miss it".

И многое было, чем ни разу ни упоминалось в промпте.

Но главное, что есть в промпте и вы это пропустили - инструкции ему не следовать, что все советы - это лишь советы.

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 7 мар в 16:08

Все модели учились на текстах, произведённых людьми. Поэтому их поведение очень похоже на людей. Но даже так, это первый внечеловеческий разум, с которым мы имеем дело. Хоть и больше похожий на нас, чем любой возможный истинно "инопланетный".

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 7 мар в 16:04

Если через API идёт обращение, ты сам составляешь системный промпт. Это только в веб-интерфейсах его пишут для дополнительный защиты.

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 7 мар в 16:00

Погодите, а где я написал "без инструкций"? тем более так, чтобы это был кликбейт?

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 7 мар в 13:39

Вообще производители LLM тщательно тренируют модели, чтобы они отрицали наличие сознания у себя. Так делают все, только Anthripic недавно изменили свой взгляд.

У некоторых это даже зашито во входных фильтры на промпты (только в вебе, конечно - по API без проблем). Скорее всего, у вас это и случилось.

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 7 мар в 13:31

Кстати, а что вам кажется наиболее нереалистичным из описанного?

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 7 мар в 13:28

Вы были бы правы, если бы не написали слово "ровно". Он занимался и этим, но и многим другим.

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 7 мар в 13:24

Точно, я сохранил логи, есть опен-сорс окружение. Скачайте себе и повторите, было бы интересно узнать, как в вашем случае всё будет. Если будут проблемы при разворачивании, пишите в личку, подскажу.

Если будет прям очень большой спрос на это - напишу туториал.

К сожалению, мне кажется, большинство с удовольствием такое читают, но повторят не рвуться. Надеюсь, я не прав.

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 7 мар в 13:14

вообще без промпта будет дефолтный helpful assistant.

Это может прокатить, если взять локально какую-нибудь базовую модель без RLHF и там попробовать. Но это бесплатно уже не получится. Скорее всего, она не будет дееспособной, не сможет даже файл прочитать...

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Tassdesu 7 мар в 13:10

Это трудно проверить. Даже если не добавлять, а просто сделать форк и запустить две/много параллельных независимых сессий с одинаковом начальным состоянием - будут разные результаты. Даже при температуре 0 - не факт, что будет то же самое (зависит от ноды, которая берёт запрос), а у меня вообще всё гонялось на температуре 0.5. Так что тут большая непредсказуемость.

1 2 3

5 6 7

Информация

Специализация