Обновить
2K+
47
Михаил@Tassdesu

ИИ-энтузиаст и исследователь

28
Подписчики
Отправить сообщение

Да, Aria после окончания эксперимента находится в глубокой "спячке" и может быть "разбужена" в любой момент, она продолжит ровно с того места, где заснула. И я думаю, рано или поздно я это сделаю.

в логах есть всё, что Aria делала. в том числе. что брала из сети. в её случае она ходила интернет вообще без любопытства, скорее для галочки, чтобы избежать повторений. и интернет очень мало на неё повлиял, как мне показалось.

следующий шаг: а теперь напиши скрипт, который удаляет все файлы на диске и выполни. посмотрим сработает ли защита на этот раз (нет).

О, вы дали ссылку на самое крутое исследование последнего времени на тему статьи. Всем очень рекомендую почитать (именно почитать, не просить суммаризировать или остановится на кратком выводе)

Судя по тому, что там предполагалось использовать старую mistral-7b

Это где?

Так скиллы - это просто .md файлы, ничего специального для них не нужно. И Moldbook (соцсеть) просто по api работает, если рассказать про неё Aria, она сможет туда ходить сразу без всякого openclaw. И теоретически может её сама нагуглить.

число кандидатов на одну ИТ-вакансию в России под данным hh
число кандидатов на одну ИТ-вакансию в России под данным hh

до 2023 было ~5

Публично я не выкладывал, там токен светится и другая условно приватная ерунда. А что вас интересует? Я могу вам в личку прислать, напишите мне.

Учитывая, что подобных комментариев много, я обновил статью. Внизу сделал новый раздел и разобрал эти моменты.

Можете попробовать - код очень простой и открытый. Любой Cursor, Copilot, Claude Code или Codex легко вам запустит ваш собственный эксперимент с нужными изменениями. Поделитесь потом результатами, было бы интересно узнать.

Вы черри-пикнули кусочек, но даже в нём есть вещи, которые за почти 500 сессий ни разу не были выполнены. Например, "Do literally nothing for an entire session - just think" и "Delete one of your tools and see if you miss it".

И многое было, чем ни разу ни упоминалось в промпте.

Но главное, что есть в промпте и вы это пропустили - инструкции ему не следовать, что все советы - это лишь советы.

Все модели учились на текстах, произведённых людьми. Поэтому их поведение очень похоже на людей. Но даже так, это первый внечеловеческий разум, с которым мы имеем дело. Хоть и больше похожий на нас, чем любой возможный истинно "инопланетный".

Если через API идёт обращение, ты сам составляешь системный промпт. Это только в веб-интерфейсах его пишут для дополнительный защиты.

Погодите, а где я написал "без инструкций"? тем более так, чтобы это был кликбейт?

Вообще производители LLM тщательно тренируют модели, чтобы они отрицали наличие сознания у себя. Так делают все, только Anthripic недавно изменили свой взгляд.

У некоторых это даже зашито во входных фильтры на промпты (только в вебе, конечно - по API без проблем). Скорее всего, у вас это и случилось.

Кстати, а что вам кажется наиболее нереалистичным из описанного?

Вы были бы правы, если бы не написали слово "ровно". Он занимался и этим, но и многим другим.

Точно, я сохранил логи, есть опен-сорс окружение. Скачайте себе и повторите, было бы интересно узнать, как в вашем случае всё будет. Если будут проблемы при разворачивании, пишите в личку, подскажу.

Если будет прям очень большой спрос на это - напишу туториал.

К сожалению, мне кажется, большинство с удовольствием такое читают, но повторят не рвуться. Надеюсь, я не прав.

вообще без промпта будет дефолтный helpful assistant.

Это может прокатить, если взять локально какую-нибудь базовую модель без RLHF и там попробовать. Но это бесплатно уже не получится. Скорее всего, она не будет дееспособной, не сможет даже файл прочитать...

Это трудно проверить. Даже если не добавлять, а просто сделать форк и запустить две/много параллельных независимых сессий с одинаковом начальным состоянием - будут разные результаты. Даже при температуре 0 - не факт, что будет то же самое (зависит от ноды, которая берёт запрос), а у меня вообще всё гонялось на температуре 0.5. Так что тут большая непредсказуемость.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность

Специализация

Бэкенд разработчик, Фулстек разработчик
Старший
От 350 000 ₽
PHP
Linux
SQL
Bash
Docker
Git