alexey7h1 июн в 19:17

Как мы боремся с галлюцинации AI Master: гибридный Guard на Embedding + LLM Extractor на примере AI-RPG «Стирая Грань»

Средний

6 мин

11K

Искусственный интеллектМашинное обучение * Разработка игр * Программирование * Алгоритмы *

Кейс

Комментарии 11

MichaelBorisov 1 июн в 21:58

Только что провел маленький тест подобного "взлома NPC" на Claude. Бот-охранник сломался довольно быстро, позволив мне взглянуть под ноги и найти там пропуск. А также достать из кармана предмет, которого там не было.

Так что проблема реальная и запущенная. Автору спасибо за ее обозначение и интересные пути решения, которые к тому же экономят ресурсы большой LLM.

А что у вас за игра? Где можно посмотреть?

alexey7h 1 июн в 22:16

Спасибо, пока приложение работает на deepseek v4 flash, и уже получается довольно неплохо, если Claude модель будет конечно интереснее, но пока не в бюджете к сожалению)

Потестить можно по кнопке Играть на сайте https://beyondtheverge.online/?lang=ru

Так же присоединяйтесь в группу ТГ https://t.me/beyond_the_verge, выкладываю туда апдейты и собираю ОС для развития!

MichaelBorisov 3 июн в 18:35

Спасибо. Попробовал. Действительно, уйма галлюцинаций. Но мне не совсем понятны статистики героя. Что такое "жизненные силы"? В моей игре они быстро убывали по 1-3 единицы за ход. Через примерно 8 ходов герой погибает. Пробовал "Отдыхать" - ИИ сообщает, что герой отдохнул или даже вклолол стимулятор, но "жизненные силы" от этого не увеличились. Что это вообще такое и как можно на них влиять?

После первой гибели подумал, что возможно, завел героя в зону повышенной радиации, но нет. Померил имеющимся прибором - доза не смертельная. А силы все равно тают, как мороженое в летний день. Без всяких объяснений. Что с этим делать?

alexey7h 4 июн в 07:27

Привет! Спасибо за подробный фидбек. Ты подсветил очень важную проблему, давай разбираться.

Как это должно работать задумке: «Жизненные силы» в игре — это аналог выносливости/энергии. Нам хотелось уйти от формата «бесконечного полотна текста» и добавить веса действиям игрока. Энергия тратится на переходы между локациями, тяжелые действия и значимые события, чтобы детекция опасности и планирование маршрута имели реальное значение для выживания.

Что пошло не так (и почему это баг): Ты абсолютно прав: прямое действие «Отдых» или использование стимулятора должно было восстановить этот ресурс. То, что ИИ-мастер подтвердил действие в тексте, но не изменил числовые параметры в системе — это чистой воды баг синхронизации логики приложения и генерации текста (те самые галлюцинации, о которых ты писал). Из-за этого герой просто «сгорел» за несколько ходов без шанса на спасение.

Буду очень признателен, если напишешь мне в личку здесь или в Telegram: @svc_alexey.

Подскажи свой логин или почту в приложении, а также название игровой кампании (сессии). Обязательно подниму логи и посмотрю, на каком этапе ИИ решил проигнорировать команду на лечение. Постараемся починить это как можно быстрее!

konopes 2 июн в 05:30

Поиграл с удовольствием. Галлюцинаций уйма, но от этого только веселее. Я везде прикидывался известным техно музыкантом, который должен сегодня играть техно-сет, раздобыл секвенсор у старого менялы, лол, и предъявлял его всем и каждому. Видно, что модель пытается возвращать меня в канву повествования, от этого персонажи, которые стояли рядом со мной внезапно оказываются на всяких квестовых складах, тайных кафе и так далее, хотя мы их уже посетили, но, видимо, все там пошло не по плану)) Понравилось, как реализована система бросков, а еще можно флиртовать, хватать за ягодицы и творить прочие непотребства - весело! Буду играть дальше, удачи Вам!

alexey7h 2 июн в 07:11

Спасибо большое, в планах и нет ограничивать свободу творчества) Суть больше в том что бы держать Игрока в рамках его возможностей по компании, не доставать миллион денег из кармана или танк из гаража)

disnous 2 июн в 12:42

Затестил сайт - нейронка (если использовать предлагаемые кнопки) люто галлюцинирует, подменяет понятия, меняет цели квестов на лету. Если же брать все в свои руки - персонаж спокойно "находит" книгу по магии в серверной научного центра и уничтожает весь мир ядерной бомбой из картофелины.

Но да, улыбнуло)

PS: Еще очень мало описывает сама нейронка - сложилась такая ситуация что я сам больше пишу сюжет, чем она меня направляет и ограничивает

disnous 2 июн в 13:57

Кнопка "Сделать хорошо"

alexey7h 2 июн в 17:09

Привет, спасибо за отзыв.
1. По поводу кнопок еще вернусь к ним, доработать.
2. По поводу описания. Есть 2 режима - "Короткая" и "Длинная" компании. В первом режиме предпологаються короткие ответы с быстрым темпом и развитием сюжета, во втором более длинные ответы с долгим прохождение\чтением. Советую затестить оба. В длинной компании весь ответ иногда не помещается в экран, но если требуется, подумаю на счет увеличением или настройкой размера ответа Игроком.

Так же на будущее - уже протестил подключение thinking модели, выдает более сочные и емкие повествования!

disnous 3 июн в 07:53

Выглядит действительно неплохо)

Кстати, вдобавок к описанным в статье оценочным критериям, нужно вводить критерий "Location context" - ну нельзя в сеттинге условного средневековья пойти в канализацию бить крыс и найти там дискомбобулятор. Также я думаю что в каком-нибудь условном кафе-мороженое невозможно найти гранатомет.
То есть модели нужен контекст сеттинга (в более строгом формате чем сейчас) и контекст локации (комнаты, транспорта, страны)

Задумка со "Слухами" очень интересная, правда тоже маленько галлюцинирует и смешивает сеттинги:

PS: В остальном - нет ничего такого, что нельзя было бы списать исключительно на саму нейронку - концепт, реализация - шикарно) Как большой фанат текстовых квестов и подобного - чувствую мог бы залипать часами)

alexey7h 3 июн в 10:14

Спасибо, ТОП рекомендация, взял на карандаш!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий