Обновить

Как мы боремся с галлюцинации AI Master: гибридный Guard на Embedding + LLM Extractor на примере AI-RPG «Стирая Грань»

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели11K
Всего голосов 4: ↑4 и ↓0+5
Комментарии11

Комментарии 11

Только что провел маленький тест подобного "взлома NPC" на Claude. Бот-охранник сломался довольно быстро, позволив мне взглянуть под ноги и найти там пропуск. А также достать из кармана предмет, которого там не было.

Так что проблема реальная и запущенная. Автору спасибо за ее обозначение и интересные пути решения, которые к тому же экономят ресурсы большой LLM.

А что у вас за игра? Где можно посмотреть?

Спасибо, пока приложение работает на deepseek v4 flash, и уже получается довольно неплохо, если Claude модель будет конечно интереснее, но пока не в бюджете к сожалению)

Потестить можно по кнопке Играть на сайте https://beyondtheverge.online/?lang=ru

Так же присоединяйтесь в группу ТГ https://t.me/beyond_the_verge, выкладываю туда апдейты и собираю ОС для развития!

Спасибо. Попробовал. Действительно, уйма галлюцинаций. Но мне не совсем понятны статистики героя. Что такое "жизненные силы"? В моей игре они быстро убывали по 1-3 единицы за ход. Через примерно 8 ходов герой погибает. Пробовал "Отдыхать" - ИИ сообщает, что герой отдохнул или даже вклолол стимулятор, но "жизненные силы" от этого не увеличились. Что это вообще такое и как можно на них влиять?

После первой гибели подумал, что возможно, завел героя в зону повышенной радиации, но нет. Померил имеющимся прибором - доза не смертельная. А силы все равно тают, как мороженое в летний день. Без всяких объяснений. Что с этим делать?

Привет! Спасибо за подробный фидбек. Ты подсветил очень важную проблему, давай разбираться.

Как это должно работать задумке: «Жизненные силы» в игре — это аналог выносливости/энергии. Нам хотелось уйти от формата «бесконечного полотна текста» и добавить веса действиям игрока. Энергия тратится на переходы между локациями, тяжелые действия и значимые события, чтобы детекция опасности и планирование маршрута имели реальное значение для выживания.

Что пошло не так (и почему это баг): Ты абсолютно прав: прямое действие «Отдых» или использование стимулятора должно было восстановить этот ресурс. То, что ИИ-мастер подтвердил действие в тексте, но не изменил числовые параметры в системе — это чистой воды баг синхронизации логики приложения и генерации текста (те самые галлюцинации, о которых ты писал). Из-за этого герой просто «сгорел» за несколько ходов без шанса на спасение.

Буду очень признателен, если напишешь мне в личку здесь или в Telegram: @svc_alexey.

Подскажи свой логин или почту в приложении, а также название игровой кампании (сессии). Обязательно подниму логи и посмотрю, на каком этапе ИИ решил проигнорировать команду на лечение. Постараемся починить это как можно быстрее!

Поиграл с удовольствием. Галлюцинаций уйма, но от этого только веселее. Я везде прикидывался известным техно музыкантом, который должен сегодня играть техно-сет, раздобыл секвенсор у старого менялы, лол, и предъявлял его всем и каждому. Видно, что модель пытается возвращать меня в канву повествования, от этого персонажи, которые стояли рядом со мной внезапно оказываются на всяких квестовых складах, тайных кафе и так далее, хотя мы их уже посетили, но, видимо, все там пошло не по плану)) Понравилось, как реализована система бросков, а еще можно флиртовать, хватать за ягодицы и творить прочие непотребства - весело! Буду играть дальше, удачи Вам!

Спасибо большое, в планах и нет ограничивать свободу творчества) Суть больше в том что бы держать Игрока в рамках его возможностей по компании, не доставать миллион денег из кармана или танк из гаража)

Затестил сайт - нейронка (если использовать предлагаемые кнопки) люто галлюцинирует, подменяет понятия, меняет цели квестов на лету. Если же брать все в свои руки - персонаж спокойно "находит" книгу по магии в серверной научного центра и уничтожает весь мир ядерной бомбой из картофелины.

Но да, улыбнуло)


PS: Еще очень мало описывает сама нейронка - сложилась такая ситуация что я сам больше пишу сюжет, чем она меня направляет и ограничивает

Кнопка "Сделать хорошо"

Привет, спасибо за отзыв.
1. По поводу кнопок еще вернусь к ним, доработать.
2. По поводу описания. Есть 2 режима - "Короткая" и "Длинная" компании. В первом режиме предпологаються короткие ответы с быстрым темпом и развитием сюжета, во втором более длинные ответы с долгим прохождение\чтением. Советую затестить оба. В длинной компании весь ответ иногда не помещается в экран, но если требуется, подумаю на счет увеличением или настройкой размера ответа Игроком.

Так же на будущее - уже протестил подключение thinking модели, выдает более сочные и емкие повествования!

Выглядит действительно неплохо)

Кстати, вдобавок к описанным в статье оценочным критериям, нужно вводить критерий "Location context" - ну нельзя в сеттинге условного средневековья пойти в канализацию бить крыс и найти там дискомбобулятор. Также я думаю что в каком-нибудь условном кафе-мороженое невозможно найти гранатомет.
То есть модели нужен контекст сеттинга (в более строгом формате чем сейчас) и контекст локации (комнаты, транспорта, страны)

Задумка со "Слухами" очень интересная, правда тоже маленько галлюцинирует и смешивает сеттинги:

Сай-Фай сеттинг, напоминаю
Сай-Фай сеттинг, напоминаю


PS: В остальном - нет ничего такого, что нельзя было бы списать исключительно на саму нейронку - концепт, реализация - шикарно) Как большой фанат текстовых квестов и подобного - чувствую мог бы залипать часами)

Спасибо, ТОП рекомендация, взял на карандаш!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации