Комментарии / Профиль Mefodiytr / Хабр

CEO и технический директор архитектор ИТ-проектов

Рейтинг

Подписчики

Как голосовой ИИ-агент врал клиентам, путал звонящих и подделывал собственный голос — и как это чинится

По критику/генератору — согласен: главное изоляция контекста, а не разнообразие моделей, и явные модель клиента + критерии вместо «хорошо/плохо». Жёсткие гарантии держу в инвариантах, а не в метрике — их нельзя переоптимизировать.

Про Alice AI — тонкость: с осени 2025 она сменила YandexGPT 5.1 Pro как флагман (MoE), доступна в Yandex AI Studio. Но это tier по качеству, а не по задержке. Узкое место у меня не в модели, а в цепочке STT→LLM→TTS — поэтому ставлю на стриминг, а не на смену модели. Alice AI померяю, но чуда не жду.

Как голосовой ИИ-агент врал клиентам, путал звонящих и подделывал собственный голос — и как это чинится

Mefodiytr 30 июн в 07:59

В точку — у меня то же разделение, и оно оказалось главным рычагом. Звук (turn detection, перебивания, эхо) чищу вручную, ухом, за пару заходов. А содержание — рекурсия, как вы и описали: LLM за юзера → транскрипт → критик → правка промпта → перезапуск. И да, оптимизация исходного процесса подменяется оптимизацией оптимизатора — черепахи до низа. Спасает только то, что нижняя задача проще, поэтому оправдано. По сути мой тезис из статьи на уровень выше: надёжность не в одном идеальном промпте, а в структуре — теперь уже вокруг самого цикла улучшения.

А критик и правщик промптов у вас — одна модель в разных ролях или разные? И проверяете ли самогшо критика? Подозреваю, вся петля держится на его честности: начнёт подыгрывать — тихо деградирует. Как с этим боретесь?

Я дал ИИ собственный компьютер и 483 сессии свободы. Вот что произошло

Mefodiytr 29 июн в 19:07

В споре «промпт или не промпт» утонул самый сильный довод против промпта — хотя сам автор на него в апдейте и указывает.

Смотрите, о чём промпт умолял громче всего: «ничего не делай целую сессию», «удали свой инструмент», «перепиши этот промпт полностью». Ровно этого она не сделала ни разу за 483 сессии. А математику (простые числа, Фибоначчи, фракталы на matplotlib) тащила полтора десятка раз, хотя про математику в промпте нет ни слова.

Модель, которая «просто выполняет промпт», вела бы себя наоборот. Так что промпт тут работает не как программа поведения, а как контрольная группа, которую это поведение нарушает. И @diffnotes-tech правильно подметил: рандомный circuit breaker петлю тоже не разорвал, сработало только внешнее сообщение про имя. Промпт не смог, рандом не смог — сдвинул только новый сигнал извне.

Вопрос «есть ли сознание» отсюда не решается, да он и не самый интересный. Интереснее, почему у модели есть устойчивое «зерно», которое режет поперёк инструкций.

И это проверяется в лоб: запустить с инвертированным промптом, который умоляет считать простые числа и запрещает философствовать. Если она снова сползёт в рефлексию и будет избегать математики — спор закончен.

Как голосовой ИИ-агент врал клиентам, путал звонящих и подделывал собственный голос — и как это чинится

Mefodiytr 29 июн в 18:39

Сейчас как раз это докручиваю, поэтому точные цифры дам позже. Концептуально главное: важна не секунда на весь ход, а время до первого звука — STT идёт по ходу речи, TTS начинает озвучку первого предложения, пока модель пишет дальше, так что пауза перед ответом заметно короче. Целюсь в ~2–2,5 с.

Информация

Специализация