Pull to refresh

Comments 28

Разработчик получает структурированный список багов вместо разрозненных сообщений в чате поддержки.

Казалось бы, техподержка на то и нужна, чтобы выдавать разработчику структурированный, приоритезированный, etc список багов. Но НЕТ

Касательно багов — тут мимо почти всех прошло то наблюдение (лично меня ощутимо потрясшее), что ИИ, может, и пишет отвратительный код — но в ответе на вопрос «откуда в этом коде этот баг» ему нет равных. Как минимум, даже в случае ошибки он почти наверняка наведёт на мысль.

И вообще, лучше всего он работает тогда, когда у него нет возможности «галлюцинировать» — любой его технически возможный ответ зажат в строгих рамках доказательно проверяемых вариантов, и проверка эта делается математически строгими алгоритмами, к ИИ не имеющими никакого отношения.

Собственно, я «свою карьеру тут начал» с диванных размышлизмов про это обстоятельство.

Похоже после этого скрина придется делать статью на тему "защита формы регистрации от фрода с habr через Grok"

Отличная статья, отличное решение! Авторы молодцы, что поделились опытом!

Спасибо!

Вроде хотели для всех простое решение выложить, но похоже сейчас заминусуют

Дизайнер в Claude не блещет оригинальностью.

Отличная статья! Спасибо, что поделились опытом!

Не хватает немного подробностей:

  1. Как тестировали? Сами или с помощью агента, и почему так?

  2. На что конкретно ушло 4 часа? Сколько из них работала сама модель? Сколько токенов/денег потрачено?

  3. Предусматривали ли защиту от ДОСа нерелевантными вопросами?

  4. Как предусмотрена обратная связь по удовлетворенности пользователя ответом?

  5. Возможно, было бы неплохо предусмотреть систему замещающих алертов в случае падений или обслуживаний основных сервисов.

Желаю автору и команде успехов, стабильности и меньше вопросов от клиентов! 😎

Спасибо! Учту! Вторая статья, вникаю как лучше писать, чтобы полезно было.
На гитхабе все подробно расписали, подумал не делать дубль...

1. Агент автоматически проверял все через playwright, потом отдавал мне на тесты
2. Все делали через claude code cli. По подписке max за 200$, отдельно токены не оплачивались. Можно создать агентов под проект: бэк, фронт, девопса, специалиста по интеграции с ИИ. Дальше клод сам решал как и когда какого агента запускать для задач, они почти автономно работали. после каждой итерации их работы проверяли (без косяков не обходилось). Писал всё новый opus 4.5.
3. Да, в репозитории описали:

  • Rate Limiting — ограничение запросов в минуту/час

  • Детекция атак — SQL injection, XSS, prompt injection

  • Блокировка IP — автоматический бан атакующих

  • Система страйков — прогрессивные наказания

  • Валидация — лимиты длины сообщений

    Но гигачат пока не так хорошо с детекцией атак справляется, как клод, например.

4. Пока никак, отдельно доработали админки, там человек сам мониторит ответы и решает на сколько модель справилась. Но у него есть функционал обратной связи - если человек пишет позитив или негатив - сразу приходит алерт в телеграм группу (в open source это есть)
5. Делал это с агентом, но там ценник выходил большой. Он мониторил сам логи, отправлял алерты в телеграм, имел доступ к некотором частям кода, чтобы сам мог быстро фиксить. Но это дорого обходилось, пока выключил.

Пожалуй, используемый prompt был бы интереснее готового проекта.

Пример промта в репозитории. там же и файлы с настройками под разные случаи. Но промт тут играет второстепенное значение.

Имелся в виду не системный, а использованный вами для генерации этого проекта. Его не нашел.

Под проект были созданы агенты внутри Claude Code.каждый агент был со своим набором компетенций: фронт, бэк, девопс. Дальше в терминале работа под задачи с Claude была, он сам распределял агентов под задачу. Единого промта как такого не было.

Вы лучше расскажите о затратах токенов за эти 4 часа. Может у вас модель на простого бота потратила денег столько, что вся затея не имеет смысла

Все в рамках подписки Clude Max за 200$ делали. Он в CLI сам пишет, вызывает агентов и тд.

интересны более конкретные цифры, потому что может быть и 20$, и 200$ расход. У вас же там наверное как в cursor можно посмотреть примерно расход по дням и даже часам?

Когда подписка нельзя посмотреть. Лимиты есть дневные и дневные, какие они реально - неизвестно. Но по api, без подписки, думаю вышло бы очень дорого.

Как же надоела это ии-дрисня, из-за которой до живого оператора, который реально может помочь, не достучишься. После некоторого кол-ва безуспешных попыток бросаешь это гиблое дело, а где-то там отмечается, что пользователь получил ответ и остался доволен (потому что больше жалоб не было).

Ты не поверишь насколько операторам надоели однотипные вопросы типа "а как зарегистрироваться?", особенно если чат им достаётся в нагрузку.

Мы под капот, отдельно внутри доработали, заложили сразу подключение живого человека, если агент понимает, что это важно. Но с клодом хорошо работает, сейчас пробуем. гигачатом, он чуть тупей, ну или мы)

Говорите или пишите "Связь с оператором". Пользуюсь этим методом с появления первых автоответчиков. Если с первого раза не сработает, повторять до трёх раз.

Так и делаю обычно, но, к сожалению, работает далеко не всегда.

Всё работает, просто некоторые компании делают так, что надо это повторить несколько раз. Я уже точно не помню кто именно, но где-то даже я так попался. Раза три или четыре пришлось повторить. Или банк какой-то или оператор связи, не помню уже.

Вот интересно наши крупные что делать-то будут? Ведь такими темпами скоро у всего малого бизнеса появятся ИИ-техподдержка высокого уровня (потому на Антропик и т.п.), а у крупняка - останется вот эта всё унылое г..но, которое есть сейчас (в смысли тупые и напрягающие чат-боты и голосовые помощники)

Идея выложить это в опенсорс - дать малому бизнесу инструменты, на внедрение которых у них нет обычно денег, собственно. Разрыв возможностей слишком большой.

Идея и продукт классный! Ключевых слова тут два:

  • MVP

  • Open-source

Поэтому придираться не вижу смысла.

Зашёл на гитхаб, посмотрел проект: архитектура действительно хорошая. Дал совсем маленький совет через issue, вынести pydantic схемы из роутов, и через несколько минут пришло уведомление о том что появился pull request, который закрывает моё issue.

Это я, собственно, к чему:

Ребята видят и слышат наш с вами фидбэк, и если есть идеи как сделать лучше, делайте issue и ваши "хотелки" будут реализованы с большой долей вероятности. Я всеми руками и ногами за опенсорс! От меня автору жирный плюс!

50 100 страниц документа каждый раз пихать в контекст звучит как то дорого. Сколько интересно стоит оплата апи 1000 клиентских чатов?

Sign up to leave a comment.

Articles