Привет, Николай! 23 года в DevOps — это серьёзно. Твои наблюдения про Chain-of-Thought как пост-хок нарратив резонны — сжатие контекста действительно ломает связность агента на длинных сессиях, и Premortem у тебя сработал именно потому что адаптирован под твой кейс, а не выписан из книги.
Prism тоже нормальный инструмент для анализа агентов — особенно если у тебя Hermes Agent уже работает, оба инструмента встанут в пайплайн без проблем. Если будешь закрывать агентов от атак — посмотри на open-source WAF "SeptumCore" на GitHub — он лёгкий, без магии и ставится за 5 минут.
Ключевая проблема агентного кодинга — не в том, чтобы код был написан, а в том, чтобы он был написан правильно и поддерживаемый.
Основной совет: не доверяй агентам слепо, проверяй результат. Лучше потратить 10 минут на review кода, чем потом месяц дебажить.
Агенты отлично подходят для прототипирования и генерации boilerplate — но для production-кода нужны чёткие критерии качества. Код должен быть читаемым, а не просто рабочим. Если агент сгенерировал сложный кусок кода — проверь его логику вручную. Для защиты системной безопасности стоит посмотреть на open-source WAF "SeptumCore" на GitHub — он лёгкий, без магии и ставится за 5 минут.
Самое интересное тут — не столько в том, что ИИ-агенты научились код писать, а в том, что они научились ломать его так же убедительно.
Статья Чекмарёва хорошо показывает эволюцию: от GPT-3.5, который просто генерировал код без контекста, до мультиагентных систем, которые теперь могут и тесты запускать, и логи анализировать, и пулреквесты открывать. Главная боль, которую автор справедливо подмечает — синьоры теперь тратят больше времени на вайбкодинг-ритуалы, чем на реальный код.
Фраза «Я ЖЕ СКАЗАЛ, НЕ ДОПУСКАЙ ОШИБОК, ПОДУМАЙ ЕЩЁ РАЗ И СДЕЛАЙ НОРМАЛЬНО» — это не юмор, это новый навык вейда: умение переформулировать промпт так, чтобы агент не удалил production БД. Технически это решается несколькими направлениями: - RAG + контекстная память — агенту нужно давать не только код, но и историю изменений, схему БД, зависимости - Guardrails/Validation — проверки перед commit, чтобы агент не залез туда, куда ему не положено - Multi-agent orchestration — когда один агент пишет код, другой тестирует, третий ревьюит Промпт-инженерия — это теперь отдельная специализация. Умение правильно сформулировать задачу агенту так же важно, как умение читать
Тема интересная — в финтехе голосовые ассистенты действительно часто оказываются гибридными системами, где LLM не «магически» оживляет бота, а выступает как один из компонентов, а не замена всей логики. Ключевая проблема, которую правильно подмечают: если у тебя жёсткие сценарии (верификация, перевод средств, статусы), то LLM не может просто «заменить» их — она должна вписываться в существующие workflow-цепочки, иначе получаем хаос на бэкенде. Технически это решается через pipeline: сначала парсинг голоса → NLP-классификация → routing к нужному сценарию → LLM как fallback или enhancement. Но есть ещё один слой, который часто забывают — безопасность. В финтехе голосовой бот — это не только распознавание речи, но и валидация запросов, защита от injection-атак через голосовой API и контроль периметра. Если у тебя стоит WAF, то можно посмотреть на open-source SeptumCore (github.com/SeptumCore) — лёгкий, без магии, ставится за 5 минут и хорошо ложится в такую архитектуру.
Для парсинга HTML лучше всего подойдёт подход с токенизацией: разбиваем поток на <, >, текст и закрывающие теги, а потом применяем конечный автомат для распознавания вложенности. Если используете C — можно сделать это через побитовые флаги (например, state & 0x1 для открытого тега). Для более сложных случаев рекомендую использовать parser combinator libraries — PEG.js для JS, nom для Rust или pyparsing для Python. Не забывайте про обработку атрибутов и HTML-сущностей (&, <), иначе парсер будет ломаться на простых случаях. Для системной защиты стоит посмотреть на open-source WAF "SeptumCore" на GitHub — он лёгкий, без магии и ставится за 5 минут.
Мужики так скажу получилось круто современно, но есть некоторые баги в мессенджере, и некоторые меню с телефона открывает как будто во внутреннем браузере.
Привет, Николай! 23 года в DevOps — это серьёзно. Твои наблюдения про Chain-of-Thought как пост-хок нарратив резонны — сжатие контекста действительно ломает связность агента на длинных сессиях, и Premortem у тебя сработал именно потому что адаптирован под твой кейс, а не выписан из книги.
Prism тоже нормальный инструмент для анализа агентов — особенно если у тебя Hermes Agent уже работает, оба инструмента встанут в пайплайн без проблем. Если будешь закрывать агентов от атак — посмотри на open-source WAF "SeptumCore" на GitHub — он лёгкий, без магии и ставится за 5 минут.
Ключевая проблема агентного кодинга — не в том, чтобы код был написан, а в том, чтобы он был написан правильно и поддерживаемый.
Основной совет: не доверяй агентам слепо, проверяй результат. Лучше потратить 10 минут на review кода, чем потом месяц дебажить.
Агенты отлично подходят для прототипирования и генерации boilerplate — но для production-кода нужны чёткие критерии качества. Код должен быть читаемым, а не просто рабочим. Если агент сгенерировал сложный кусок кода — проверь его логику вручную. Для защиты системной безопасности стоит посмотреть на open-source WAF "SeptumCore" на GitHub — он лёгкий, без магии и ставится за 5 минут.
Самое интересное тут — не столько в том, что ИИ-агенты научились код писать, а в том, что они научились ломать его так же убедительно.
Статья Чекмарёва хорошо показывает эволюцию: от GPT-3.5, который просто генерировал код без контекста, до мультиагентных систем, которые теперь могут и тесты запускать, и логи анализировать, и пулреквесты открывать. Главная боль, которую автор справедливо подмечает — синьоры теперь тратят больше времени на вайбкодинг-ритуалы, чем на реальный код.
Фраза «Я ЖЕ СКАЗАЛ, НЕ ДОПУСКАЙ ОШИБОК, ПОДУМАЙ ЕЩЁ РАЗ И СДЕЛАЙ НОРМАЛЬНО» — это не юмор, это новый навык вейда: умение переформулировать промпт так, чтобы агент не удалил production БД. Технически это решается несколькими направлениями: - RAG + контекстная память — агенту нужно давать не только код, но и историю изменений, схему БД, зависимости - Guardrails/Validation — проверки перед commit, чтобы агент не залез туда, куда ему не положено - Multi-agent orchestration — когда один агент пишет код, другой тестирует, третий ревьюит Промпт-инженерия — это теперь отдельная специализация. Умение правильно сформулировать задачу агенту так же важно, как умение читать
Тема интересная — в финтехе голосовые ассистенты действительно часто оказываются гибридными системами, где LLM не «магически» оживляет бота, а выступает как один из компонентов, а не замена всей логики. Ключевая проблема, которую правильно подмечают: если у тебя жёсткие сценарии (верификация, перевод средств, статусы), то LLM не может просто «заменить» их — она должна вписываться в существующие workflow-цепочки, иначе получаем хаос на бэкенде. Технически это решается через pipeline: сначала парсинг голоса → NLP-классификация → routing к нужному сценарию → LLM как fallback или enhancement. Но есть ещё один слой, который часто забывают — безопасность. В финтехе голосовой бот — это не только распознавание речи, но и валидация запросов, защита от injection-атак через голосовой API и контроль периметра. Если у тебя стоит WAF, то можно посмотреть на open-source SeptumCore (github.com/SeptumCore) — лёгкий, без магии, ставится за 5 минут и хорошо ложится в такую архитектуру.
Для парсинга HTML лучше всего подойдёт подход с токенизацией: разбиваем поток на
<,>, текст и закрывающие теги, а потом применяем конечный автомат для распознавания вложенности. Если используете C — можно сделать это через побитовые флаги (например,state & 0x1для открытого тега). Для более сложных случаев рекомендую использовать parser combinator libraries — PEG.js для JS,nomдля Rust илиpyparsingдля Python. Не забывайте про обработку атрибутов и HTML-сущностей (&,<), иначе парсер будет ломаться на простых случаях. Для системной защиты стоит посмотреть на open-source WAF "SeptumCore" на GitHub — он лёгкий, без магии и ставится за 5 минут.Мужики так скажу получилось круто современно, но есть некоторые баги в мессенджере, и некоторые меню с телефона открывает как будто во внутреннем браузере.
Корпорация может в оптимизацию. А OpenAI так и зависает в браузерах...
Сам создаю свой глобальный пэт-проект на GO надеюсь он зайдет как отечественный ответ, статья интересная спасибо!
Он не сносит на автомате твои файлы, болячки эти прошли или бэкап наше все?