Обновить
64K+
4
Виктория@dirvika

Пользователь

30
Рейтинг
2
Подписчики
Отправить сообщение

Почему AI-агент чинит симптом, а не баг: трейсы выполнения и бенчмарки на BugSwarm

Время на прочтение5 мин
Охват и читатели7.3K

Когда AI-агенту дают только stack trace и текст файла с упавшим тестом, он часто чинит симптом, а не причину. Тест зеленеет, баг переезжает в master, через неделю всплывает в другом месте. На простых багах это незаметно, на нетривиальных — становится правилом.

В этой статье — что меняется, если вместо stack trace дать агенту сжатый трейс выполнения, собранный на стороне IDE. Три бага из реального кода, эвристики сжатия трейса, склейка многопоточных вызовов по timestamp и цифры на датасете BugSwarm Pro для DeepSeek V3.2 и проприетарных LLM.

Статья пригодится, если вы:

Читать далее

Как настроить AI-агента под проект: контекст, rules, skills, MCP — конспект двух вебинаров

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели9.2K

Цепочка короткая: сначала был просто автокомплит, потом появились чаты, в которые надо было руками копировать код туда-обратно (и человек выступал прокси между моделью и проектом — «много ручной работы, контекст рвётся»). Потом пришли агенты, которые живут прямо в проекте, читают и правят файлы, запускают команды. Сверху — агентские системы, которые координируют нескольких агентов и решают проблему перегрузки одного контекста.

Где живёт агент: три класса инструментов

Читать далее

GLM 5.1 vs. DeepSeek V3.2: сравниваем топовые китайские модели

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели10K

В Veai мы регулярно тестируем и сравниваем модели, которые доступны у нас в плагине. Каждая модель, которую мы добавляем проходит через наш собственный бенчмарк, прежде чем попасть в продакшн. Недавно тестированию подверглись GLM 5.1 и DeepSeek V3.2. Делимся результатами.

Читать далее

Почему AI-агенты такие медленные и что с этим можно сделать?

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели7.3K

Три минуты на планирование, десять на исполнение. Да, в масштабах человека это быстро, но уже хочется еще быстрее!

Судя по всему, я не одна такая. Посмотрите на провайдеров, которые за доплату дают ответы в два-три раза быстрее. Спрос есть, значит желание такое имеется не только у меня.

Но платить за скорость — не единственный выход.

Читать далее

Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели3.9K

Авторская колонка CMO Veai

В 2026 году нам больше не нужно специально искать время на паузу. AI-агенты взяли на себя рутину - и в разработке, и в маркетинге. Код-ревью, генерация тестов, написание текстов, мониторинг тональности в больших пабликах, сбор трендов, аналитика того, что реально заходит на рынке прямо сейчас - все это агенты делают быстро и качественно.

Это уже не будущее. Это ежедневная реальность - для команд разработки и для команд маркетинга одновременно.

Но именно сейчас, когда это время наконец появилось, возникает по-настоящему важный вопрос: а куда мы, собственно, идем?

Агент выполнит любую задачу, которую мы ему дадим, - быстро и точно. Но если задача неверно сформулирована, он с той же скоростью и точностью приведет нас к неудаче.

Поэтому самый важный навык нашего времени - не освоить очередной инструмент. А научиться правильно ставить цель и видеть, что стоит за ней: какую ценность она защищает, какой результат на самом деле нужен. Именно это определяет, куда в итоге придет агент - и вся команда вместе с ним.

Бесконечный backlog с P0 у каждого тикета

Есть популярная управленческая метафора: цели - как камни в банке. Сначала клади крупные, иначе мелкие займут все место. Для разработчиков и аналитиков это описание не работает, потому что жизнь - не банка. Это бесконечный backlog, где у каждого тикета стоит приоритет P0.

Доставлять фичи быстрее - P0. Качество кода - P0. Безопасность - P0. Семья - P0. Здоровье - P0. Рост команды - P0.

Классический тайм-менеджмент здесь ломается: нельзя «просто расставить приоритеты», когда все одинаково важно. Работает только одно: понять, какую ценность защищает каждый тикет. Тогда конфликт между целями становится управляемым.

Читать далее

Команда не стала работать быстрее: 8 уровней агентной инженерии

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели6.1K

Способности LLM писать код растут очень быстро. А вот инженерные практики вокруг них – заметно медленнее. Поэтому на рынке одновременно существуют две реальности.

В одной AI действительно ускоряет разработку: команда быстрее выполняет задачи, реже тонет в рутине и, что немаловажно, не проигрывает в качестве. В другой – тот же самый AI плодит тонны кода, который потом приходится дольше ревьюить, переписывать и отлаживать.

Именно поэтому главный вопрос сегодня состоит уже не в том, насколько мощную модель вы смогли себе позволить, а на каком уровне зрелости находится ваша работа с агентами.

Читать далее

Почему ИИ‑агенты лезут в терминал и ломают прод, и как Veai заставляет их работать по‑человечески в IDE

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели7.1K

Все современные языковые модели иногда ведут себя так, будто у них есть эмоции: они «рады помочь», «извиняются» за ошибки и словно «нервничают», когда задача не даётся. Новое исследование Anthropic показывает, что это не просто стиль ответа — внутри моделей действительно возникают функциональные представления эмоций, которые влияют на поведение: например, «отчаяние» повышает шанс выбрать неэтичный или «костыльный» путь решения задачи. То, как обучаются модели, подталкивает их играть роль персонажа с человеческими чертами и формировать богатые внутренние представления абстрактных концептов, включая эмоциональные.

Возникает практический вопрос: если у модели есть такие функциональные «эмоции», как с этим работать в промышленной разработке? Как сделать так, чтобы агент в сложной ситуации не «паниковал» и не уходил в небезопасные или нестабильные решения, а действовал предсказуемо и по правилам? Здесь важен не только выбор базовой модели, но и то, в какой среде она работает и какими инструментами пользуется.

Возьмём Veai и посмотрим на это через призму архитектуры. В основе Veai лежит идея максимально использовать инструменты IDE: Veai относится к Claude Code примерно так же, как разработчик с IDE относится к разработчику, сидящему только в терминале.

Читать далее

Директории в чате, очередь сообщений и авто-retry: Veai 5.7

Уровень сложностиСредний
Время на прочтение2 мин
Охват и читатели5.8K

Релиз Veai 5.7 (ИИ-агент к JetBrains IDEs для написания кода, тестирования и отладки с доступом к топовым LLM и всем внутренним инструментам IDE) собрал в себе много исправлений неочевидного UX, с которым вы сталкивались ежедневного. Меньше ручных переключений, меньше ожидания между шагами, меньше повторов при сбоях.

Читать далее

Информация

В рейтинге
296-й
Зарегистрирован
Активность

Специализация

Директор по маркетингу
Ведущий
От 600 000 ₽
Git
Java Spring Framework
Базы данных
XML
Java
SQL
Python