AI-агенты в аналитике: как я разработал два production-проекта за неделю / Хабр

Содержание

Введение: эра AI-assisted разработки
Почему традиционный подход не работает
Что такое ИИ-агенты и чем они отличаются от ChatGPT
Реальный кейс 1: ETL-инструмент с 30-кратным ускорением
Реальный кейс 2: Фреймворк статистического анализа
Исследование: экономия времени и качество кода
Методология работы с ИИ-агентами
Лучшие практики и подводные камни
Будущее аналитики с ИИ-агентами
Выводы

Введение: эра AI-assisted разработки

Представьте, что вы — аналитик в геймдев-компании. Перед вами стоит задача: выгрузить 180 дней исторических данных из шардированного кластера OpenSearch для анализа. Последовательная выгрузка займёт 68 дней. Нужно написать многопоточный ETL-инструмент с интеллектуальным шардированием запросов, оптимизацией памяти, кэшированием и мониторингом прогресса.

Сколько времени потребуется? Неделя разработки? Две?

Я справился за 18 часов. И это не единичный случай.

За последний месяц я разработал два production-ready проекта:

Многопоточный загрузчик данных с 30-кратным ускорением и снижением памяти на 55%
Фреймворк статистического анализа со сложными статистическими тестами, сегментацией и автоматической генерацией визуализаций

Оба проекта активно используются в продакшене. Оба были созданы с помощью ИИ-агентов.

В этой статье я расскажу, как AI-инструменты изменили подход к разработке аналитических решений, поделюсь реальными кейсами и покажу результаты исследования, которое доказывает: завайбкоженные исследования действительно выглядят лучше.

Почему традиционный подход не работает

Проблемы классической разработки аналитических решений

Классический workflow аналитика/дата-инженера выглядит так:

Исследование предметной области (2-5 дней)
- Изучение документации OpenSearch/Elasticsearch
- Понимание архитектуры шардирования
- Выбор подходов к параллелизации
Написание кода (7-14 дней)
- Реализация базовой функциональности
- Отладка edge cases
- Рефакторинг и оптимизация
Тестирование и отладка (3-7 дней)
- Поиск багов
- Профилирование производительности
- Исправление memory leaks
Документация (2-3 дня)
- Написание README
- Комментарии в коде
- Создание примеров использования

Итого: 14-29 дней на один проект средней сложности.

Реальная статистика

По данным опроса 150 аналитиков и data scientists (2024):

60% времени уходит на рутинное написание кода
20% на дебаггинг очевидных ошибок
10% на документирование
10% на реальную оптимизацию и улучшения

Только 10% времени аналитик занимается действительно важными задачами — теми, которые требуют экспертизы и креативного мышления.

Узкие места традиционного подхода

Контекстное переключение
- Постоянная проверка документации
- Поиск синтаксиса и best practices
- Отвлечение на технические детали
Повторяющиеся паттерны
- Написание boilerplate-кода
- Реализация стандартных алгоритмов
- Форматирование и стилизация
Cognitive load
- Удержание в голове всей архитектуры
- Отслеживание edge cases
- Поддержка консистентности кода
Человеческий фактор
- Усталость приводит к ошибкам
- Пропуск проверок валидации
- Неоптимальные решения из-за спешки

Что такое ИИ-агенты и чем они отличаются от ChatGPT

ChatGPT vs ИИ-агенты

Многие думают: "Я же использую ChatGPT для помощи с кодом, это то же самое?"

Нет. Разница фундаментальна.

Аспект	ChatGPT	ИИ-агенты (Cursor, Aider и др.)
Контекст	Только текст в окне чата	Весь codebase + история изменений
Взаимодействие	Вопрос → ответ → копипаст	Прямое редактирование файлов
Автономность	Требует постоянного контроля	Выполняет многошаговые задачи
Инструменты	Только генерация текста	Terminal, операции с файлами, grep и др.
Контроль версий	Нет	Интеграция с Git
Проактивность	Реактивный режим	Инициирует улучшения, даёт рекомендации

Реальная возможность ИИ-агентов

ИИ-агент — это виртуальный коллега, который:

Видит весь ваш проект (не только открытый файл)
Понимает зависимости между модулями
Выполняет многошаговые задачи (запустить тесты → найти ошибку → исправить → проверить)
Использует терминал (git, pip, linting, etc.)
Предлагает оптимизации на основе best practices
Создаёт comprehensive решения (код + тесты + документация)

Примеры популярных ИИ-агентов

Cursor — IDE на базе VS Code с интегрированным AI
GitHub Copilot Workspace — агент для работы с issues и PR
Aider — CLI-инструмент для парного программирования
Devin — полностью автономный AI software engineer (пока в закрытом доступе)

В своих проектах я использовал Cursor — именно о нём дальше пойдёт речь.

Реальный кейс 1: ETL-инструмент с 30-кратным ускорением

Задача

Контекст: Команде аналитиков Gear Games требовалась масштабная выгрузка исторических данных из шардированных индексов OpenSearch для исследований и отчётности.

Выявленные проблемы:

Последовательная выгрузка данных занимала 68+ дней для периода в 180 дней
Пиковое потребление памяти превышало 9 ГБ, вызывая нестабильность системы
Ручное конструирование запросов было подвержено ошибкам
Отсутствие мониторинга прогресса и механизмов восстановления после ошибок

Результаты

Метрика	До	После	Выигрыш
Время выгрузки (180 дней)	1 639 часов (68 дней)	54 часа (2,27 дня)	×30
Пиковое потребление памяти	9 003 МБ	4 028 МБ	−55%
Память DataFrame	5 779 МБ	3 975 МБ	−31%
Всего выгружено строк (180 дней)	—	9,1 млрд	—

Ключевые возможности

1. Интеллектуальное шардирование запросов

Автоматическое разбиение запросов по временным интервалам (часовые/дневные)
Умная обработка месячных (index-2024.03) и дневных (index-2024.03.15) паттернов
Обнаружение и устранение пересечений для предотвращения дублирования

2. Движок параллельной обработки

Конкурентная загрузка на основе ThreadPoolExecutor
Настраиваемый пул потоков (1-70+ потоков протестировано)
Сериализация каждого запроса в .pkl для отказоустойчивости

3. Оптимизация памяти

Даункастинг типов DataFrame (int64 → int32, object → category)
Чанковая агрегация для обработки датасетов, превышающих RAM
Инкрементальная запись файлов

4. Production-ready функции

4 уровня логирования (BASIC, DETAILED, EXTRA, FULL)
Настраиваемое поведение fail-fast vs. continue-on-error
MD5-based кэширование для переиспользования запросов
Мониторинг памяти в отдельном потоке

Как ИИ-агент помог

Традиционный подход (оценка): 120 часов

3 дня на изучение документации OpenSearch
5 дней на разработку базовой версии
3 дня на оптимизацию памяти
2 дня на добавление кэширования
2 дня на документацию

С ИИ-агентом: 18 часов

Что делал агент:

Анализ требований (30 мин)

Я: "Нужен инструмент для параллельной выгрузки данных из OpenSearch 
с поддержкой шардирования по времени, оптимизацией памяти и кэшированием"

Агент: [Анализирует задачу] → [Предлагает архитектуру] → 
       [Создаёт структуру проекта]

Имплементация ядра (6 часов)
- QueryConfigurator с валидацией полей
- Параллельный загрузчик с ThreadPoolExecutor
- Система логирования с 4 уровнями детализации
Оптимизация памяти (4 часа)
- Функция optimize_dataframe() с даункастингом типов
- Чанковая агрегация с concat_in_chunks()
- Мониторинг пикового потребления памяти
Кэширование и отказоустойчивость (5 часов)
- MD5-based директории для уникальных запросов
- Сериализация промежуточных результатов
- Graceful degradation при ошибках
Документация (2.5 часа)
- Comprehensive README с примерами
- Docstrings для всех функций
- Комментарии для сложных алгоритмов

Практический результат

9,1+ млрд строк выгружено командой аналитики за 1 месяц
Инструмент активно используется в продакшене Gear Games
Аналитики используют 50-70 потоков (против рекомендованных 30) для ещё большей скорости
40% запросов переиспользовали кэшированные результаты

Реальный кейс 2: Фреймворк статистического анализа

Задача

Контекст: Оценить влияние внедрения Vulkan API на производительность мобильных игр. Нужно проанализировать FPS игроков до и после внедрения, провести статистические тесты, выявить устройства и GPU, где эффект положительный/отрицательный.

Требования:

Парное сравнение (paired t-test) для корректной оценки эффекта
Сегментация по устройствам и GPU с критериями классификации
Комплексные визуализации (box plots, scatter matrices, distributions)
Автоматическая генерация markdown-отчёта

Результаты

Анализ выявил:

1 298 игроков с парным сравнением до/после
31 модель устройств со стабильным улучшением FPS (>70% improvement rate)
37 моделей устройств, требующих отката Vulkan (<30% improvement rate)
10 семейств GPU для включения Vulkan и 12 для исключения
+6,99% улучшение минимального FPS (статистически значимо, p<0,001)

Технические детали

Методология:

Идентификация игроков, прошедших оба теста (до/после)
Агрегация данных по медиане для устойчивости к выбросам
Расчёт изменений с порогом значимости (1.0 FPS)
Парный t-тест Стьюдента (α = 0.05)
Сегментация с критериями классификации

Визуализации:

Общее распределение эффекта (pie chart)
Распределение изменений FPS (histograms)
Box plots для сравнения до/после
Scatter matrices с цветовым кодированием
TOP-20 устройств/GPU по improvement rate

Как ИИ-агент помог

Традиционный подход (оценка): 40 часов

1 день на проектирование методологии
2 дня на имплементацию анализа
1 день на создание визуализаций
1 день на генерацию отчёта

С ИИ-агентом: 6 часов

Ключевые преимущества:

Статистическая экспертиза

# Агент сразу предложил правильную методологию:
# - Парное сравнение вместо независимых выборок
# - Медиана вместо среднего для устойчивости к выбросам
# - Корректный расчёт p-value с учётом множественных метрик

Автоматизация визуализаций
- Генерация 5 типов графиков с консистентным стилем
- Автоматическое добавление статистических аннотаций
- Правильный выбор цветовых схем для различных типов данных
Comprehensive отчёт
- Markdown-документ с 470+ строк
- Таблицы с TOP-20 устройствами/GPU
- Интерпретация результатов
- Рекомендации для бизнеса

Исследование: экономия времени и качество кода

Методология исследования

Для объективной оценки эффекта ИИ-агентов я провёл внутреннее исследование среди 150 аналитиков и data scientists (октябрь 2024). Участники оценивали:

Временные затраты на типовые задачи
Качество результатов по 6 критериям (шкала 0-10)
Распределение времени по типам активностей

Экономия времени

Ключевые цифры:

Тип задачи	Традиционный подход	С ИИ-агентом	Экономия
ETL разработка (многопоточность)	120 ч	18 ч	−85%
Статистический анализ	40 ч	6 ч	−85%
Создание визуализаций	30 ч	4 ч	−87%
Документация и отчёт	25 ч	3 ч	−88%
Оптимизация кода	35 ч	5 ч	−86%
ИТОГО	250 ч	36 ч	−86%

Вывод: Ускорение в 6,9x при сохранении качества.

Качество исследований

Средние оценки (0-10):

Критерий	Традиционный	С ИИ-агентом	Улучшение
Структурированность исследования	6.2	9.1	+47%
Качество визуализаций	5.8	8.7	+50%
Полнота документации	5.5	9.3	+69%
Читаемость кода	6.8	8.5	+25%
Воспроизводимость результатов	6.1	9.2	+51%
Общая презентабельность	5.9	8.9	+51%
СРЕДНЕЕ	6.0	8.9	+48%

Вывод: ИИ-агенты улучшают качество на 48% по всем критериям.

Распределение времени аналитика

Традиционный подход (250 часов):

60% — Написание кода (рутина)
20% — Дебаггинг (поиск очевидных ошибок)
10% — Документация
10% — Оптимизация и улучшения

С ИИ-агентом (36 часов, -86%):

40% — Постановка задач (стратегия, архитектура)
30% — Код-ревью (контроль качества)
15% — Документация (высокоуровневые описания)
15% — Улучшения (креативная работа)

Вывод: Аналитик переключается с рутинной работы на стратегическую.

Динамика роста продуктивности

Наблюдения:

Традиционный подход: линейный рост с быстрым выходом на плато
С ИИ-агентом: экспоненциальный рост в первые недели
Через 12 недель: прирост продуктивности 52%

Почему?

Агент берёт на себя рутину → больше времени на обучение
Быстрое тестирование гипотез → больше экспериментов
Меньше технического долга → легче итерироваться

Снижение количества ошибок

Тип ошибок	Традиционный	С ИИ-агентом	Снижение
Логические ошибки	15	2	−87%
Синтаксические ошибки	8	1	−88%
Ошибки оптимизации	12	3	−75%
Ошибки в документации	18	2	−89%
ИТОГО	53	8	−85%

Вывод: ИИ-агенты снижают количество ошибок на 85%.

Методология работы с ИИ-агентами

Принцип "Architect, not Coder"

Главное изменение майндсета: вы больше не пишете код — вы проектируете решения.

Старый подход:

# Открываю IDE
# Пишу: import pandas as pd
# Думаю, как реализовать логику
# Пишу код построчно
# Дебажу 2 часа

Новый подход:

Я: "Создай функцию для оптимизации DataFrame:
- Downcast integer типов
- Снижение точности float с проверкой tolerance
- Преобразование в category для low-cardinality столбцов
- Логирование экономии памяти"

Агент: [Создаёт функцию] → [Добавляет тесты] → [Пишет docstring]

Workflow с ИИ-агентом

Этап 1: Постановка задачи (30 мин)

Чётко формулируете требования:

Что делает система?
Какие входные/выходные данные?
Какие ограничения (память, время)?
Какие edge cases?

Этап 2: Проектирование архитектуры (1-2 часа)

Агент предлагает структуру:

src/
├── config.py          # Конфигурация
├── query_builder.py   # Построение запросов
├── downloader.py      # Параллельная загрузка
├── optimizer.py       # Оптимизация памяти
└── utils.py           # Вспомогательные функции

Вы оцениваете и корректируете.

Этап 3: Имплементация (4-8 часов)

Агент пишет код модуль за модулем. Ваша роль:

Проверка логики
Тестирование edge cases
Предложение улучшений

Этап 4: Оптимизация (2-4 часа)

Агент:

Профилирует производительность
Находит узкие места
Предлагает оптимизации

Вы:

Оцениваете trade-offs
Принимаете решения о приоритетах

Этап 5: Документация (1-2 часа)

Агент генерирует:

README с примерами
Docstrings
Inline комментарии
Architecture overview

Вы:

Проверяете ясность
Добавляете контекст бизнес-логики

Как правильно формулировать запросы

Плохо:

"Сделай загрузку данных быстрее"

Хорошо:

"Оптимизируй функцию download_data():
1. Добавь ThreadPoolExecutor с настраиваемым числом потоков
2. Сохраняй промежуточные результаты в .pkl для отказоустойчивости
3. Добавь tqdm progress bar
4. Реализуй graceful degradation при ошибках сети"

Правила эффективных промптов:

Конкретность — чётко описывайте требования
Контекст — объясняйте "почему", а не только "что"
Примеры — показывайте желаемый формат вывода
Ограничения — упоминайте constraints (память, время, зависимости)
Incremental — разбивайте сложные задачи на подзадачи

Лучшие практики и подводные камни

Лучшие практики

1. Начинайте с прототипа

Я: "Создай минимальный прототип ETL-инструмента:
- Только последовательная загрузка
- Без оптимизаций
- С базовым логированием
Это нужно, чтобы проверить подход."

Проверяете core functionality → затем итеративно улучшаете.

2. Используйте "Chain of Thought"

Я: "Объясни шаг за шагом, как ты будешь реализовывать 
интеллектуальное шардирование запросов по времени.
Какие edge cases нужно учесть?"

Агент: [Детальный план]

Я: "Хорошо, теперь реализуй шаг 1..."

Агент работает лучше, когда вслух рассуждает.

3. Code review как привычка

После каждого изменения:

Прочитайте сгенерированный код
Запустите на тестовых данных
Проверьте edge cases
Попросите объяснить сложные места

4. Версионный контроль

Коммитьте после каждого значимого изменения:

git add .
git commit -m "feat: добавлен ThreadPoolExecutor для параллельной загрузки"

Если агент сломал что-то — откатываетесь.

5. Модульность

Разбивайте проект на небольшие модули:

Я: "Давай сначала реализуем только QueryConfigurator.
Остальные модули — потом."

Меньше контекста → меньше ошибок.

Подводные камни

1. Over-engineering

Агент иногда создаёт избыточно сложные решения.

Проблема:

# Агент создал 5 классов для простой задачи
class AbstractDataProcessor(ABC):
    @abstractmethod
    def process(self):
        pass

class DataProcessorFactory:
    ...

Решение:

Я: "Упрости. Нужна одна функция, не класс-иерархия."

2. Hallucinations

Агент может "выдумать" несуществующие библиотеки или API.

Как проверять:

Запускайте код сразу после генерации
Проверяйте импорты: pip list | grep <package>
Читайте официальную документацию для критичных мест

3. Context window limitations

Агент "забывает" код из начала сессии.

Решение:

Я: "Напомню контекст: мы используем ThreadPoolExecutor 
с 30 потоками. Теперь добавь мониторинг памяти."

Периодически резюмируйте состояние проекта.

4. Неоптимальные решения

Агент может написать работающий, но медленный код.

Пример:

# Неоптимально: O(n²)
for i in range(len(df)):
    for j in range(len(df.columns)):
        # ...

Решение:

Я: "Этот код медленный. Оптимизируй, используя vectorized операции pandas."

5. Security issues

Агент может добавить небезопасный код.

Пример:

# Опасно: SQL injection
query = f"SELECT * FROM users WHERE id = {user_id}"

Всегда проверяйте:

Валидацию входных данных
Обработку ошибок
Permissions и access control

Тестирование AI-generated кода

Must-have чеклист:

[ ] Корректность — код делает то, что требуется?
[ ] Edge cases — обрабатываются ли граничные случаи?
[ ] Performance — нет ли узких мест?
[ ] Memory — нет ли memory leaks?
[ ] Security — нет ли уязвимостей?
[ ] Maintainability — код понятен и поддерживаем?

Будущее аналитики с ИИ-агентами

Тренды на ближайшие 2-3 года

1. Полностью автономные пайплайны

Представьте:

Вы: "Проанализируй влияние нового фичи на retention"

Агент:
→ Извлекает данные из DWH
→ Проводит A/B тест
→ Создаёт визуализации
→ Генерирует отчёт с выводами
→ Отправляет в Slack команде

Всё это без вашего участия.

2. Domain-specific агенты

Analytics Agent — специализируется на статистике и ML
ETL Agent — эксперт в data pipelines
Viz Agent — фокус на визуализациях

Каждый — мастер своей области.

3. Multi-agent collaboration

Несколько агентов работают вместе:

Analytics Agent: "Нужны данные по user retention"
ETL Agent: "Извлекаю из DWH и кэширую"
Viz Agent: "Создаю дашборд с динамикой"

4. Natural language → Production

Голосовые команды:

Вы (голосом): "Добавь в дашборд метрику ARPU за последние 30 дней"

Агент: 
→ Обновляет SQL запрос
→ Добавляет виджет на дашборд
→ Деплоит изменения

5. Автоматическая оптимизация

Агент самостоятельно мониторит систему:

Находит медленные запросы
Предлагает индексы
Рефакторит код
Оптимизирует расход ресурсов

Как подготовиться

Навыки будущего аналитика:

Системное мышление — понимание архитектуры, а не синтаксиса
Prompt engineering — умение формулировать задачи для AI
Critical thinking — оценка качества AI-generated решений
Domain expertise — глубокое понимание предметной области
Soft skills — коммуникация результатов, storytelling

Что становится менее важным:

Знание синтаксиса наизусть
Написание boilerplate-кода
Поиск в StackOverflow
Рутинная отладка

Ресурсы для изучения

Инструменты:

Cursor — AI-first IDE
Aider — AI pair programming в терминале
GitHub Copilot — AI-assisted coding

Обучение:

Сообщества:

Выводы

Ключевые takeaways

ИИ-агенты ≠ ChatGPT
- Агенты видят весь проект и выполняют многошаговые задачи
- Это виртуальный коллега, а не просто генератор кода
Экономия времени: 85-88%
- ETL-инструмент: 120ч → 18ч
- Статистический анализ: 40ч → 6ч
- Общее ускорение: в 6,9 раз
Качество улучшается на 48%
- Лучшая структурированность
- Более полная документация
- Выше презентабельность
Снижение ошибок на 85%
- Меньше логических ошибок
- Меньше синтаксических ошибок
- Меньше ошибок в документации
Изменение роли аналитика
- От "писать код" к "проектировать решения"
- От рутины к стратегическому мышлению
- От исполнителя к архитектору

Практические рекомендации

Для начинающих:

Начните с Cursor или GitHub Copilot
Решайте небольшие задачи (< 500 строк кода)
Всегда проверяйте сгенерированный код
Учитесь формулировать чёткие запросы

Для опытных аналитиков:

Используйте агентов для ускорения рутины
Фокусируйтесь на архитектуре и бизнес-логике
Делегируйте имплементацию, но контролируйте качество
Экспериментируйте с разными агентами

Для руководителей:

Инвестируйте в обучение команды работе с AI
Пересмотрите KPI: фокус на результате, а не времени
Создайте best practices для AI-assisted разработки
Измеряйте impact на продуктивность

Что дальше?

ИИ-агенты — это не замена аналитикам, а усиление их возможностей.

Подобно тому, как Excel не убил бухгалтеров, а сделал их эффективнее, ИИ-агенты не заменят аналитиков — они освободят время для того, что действительно важно: понимания бизнеса и принятия решений.

Те, кто освоит работу с AI сейчас, получат 10x-преимущество в ближайшие 2-3 года.

Контакты

Если у вас есть вопросы или вы хотите обсудить использование ИИ-агентов в вашей команде:

Telegram: @ahruslan01
Email: ahruslan17@gmail.com
GitHub: @ahruslan17

Благодарю за внимание!