Взгляд HR с опытом 15+ лет на создание рентабельной AI-команды

2025 год. Computer Vision давно перестал быть «крутой фичей для презентаций». Сегодня это прикладной инструмент, который обязан зарабатывать деньги. Бизнес больше не готов спонсировать «исследования ради исследований». Ему нужны предсказуемые сроки, прозрачные бюджеты и положительный ROI.

Поэтому CV-проект нужно рассматривать не как набор нейронных сетей, а как экономическую систему, где каждое решение — от источника данных до структуры команды — напрямую влияет на то, окупится модель или сожжёт миллионы.

Ниже — практический разбор от человека, который 15+ лет строит Tech & AI-команды и считает их рентабельность.

1. Данные — 50–70 % реальной стоимости CV-проекта (и главный источник провалов)

Большинство проектов умирает не из-за «слабой» архитектуры, а потому что данные оказались дороже и хуже, чем планировали.

Реальные цифры 2024–2025 годов (Россия + международные подрядчики):

Тип данных

Стоимость (примерно)

Главный скрытый риск

Видеопотоки с собственных камер

0–5 млн ₽

Доступ к инфраструктуре + юридические согласования

Видео с городских/чужих камер

10–60 млн ₽ за год доступа

Регуляторные ограничения, GDPR/152-ФЗ

Медицинские изображения

180–400 ₽/снимок

Деперсонификация, согласие пациентов

Производственные дефекты

2 000–8 000 ₽ за уникальный кейс

Редкость брака → огромные затраты на сбор

Разметка (bounding box)

3–12 ₽/объект

Разметка (instance segmentation)

15–70 ₽/объект

Видеокадр с трекингом

80–300 ₽/кадр

Скрытые +30–70 % бюджета:

  • аудит и переразметка (обычно 2–3 итерации),

  • поддержание inter-annotator agreement > 0.85,

  • обнаружение и сбор edge cases уже в продакшене (самая дорогая часть).

Вывод: дешёвые данные почти всегда = низкое качество модели = нулевой ROI.

2. Модель — всего 15–25 % итоговой стоимости продукта

Распределение бюджета типичного CV-продукта в 2025 году:

Этап

Доля бюджета

Комментарий

Исследование новых архитектур

3–8 %

Почти всегда избыточно

Baseline + дообучение

5–10 %

Самая быстрая отдача

MLOps, CI/CD, мониторинг

20–30 %

Здесь экономят → потом платят в 10 раз больше

Оптимизация inference (QAT, прунинг, TensorRT/ONNX)

10–15 %

Решает, будет ли модель работать на edge-устройствах ( устройства, которые выполняют инференс модели прямо “на месте”, без обращения к серверу. )

Интеграция в бизнес-процессы

25–35 %

Самый недооценённый этап

Постоянный retraining и поддержка

20–30 %

Без этого модель деградирует за 3–6 месяцев

Победитель 2025 года — не тот, кто выжал +1.5 % mAP, а тот, кто запустил рабочую модель за 3–4 месяца и поддерживает её за разумные деньги.

3. Три настоящих драйвера ROI в Computer Vision

  1. Frequency of Use Модель, которая делает 1 млн инференсов в сутки, окупается даже при accuracy 87 %. Модель, которую запускают раз в неделю, не окупится никогда.

  2. Speed to Value Среднее время от старта до первой экономической пользы в успешных проектах — 3–5 месяцев. Всё, что дольше 8 месяцев, обычно умирает.

  3. Cost of Wrong Prediction FN на конвейере (пропущенный дефект) = остановка линии на часы → миллионы убытков. FP в медицине (ложная тревога) = лишнее обследование → 5–20 тыс. ₽. Разница в цене ошибки — в тысячи раз.

4. Идеальная структура CV-команды в 2025 году (по соотношению цена/отдача)

Роль

Кол-во (оптимально)

ЗП вилка (Мск, net)

Влияние на ROI

ML/CV Engineer (strong middle/senior)

1-3

250–450k

Baseline и быстрые улучшения

Data Engineer

1-2

250–450k

Экономия на данных и хранилище

Annotation Lead / Data QA

0.5–1

200 – 400k

+5–15 % к метрикам модели

MLOps Engineer

1

250 – 450k

×3–5 к стабильности в продакшене

AI Product Manager

0.5–1

250 – 500k

Связь технологии и денег

Domain Expert (врач/технолог)

10–20 % времени

по рынку

Снижение стоимости ошибки

Минимально жизнеспособная команда — 3 человека (CV Engineer + Data Engineer + MLOps). Оптимально для компании 100–1000 человек — 5–7. Больше 9 человек без чёткого продукта — почти гарантированный отрицательный ROI.

5. KPI рентабельности CV-команды (то, что HR-стратег показывает CEO)

Тип KPI

Метрика

Хорошее значение

Efficiency

Время до working baseline

≤ 6 недель

Efficiency

Стоимость 1 % прироста mAP/IoU

≤ 3–5 млн ₽

Quality

Доля silent failures, пойманных до продакшена

≥ 90 %

Business

ROI модели через 12 месяцев

≥ 300 %

Business

Экономия человеко-часов в год

≥ 8000 часов

6. Что разрушает ROI быстрее всего

  1. Перфекционизм (+0.4 % accuracy за +6 месяцев).

  2. Запуск модели без перестроенного бизнес-процесса.

  3. Отсутствие мониторинга → деградация → «AI не работает».

  4. Перебор researchers (соотношение researcher/engineer > 1:3 — красный флаг).

  5. Игнорирование edge cases до продакшена.

Главный вывод

В 2025 году крутая модель за 300 миллионов, которая лежит в ноутбуке и «почти готова», — это н�� актив, а самая дорогая в мире подставка под кофе.

Реально окупается только те проекты в области компьютерного зрения, которые встроены в бизнес процессы так, что бизнес их даже не замечает: они просто работают 24/7, и экономят или зарабатывают для компании десятки-сотни миллионов.

Поэтому лучший CV-проект 2025 года — это не тот, где accuracy 99,3 %, а тот, про который можно забыть, что он есть, просто заметно снижается прибыть и оптимизируется найм.