Утром деньги, вечером ИИ-проекты. Пока бедолаги из отчета NANDA жалуются, что 95% их ИИ-проектов не оправдывают дорогостоящих ожиданий, мы, как взрослые люди, считаем финансовый эффект от ИИ, ML и LLM в банке без магии — с калькулятором.
Меня зовут Михаил Войтко, я работаю в Альфа Банке руководителем по внедрению решений продвинутой аналитики в Дирекции ботов и виртуальных ассистентов. Я не люблю, когда на вопрос «Ну как там с деньгами в вашем ИИ-проекте?» отвечают: «Мы улучшим пользовательский опыт, а там как пойдёт».
Не-не-не. Утром деньги, а вечером проекты.
Сейчас на волне хайпа всё подряд стали делать при помощи искусственного интеллекта — от моделирования новых материалов и цифровых агрономов до детских ассистентов. После того, как первое очарование технологией ушло, финансисты и владельцы бизнеса хотят понять: а что им дала эта инновация, кроме дорогостоящего внедрения? В статье я помогу понять, нужна ли вам модная новинка, а если да, то как обосновать ее перед топами, у которых всегда сжатые сроки и ограниченные ресурсы.
Инженеры любят классные фичи и инновации ради инноваций: потому, что это просто красиво. Но для роста бизнесу нужны цифры, поэтому ниже я расскажу, как считать P&L, объясню формулу эффекта внедрения ИИ в процессы, научу интерпретировать показатели и проверять через реальные кейсы.
Примечание. Весь этот год для внутреннего обучения продактов я читал лекции про деньги в ИИ, а данный материал –– адаптация презентаций с обезличенными примерами и, конечно, соблюдением NDA.
Представьте, что вы работаете руководителем направления в одной из бизнес-линий банка: в розничном или корпоративном бизнесе, в рисках, каналах продаж или в сети. Вы знаете, что корпорация считает всего два эффекта: увеличение продаж и сокращение издержек, и оба они влияют на ключевой – прибыльность. Вы находите прекрасную идею, которая непременно должна выстрелить и резко улучшить показатели. В интернетах пишут, что с помощью этих модных сеточек можно определять, насколько склонен ваш клиент, например, к продукту «Кредитная карта». Вы нашли данные, чтобы в деталях описать поведение пользователей, обучить модель и даже предсказать, кто из многомиллионной аудитории больше подходит, чтобы показывать ему предложения о кредитке.
Но как прикинуть финэффект?
Зачем вообще считать эффект?
Если кратко — чтобы принимать обоснованные продуктовые решения, а не кидаться делать тот проект, РО которого громче кричит и ссылается на Важных Людей.. Иными словами вы сможете честно приоритизировать бэклог, выбирая задачи с максимальной денежной отдачей. Тогда никто не обидится, что его великолепная прогнозная модель с обещанием увеличить доход на 1 млн рублей в год не берется в работу.
На этапе планирования расчёт показывает, куда направлять усилия и прогнозирует сколько возврата на инвестиции это принесёт. В процессе — помогает выдерживать бизнес-план и докручивать стратегии под модельные/продуктовые метрики.
А ещё — честно приоритизировать бэклог, выбирая задачи с максимальной денежной отдачей, чтобы никто не обижался, что его великолепная прогнозная модель с обещанием увеличить доход на 1 млн рублей в год не берется в работу.
Ведь в крупном банке одновременно идут десятки, если не сотни, проектов с искусственным интеллектом.
И как же мы считаем рентабельность этих проектов?
Три типа финансового эффекта от ML
Обычно в банках любую внедряемую технологию оценивают по влиянию на прибыльность. Фича принесёт больше денег? А может снизит затраты? Надо считать.
№1. Рост продаж. Такой эффект приносят модели склонности, рекомендации, скоринги с расширением воронки. Например, у нас есть модель, которая определяет кому отправлять письма с предложениями, а кому не стоит, — таргетирует аудиторию, склонную к открытию дебетовой карты. В результате конверсия растёт при тех же объёмах коммуникаций.
№2. Повышение доходности. ИИ позволяет управлять ценой и параметрами продукта куда тоньше, чем менеджер при помощи галлюцинации «мне кажется».
Давайте для примера возьмем инструмент Smart-pricing и добавим его в наш кейс с кредитной картой. Инструмент прогнозирует использование допуслуг, даёт рекомендации по структуре продукта. Продуктовая политика превращается из угадайки в дисциплину с предсказуемым результатом. Модель видит будущие действия клиента ещё до того, как клиент успевает их придумать.
В кредитных картах задача сводится к оптимизации лимитов. Мы не штампуем новые карты и не развешиваем баннеры «Налетй! Торопись! Покупай всё!». Мы даём каждому клиенту ровно такой лимит, какой ему сейчас действительно нужен.
Тем, кто давно мечтает о большем лимите, мы его спокойно одобряем — и доходность карты растёт.
Тем, кому дополнительный лимит даже некуда потратить, мы не резервируем деньги «на всякий случай» (банк — не бабушкин шкаф с заначками).
В итоге все довольны: клиент понимает, что мы заботимся о нём, остаётся лоялен нам, а банк имеет прогнозируемый дополнительный доход без излишних рисков.
№3. Сокращение затрат. ИИ здесь не ускоряет магически эфемерные процессы. Он считает реальные деньги, которые перестают утекать через дыры в бюрократии.
Вспомните, сколько вы тратите времени на банальный сбор информации из 5 разных табличек в одну презентацию для топ-менеджера? Классическая ML-модель, как и новомодный LLM, может сократить производственный цикл, убрать часть ручной рутины с операторов или менеджеров, вычистить лишние шаги — всё то, что годами жило в процессах по принципу «Работает — не трогай».
Внутренние решения особенно показательны: каждый сэкономленный час превращается в экономию напрямую. Не надо ждать роста выручки, сезонного всплеска или чудесного пузыря изменения рынка. Сократили затраты времени на операции = снизили расходы. Это тот случай, когда действия приносят заметный и предсказуемый финансовый результат.
Чтобы зафиксировать эффект, мы всегда сравниваем два состояния: AS IS — как процесс выглядел до внедрения ИИ (обычно долго, громоздко и со священными ритуалами ручного ввода), и TO BE — как он выглядит после автоматизации. Такой подход не даёт прятаться за фразами «стало быстрее» — любимыми в корпоративной мифологии. Вместо этого эффект садится в конкретные строки P&L, где романтики нет, но правда счёта звучит громче любых слоганов.
P&L: где в продукте лежат деньги и куда они уходят
P&L — отчёт о прибылях и убытках за период. В нём две корзины: все расходы и все источники доходов. Это рамка, к которой надо привязывать любой эффект от данных и ML.
Типовые расходы. В IT основная статья, как правило, — фонд оплаты труда. Он может быть в диапазоне от 30 до 70%. Остальное тратится на аутсорс, инфраструктуру (лицензии, облако, железо) –– до 20%, аренду офиса и техники, связь (5–15%) и маркетинг с продвижением (до ~30%). Такие разрезы позволяют заранее понять, на чем можно сэкономить и что станет переменными издержками.
Типовые доходы. Продажа лицензий/подписок/интеграций/консалтинга (для коммерческого продукта — часто >60% выручки), сервисная поддержка (10–30%), реклама (иногда единственный источник), партнёрские роялти (10–20%), а во внутренних продуктах — прямая экономия затрат вплоть до 100% от статуса-кво без решения.
В банках структура сложнее: процентные доходы/расходы и маржи, комиссионные статьи, ЧОД и «ЧОД с NCL» (резервами/списаниями). Для продакта это значит, что эффект от модели нужно соотносить не только с выручкой, но и со всеми этими показателями, которые формируют P&L подразделения.
Базовая формула эффекта: просто и прозрачно
Формула звучит так: Финансовый эффект = Количество коммуникаций × Δ конверсии в целевое действие × Инкрементальный доход/мес × Период (обычно 12 мес). Она универсальна для вторичных продаж, первичных заявок и задач удержания, если корректно задать параметры.
Разберём параметры в деталях:
Количество коммуникаций.
Вернемся к нашему примеру с кредитными картами. Мы общаемся десятками и сотнями способов с клиентом, чтобы донести до него ценность нашей карты, её отличия от карт конкурентов, рассказываем, какие в ней фишки. Коммуникации планируются внутри CRM-системы банка и подчинены строгим правилам Контактной политики. В зависимости от задачи мы анализируем разные показатели:
для повторных продаж — push-уведомления, письма, звонки и другие уведомления CRM-кампаний;
для первичных продаж — количество заявок, которые проходят через воронку;
для удержания — число клиентов, которые попадают в зону риска и с которыми начинается работа.
Очень важно, что само количество коммуникаций должно меняться благодаря модели, а не из-за того, что кто-то параллельно перестроил бизнес-процесс. Если это не контролировать, легко получить «эффект организационных реформ», который почему-то приписали ИИ — потом приходится объяснять финансистам, почему магия модели не сработала.
— Δ конверсии. Take Rate или Conversion Rate, удержание, допродажи. Конверсию при этом мы задаём исходя из реальных возможностей модели, а не из планов — «хотим +30%» ≠ «можем +30%». Нормальная вилка повышения, на которую стоит ориентироваться в прогнозе, — около ~10%.
— Инкрементальный доход. Берём среднемесячную доходность на горизонте жизни продукта или разницу в доходности между сегментами (например, «попали в таргет vs промахнулись»). Это защищает от завышенных ожиданий на старте и делает расчёт сопоставимым между продуктами.
Take Rate = (Сумма комиссии или дохода от транзакций / Общий объём транзакций) × 100%
Пример расчёта и окупаемость
Вспомните пример из начала статьи, где вы определяем, кому выдать кредитную карту и с каким лимитом. Давайте на примере задачи удержания держателей кредитных карт посчитаем окупаемость. Все цифры — условные, но реалистичные.
Предположим:
Среднегодовая прибыль от одного клиента по кредитной карте — 10 000 ₽.
Это сумма процентов + комиссия за операции + часть дохода от допуслуг.Без ML ежегодно уходит 5 000 клиентов.
Классика: кто-то перестаёт пользоваться картой, кто-то закрывает из-за лимита, кто-то уходит к конкуренту с «красивым предложением».Мы внедряем модель прогнозирования оттока + персональные удерживающие предложения.
То есть предсказываем, кто собирается уйти, и заранее предлагаем точную персональную меру: поднять лимит, дать выгодный оффер, сменить тариф или просто объяснить клиенту, что он может пользоваться картой выгоднее.
Стоимость такого проекта — 3 млн ₽ (команда + инфраструктура). Допустим, модель позволяет дополнительно удержать 1 500 клиентов, которых раньше потеряли бы.
Теперь цифры превращаются в деньги:
Дополнительная прибыль: 1 500 × 10 000 ₽ = 15 млн ₽ в год.
ROI ≈ 400%.
Окупаемость — около 2,4 месяца.
Обращу внимание, что проекты с удержанием — это почти всегда «быстрые деньги», если всё сделано аккуратно, если нет влияния других факторов, которые случились в этот же момент. В нашем случае, это изменение ключевой ставки ЦБ, которая даёт очень много шума в эксперименты.
Такой расчёт нужен, чтобы не попадать в ловушку «у нас вроде что-то улучшилось». Здесь всё жёстко: есть клиенты, есть прибыль на клиента, есть стоимость проекта. Не дотянули до P&L — честно ставим проект на паузу и идём разбираться, что сломалось: модель, процесс или гипотеза. Спойлер — чаще всего проблема с данными от обучения.
Чтобы не придумывать экономию, рядом всегда считаем все затраты:
Айтишники и команда датасайентистов — 2 млн ₽ на срок реализации проекта и, инфраструктура — 1 млн ₽, итого те самые 3 млн ₽.
Без этой честной пары «выгода vs затраты» любые разговоры про «бизнес-ценность модели» звучат как мантра о росте конверсии — красиво, но бесполезно.
Как интерпретировать получившиеся миллионы
Первое сито — сопоставление с прибылью продукта. Если модель как будто даёт эффект, сравнимый со всей прибылью продукта (или больше) — что-то не так. «Нормальный» вклад одной модели — до 20% прибыли.
Второе — сравнение с ЧОД с NCL (чистым операционным доходом с учётом резервов/списаний). Если расчёт показывает эффект больше 20% ЧОД с NCL, нужна допроверка; комфортная зона — 5–15%.
Третье — динамика ЧОД с NCL год-к-году: эффект модели не должен «перепрыгивать» годовой рост этой метрики, если только это не прорывный кейс, но такие — огромная редкость.
Наконец, думаем о времени: прогноз → пилот → факт. Прогноз нужен до приоритизации; пилот — на ограниченной выборке; «факт» считаем через 6–12 месяцев после полного внедрения. Это защищает от преждевременных победных фанфар.

Внешний вендор vs внутренняя модель
Как понять, насколько хорошо ваша регрессия справляется с бизнес-задачей? Одна из тактик — сравнивайте себя с рынком. Алгоритм действий простой: берём 2–3 внешних решения, смотрим их прогнозные оценки качества как отраслевой бенчмарк, интерпретируем под свой кейс. Если у вендора прогноз выше — ищем, что подтянуть в данных/архитектуре/процессе; если ниже — тем проще защитить инхаус. Главное — не смешивать их «маркетинговый эффект» с вашей формулой и не переносить чужие конверсии в лоб.
Проиллюстрирую на примере. Вы в банке внедряете сервис для работы с просроченной задолженностью клиентов. Среди возможностей предсказание погашения задолженности без дополнительных звонков или напоминаний, прогноз вероятности невозврата на разных стадиях и подбор наиболее подходящего профиля оператора для взыскания задолженности. Ранее вы не имели такого опыта, нет лучших практик, наборов данных и индикаторов для калибровки ожиданий по качеству модели и влиянию на бизнес-процесс. Можно провести пилот на ограниченных данных с внешним подрядчиком и оценить примерные риски и эффект. По этой теме специализируются несколько компаний, некоторые из них не стесняются приводить цифры:
«Например, в банке топ‑10 РФ для экономии ресурсов не обзванивают клиентов, которые по расчётам модели машинного обучения с 81% точностью самостоятельно вернут задолженность в течение 3 дней»
От таких цифр можно начинать и собственную исследовательскую работу по созданию ML-модели.
LLM-проекты: считаем экономику, а не токены
Для больших языковых ��оделей автор в индустрии пока не разработано универсальных стандартов. Сейчас распространены три опорные методики:
CoP (Cost-of-Pass) — ожидаемые деньги за один правильный ответ: стоимость одного инференса, делённая на вероятность получить правильный ответ. Это позволяет честно сравнивать модели и стратегии подсказок/версионирования.
CEBench — сравнение затрат и эффективности целых LLM-пайплайнов с учётом производительности, стоимости и потребления ресурсов. Особенно важно для доменов с ограничениями на обмен данными (здравоохранение, финансы).
GLEE — стандартная платформа для оценки поведения LLM в экономических и стратегических взаимодействиях между агентами; помогает проверять рациональность и справедливость решений.
Что именно оцениваем, когда строим экономику LLM-решения:
LLM как компонент: качество и скорость ответов, стоимость токенов, сложность API.
Агент/оркестратор: доля автоматизации, SLA, NPS, экономия времени персонала, стоимость эксплуатации.
Решение целиком: сквозная автоматизация, время прохождения процесса, производительность, масштабируемость и ошибки/комплаенс. Такой «тройной» взгляд помогает не переплачивать за дорогую модель там, где узкое место — в бизнес-процессе.
Итог: считаем, сверяем, приземляем
Хорошая ML/LLM-экономика — это три шага:
считаем по простой формуле и привязываем к строкам P&L;
интерпретируем результат через прибыль продукта и ЧОД с NCL, не забывая про горизонты «прогноз → пилот → факт»;
для LLM используем CoP/CEBench/GLEE и смотрим на LLM, агента и решение по отдельности.
Тогда эффект перестаёт быть «обещанием» и превращается в управляемый вклад в P&L.
Подписывайтесь на Телеграм-канал Alfa Digital, где рассказывают о работе в IT и Digital: новости, события, вакансии, полезные советы и мемы.
Может быть интересно:
