Я внедрял всё это, и мы договорились, что можно использовать статистику по обезличенным логам. Это прямые подсчёты транзакций. Не прогнозы аналитиков, не презентации вендоров — а конкретные реальные логи.

Компания решила возглавить безобразие и дать всем сотрудникам внятный сервис, попробовать все модели рынка и вообще посмотреть, что это даст на практике в приросте производительности и так далее.

Они выбирали между подпиской и моделью с оплатой за токены, и, к счастью, выбрали второе.

Потому что в среднем пользователь использует LLM далеко не так, как может показаться. Если что, крупные модели показывают пользователей, но тщательно скрывают количество запросов и трафик. Потому что его там крайне мало.

На что уходит бюджет AI: 64% на картинки, 36% на текст
На что уходит бюджет AI: 64% на картинки, 36% на текст

Якоб Нильсен предположил, что только 20% населения могут нормально сформулировать промпт. Пробуют пару раз и уходят.

Короче, за 7 месяцев с июня по декабрь 2025:

  • 416 пользователей из 527 хоть раз потыкались

  • 122346 запросов (в среднем 42 запроса на пользователя в месяц)

  • 6851 доллар расходов (535 тысяч рублей, 184 руб/месяц на активного юзера)

  • Если бы они брали 20-долларовые подписки GPT, то получили бы то же самое в 8,5 раз дороже.

При этом мы внедряли агрегатор нейросетей, и там были картинки. 64% бюджета — генерация картинок.

Если только LLM, включая SOTA-модели вроде Gemini 3 Pro Preview, последние GPT, Gemini, последние Антропики — то было бы всего 62 рубля в месяц на пользователя.

Те, кто понял, зачем ему модель, возвращался постоянно.

В общем, заходите, расскажу, что реальные люди, если не бить их палкой, в реальном мире делают с LLM. На практике.

AI у вас уже внедрён

Иногда вы это знаете, иногда нет, но 50-60% ваших сотрудников уже используют нейросети в работе. Ежедневно. Вопрос не в том, внедрять ли. Вопрос в том, контролируете вы это или нет. 71% офисных работников используют AI без одобрения IT. 38% делятся конфиденциальными данными компании с публичными AI-сервисами.

Да, они сольют все ваши данные в OpenAI. Им же хуже!

Запретить AI невозможно (46% сотрудников продолжат использовать даже при явном запрете). Единственный способ контролировать — дать официальный доступ и мониторить.

Вот тут и решили возглавить безобразие.

Основные результаты нашего 7-месячного опыта

Если хочется покрутить данные самостоятельно — есть страница с интерактивными графиками. 16 визуализаций, от почасовой активности до кривой Парето. Можно залипнуть.

85% пользователей продолжают использовать AI после первого месяца
85% пользователей продолжают использовать AI после первого месяца
Эволюция популярности моделей: рост запросов в 27 раз за полгода
Эволюция популярности моделей: рост запросов в 27 раз за полгода

Откуда 62 рубля в месяц на пользователя или 184 рубля в месяц?

85% компаний ошибаются в прогнозах расходов на AI больше чем на 10%. Обычно в большую сторону.

Три главные причины:

1. ChatGPT Plus стоит $20 в месяц на человека. На 400 сотрудников — $8 000/мес, $96 000/год. Этот клиент работает через API. На человека выходит $2.35/мес. Разница — в 8,5 раз. Почему? Подписка — это all-you-can-eat буфет. Платишь за возможность есть бесконечно, даже если съедаешь одну тарелку. API — платишь за каждую тарелку отдельно. Если сотрудник делает 50 запросов в месяц — платишь за 50. Если 500 — за 500. При каком объёме подписка выгоднее? При 53 миллионах токенов в месяц на человека для GPT-4o-mini. Это примерно 40 000 страниц текста. В месяц. На одного сотрудника. Реалистично? Нет. Разве что у корректора или технического переводчика — но им-то как раз нужны не mini-модели.

2. Треть запросов съедает две трети бюджета. Генерация картинок дороже текста в 3,5 раза. 74% сотрудников хотя бы раз генерировали картинки — 308 из 416. Это не «отдел дизайна». Это почти все. Включая бухгалтерию. Зачем бухгалтерии картинки — отдельный вопрос. По McKinsey, только 35% организаций используют AI для картинок. Наши 74% — вдвое выше рынка. Люди распробовали. Если думаете, что картинки — нишевая функция для дизайнеров, вы ошибаетесь.

GPT Image стоит $0.44 за запрос. Gemini Image — $0.053. Разница в 8 раз. Midjourney — $0.16. В сентябре компания перешла с GPT Image на Gemini. Тихо, без фанфар. Миграция заняла день. 30 599 запросов через Gemini за 4 месяца. Если бы остались на GPT — заплатили бы $13 558. Заплатили $1 621. Экономия: $11 936.

Средний чек на пользователя в сентябре: $6.47. В октябре: $3.67. Упал вдвое за месяц. Люди генерировали столько же картинок — просто каждая стала в 8 раз дешевле.

Качество для бизнес-задач сравнимо. GPT иногда лучше для текста в картинках, но это редко нужно. Если в команде много людей — закладывайте картинки. И сразу выбирайте дешёвого провайдера.

3. 20% пользователей генерируют 79,4% расходов. Парето работает с точностью до процента. Топ-10 пользователей (2,4% от всех) потратили $1 910 — 20% всего бюджета. Лидер — условный «Лазурный Дрозд» — $308 за 7 месяцев, 3 578 запросов. При этом «Мятный Барсук» сделал 2 757 запросов, но потратил $139. Потому что один генерирует картинки, другой — текст.

Все считают неправильно, всё дешевле в 5 раз

95% AI-пилотов не дают измеримого влияния на P&L — MIT, 2025. 42% компаний отказались от большинства AI-инициатив в 2025 году. Почему? Потому что считают стоимость внедрения, а не стоимость использования. Покупают enterprise-подписки на всех, хотя активно пользуются 20%.

Правильный расчёт: API + мониторинг + обучение. Не «сколько стоит лицензия», а «сколько стоит запрос».

Кто попробовал — не бросают

В этом случае retention 85%. Кто попробовал AI — не бросает.

Это значит: если дать доступ 100 сотрудникам, через полгода активных будет не 20, а 60-80. Бюджет вырастет. Не потому что стало дороже — потому что распробовали.

Это хорошо для бизнеса. Плохо для тех, кто не заложил рост.

Таблицы — разрыв ожиданий

Бухгалтеры, PM-ы, аналитики — все работают с таблицами. Логичное ожидание: загружу Excel в AI, получу анализ.

Реальность: человек пихает файл на миллион строк в чат. Ничего не работает. Человек злится.

Почему? Обычный чат-интерфейс не умеет работать с таблицами. Для этого нужны агенты с code interpreter — они запускают Python, обрабатывают данные в изолированном окружении. Это другой продукт, другая цена, другие ограничения.

Хуже того: некоторые сервисы делают вид, что анализируют таблицу. На самом деле берут первые 100 строк и галлюцинируют выводы на их основе. Пользователь получает уверенный бред.

Что делать: объяснять ограничения на старте. AI — не замена Excel. Пока. Кроме Gemini и реально не очень больших таблиц. И подвижки уже идут.

Бухгалтерию в OpenAI и другие агрегаторы они почти слили, конечно. Но есть нюанс — для обучения она не используется, потому что есть правило, про него ниже.

Настройки картинок съедают бюджет незаметно

GPT Image позволяет выбрать качество и количество картинок за раз. Что выбирают люди? Максимальное качество. Четыре картинки сразу. Потому что «а вдруг пригодится».

Математика: 4 картинки x $0.25 = $1 за один запрос. Человек делает 15-20 итераций, пока не получит то, что хочет. Итого: $15-20 на одну задачу. Когда это увидели в логах — объяснили людям, как работает ценообразование. Ограничили доступ к картинкам тем, кому они не нужны для работы. Проблема исчезла.

Бонус: вышла Gemini Image, которая стоит в 8 раз дешевле при сравнимом качестве.

Они всегда используют самую дорогую модель для всего

Если дать сотруднику доступ ко всем моделям — он будет использовать самую дорогую. Для любой задачи. Даже для «напиши письмо клиенту».

GPT-5 Mini стоит в 6 раз дешевле GPT-5. Gemini Flash — в 7 раз дешевле Pro.

Сколько запросов через дешёвые модели? 4 875 из 123 458. 4 (четыре!) процента.

Почему? Status quo bias. Люди не переключают то, что работает. Даже если рядом лежит то же самое за копейки.

95% предприятий переплачивают за AI. Это не статистика — это бизнес-модель OpenAI.

Решение: сделайте дешёвую модель дефолтом. Дорогую — по запросу. Не всем нужен Claude Sonnet 4.5 или GPT-5.2. Для большинства задач хватает GPT-5 Mini или Gemini Flash.

А оно вообще окупается?

AI экономит 2-5 часов в неделю на сотрудника — Federal Reserve, BCG, Adecco. Power users экономят до 11 часов.

Если применить эти данные к нашему случаю:

  • 400 активных сотрудников x 3 часа/неделю x 4 недели = 4 800 часов/месяц

  • Средняя зарплата 80 000 руб/мес = ~460 руб/час

  • Экономия: 4 800 x 460 руб = 2.2 млн руб/мес

  • Расходы на AI: ~77 000 руб/мес

ROI: 2800%. За месяц.

Даже если AI экономит не 3 часа, а 30 минут в неделю — всё равно окупается в 4-5 раз.

Вероятно, оценки завышенные, потому что нет периода адаптации, и они могут использовать экономию для своих собственных задач (отправлять медицинские анализы, советоваться с психологом, просить нарисовать мем для чата), но большая часть задач шла от рабочей роли.

А данные точно утекут в OpenAI?

Утекут — точно. Примерно как все ваши гуглодоки.

Будут ли там обработаны — нет, если работаете через API.

С марта 2023 данные, отправленные через API, не используются для обучения моделей OpenAI. По умолчанию. Это касается и Anthropic, и Google.

Важно понимать разницу:

  • Бесплатный ChatGPT — данные могут использоваться для обучения (можно отключить в настройках)

  • API — данные не используются для обучения по умолчанию

Логи хранятся до 30 дней для мониторинга злоупотреблений. Enterprise-клиенты могут получить Zero Data Retention — тогда вообще ничего не хранится.

Администратор аккаунта видит логи и может брать за разные места тех, кто использует модель не по назначению. А может и не брать.

Санкции — всё заблокируют

Риск есть. Но есть и решения.

В этом случае за 7 месяцев — ни одного критичного простоя.

Один провайдер — это не стратегия, это лотерея. Обычно всё работает. Но бывают дни, когда даже OpenAI выдаёт 90-95% успешных ответов — можете проверить на их странице статуса. Случается не каждый день, но для компании и одного раза достаточно.

Джентльменский набор 2026:

  • Прямые API: OpenAI, Anthropic, Google (Gemini), xAI (Grok)

  • Агрегатор: OpenRouter — если один провайдер лежит, трафик идёт через другой

  • Резерв: Azure OpenAI — те же модели, другая инфраструктура

Как работает: запрос идёт в основной провайдер. Таймаут или ошибка — автоматически переключается на следующий. Пользователь не замечает. Замечает только ваш мониторинг. И вы в три часа ночи.

Про российские модели (YandexGPT, GigaChat): это не fallback. Люди приходят за GPT и Claude. Подменять их на локальные — как заменить BMW на Ладу и сказать «ну едет же».

Нужен выделенный человек?

Нет. Нужен ответственный, но это не full-time работа.

Настроить систему, периодически смотреть логи, отвечать на вопросы — это часть работы одного человека, не отдельная должность.

Full-time понадобится, только если добавить: регулярное обучение новых сотрудников, вебинары с лучшими практиками, обмен опытом между отделами. Но это уже про развитие, не про поддержание.

Как развернуть самим

Не хотите платить за готовые решения — разворачивайте сами. Open source уже не для бородатых энтузиастов с красными глазами.

Три варианта:

Dify (125K звёзд на GitHub) — визуальный конструктор. RAG, агенты, аналитика из коробки. Подключаете свои API-ключи, получаете корпоративный ChatGPT за вечер.

Open WebUI (120K звёзд) — проще некуда. Docker, LDAP-авторизация, работает офлайн. Идеально для параноиков и компаний, где безопасник спит с файрволом под подушкой.

LobeChat (70K звёзд) — самый красивый интерфейс. 42 провайдера моделей, плагины в один клик. Если сотрудники привыкли к ChatGPT — не заметят разницы.

Что нужно: сервер, Docker, API-ключи провайдеров. Время на развёртывание: день-два. Время на допиливание под себя: неделя-месяц. Время на объяснение бухгалтерии, зачем это нужно: вечность.

Хотите российский сервис со всеми закрывашками и т.п. — ну вот я занимаюсь )

Важные советы

  • Считайте по API, не по подпискам (разница в 5-10 раз)

  • Закладывайте рост: retention 80%+, активных станет больше

  • Лучше ставить отдельный бюджет на картинки или отдельные лимиты

  • Мониторьте топ-20% пользователей — они определяют бюджет

  • Смотрите на стоимость запроса, не на общую сумму

  • Давайте официальный доступ — иначе shadow AI

58% пользователей не получают никакого тренинга

Это ошибка. Мы сделали так:

  • 2 часа записанного видео (промптинг, ограничения, разные модели для разных задач)

  • 2 недели на просмотр в удобное время

  • Живой вебинар на час с ответами на вопросы

Главный урок: обучение без проверки — это рекомендация, а не знание. Человек всё равно попробует засунуть таблицу на миллион строк, даже если ему сказали не засовывать. Потому что «а вдруг». То же с дорогими моделями и 4 картинками за раз — люди учатся на своих ошибках, а не на чужих видео.

И ещё один урок — не торопиться с запуском. Клиент настоял на неделе тестирования перед раскаткой на всех. Цитата из переписки: «Подключать не готовый сервис — сразу потеряет среди пользователей интерес и репутацию». Корпоративные пользователи не прощают глюков. Один раз не заработало — больше не откроют.

Методология

  • Источник данных: анонимизированные логи запросов к AI-сервису, 122 346 записей

  • Период: июнь — декабрь 2025 (7 полных месяцев)

  • Компания: образовательная, ~500 сотрудников (профиль изменён для защиты данных)

  • Курс: 78.2 руб/$ — ЦБ РФ на 08.01.2026

  • Средняя зарплата: 80 000 руб/мес — расчёт ФОТ/численность

Данные без января 2026 — новогодние каникулы, неполная неделя, 1 112 запросов от 47 человек. Выбросы искажали бы картину.

Итоги

AI для 500 человек стоит меньше одной годовой зарплаты. Меньше одной!

85% компаний этого не делают и ошибаются в бюджете на 10%+. 95% AI-пилотов не показывают ROI.

Вот так это выглядит!