Данные реальных логов за 7 месяцев на 527 человек — что люди делают с LLM на работе и что с ними не так
Я внедрял всё это, и мы договорились, что можно использовать статистику по обезличенным логам. Это прямые подсчёты транзакций. Не прогнозы аналитиков, не презентации вендоров — а конкретные реальные логи.
Компания решила возглавить безобразие и дать всем сотрудникам внятный сервис, попробовать все модели рынка и вообще посмотреть, что это даст на практике в приросте производительности и так далее.
Они выбирали между подпиской и моделью с оплатой за токены, и, к счастью, выбрали второе.
Потому что в среднем пользователь использует LLM далеко не так, как может показаться. Если что, крупные модели показывают пользователей, но тщательно скрывают количество запросов и трафик. Потому что его там крайне мало.
Якоб Нильсен проводил исследование, что только 20% населения могут нормально сформулировать промпт. Пробуют пару раз и уходят.
Короче, за 7 месяцев с июня по декабрь 2025:
416 пользователей из 527 хоть раз потыкались
122346 запросов (в среднем 42 запроса на пользователя в месяц)
6851 доллар расходов (535 тысяч рублей, 184 руб/месяц на активного юзера)
Если бы они брали 20-долларовые подписки GPT, то получили бы то же самое в 8,5 раз дороже.
При этом мы внедряли агрегатор нейросетей, и там были картинки. 64% бюджета — генерация картинок.
Если только LLM, включая SOTA-модели вроде Gemini 3 Pro Preview, последние GPT, Gemini, последние Антропики — то было бы всего 62 рубля в месяц на пользователя.
Те, кто понял, зачем ему модель, возвращался постоянно.
В общем, заходите, расскажу, что реальные люди, если не бить их палкой, в реальном мире делают с LLM. На практике.