Почему научные статьи?
Чтобы понять, какие технологии будут определять рынок завтра, компании опираются на прогнозы/отчёты аналитиков или (за рубежом) анализируют патенты. Но есть источник, который часто опережает и патенты - научные публикации. Именно в лабораториях и университетах появляются методы, которые через год-два становятся основой RnD бизнеса, а затем - реальными продуктами.
Однако этот потенциал почти не используется: академические работы компании анализируют крайне редко (и даже если это происходит – это ручной труд), обычно просто читают как теорию. Мой подход как раз в том, чтобы искать в статьях ранние сигналы практической применимости и инсайты для бизнеса: многие статьи уже содержат результаты A/B-тестов и конкретные метрики качества (RMSE, AUC, NDCG). В итоге можем не просто отследить появление нового метода, но и сразу оценить его потенциальный эффект.
Как построен анализ
Для этого исследования я взяла фокус на все научные материалы 2025 года с присвоенным doi. Чтобы анализ был релевантен для бизнеса, из выборки были исключены направления без прямого коммерческого применения (астрономия, философия, история, дендрология, зоотехника и т.д.). В итоге целевой датасет содержал 134195 публикации из научных журналов и сборников конференций.
Для обработки полученного массива данных был разработан такой пайплайн:
Данные получены через API крупных научных индексов, поиск выполнен по англоязычным метаданным - серьёзные локальные научные центры в обязательном порядке предоставляют метаданные на этом lingua franca науки. 95,7% материалов оказалось на английском языке, оставшаяся часть пришлась на материалы, которые потребовали приведения к единому англоязычному формату — это минимизирует потери перевода и делает сравнение корректным. Дедупликация выполнялась по doi; в данном корпусе doi присутствует у 100% записей и уникален. Дополнительно провела контроль по нормализованному заголовку - дубликаты не обнаружены.
Корпус статей был преобразован в эмбеддинги и затем кластеризован по смысловой близости. Один из вызовов при работе с таким разнородным массивом данных - подобрать оптимальное число кластеров и подкластеров. Стандартные метрики такие как силуэт крайне медленны на больших данных. Поэтому применила свою модификацию, основанную на псевдосилуэтной оценке, которая позволила добиться высокой точности при на порядок меньших вычислительных затратах. Названия кластеров/подкластеров автоматически формировались из эмбеддингов (по центроидам и характерным признакам), чтобы обобщать общую направленность отнесённых к ним статей. Для сглаживания пограничных эффектов взята батч-обработка с перекрытием. Точечная ревизия материалов на границах кластеров и сопоставление внутрикластерной/межкластерной близости показали, что темы очерчены корректно. Итог - 34 кластера с подкластерной структурой разной численности.
LLM использовалась для интерпретации кластеров и подкластеров на уровне топ-10 релевантных статей; корректность проверялась RAG-поиском и порогом косинусной близости.
Ограничения
для оптимизации процесса фокус был смещён на названия и аннотации — возможность существенно сократить объём под анализ, сохранив ключевую информацию;
интерпретация кластеров и подкластеров с помощью LLM на уровне топ-10 релевантных статей;
локальная машина – RTX 5080 и Intel Ultra 9

Все вычисления выполнены локально. LLM использовалась только для резюмирования выбранных фрагментов, чтобы не превышать окно контекста.

Наука → ROI: где деньги, Карл?

Вверху сосредоточены зоны с наибольшим количеством готовых практик. Как использовать? Выбирайте 2–3 рычага, где вы уже сейчас можете собрать данные и быстро измерить эффект (выручка/затраты/скорость/качество).
Ниже стек 2025 года

Чтобы понять, какие подходы, алгоритмы, архитектуры сейчас наиболее востребованы, собрала статистику по частоте их упоминаний. Что это значит на практике? Чем выше метод, тем больше шансов найти готовые кейсы и сильные компетенции на рынке.

В твёрдой тройке госсектор, энергетика и производство.

Здесь видно, где метод/подход чаще пришит к нужному эффекту. Прогнозирование чаще всего нацелено на выручку и минимизацию рисков, а оптимизация маршрутов (VRP) — на сокращение затрат и соблюдение сроков (SLA).

График показывает, как часто вместе с технологией обсуждают её эксплуатацию, A/B-тесты, контроль затрат. Этот показатель считаю маркером, отображающим близость технологии к реальному бизнесу.
Как использовать? Фильтруйте технологии по этим индексам. Если у темы высокие показатели, закладывайте в пилотный проект процессы A/B-тестирования, мониторинга и контроля затрат – для этого уже есть готовые практики.

Обучение с подкреплением (RL) – область машинного обучения, где агент обучается принимать оптимальные решения через взаимодействия с динамической средой. Один из наиболее любопытных для меня алгоритмов, так как наиболее близок моему восприятию мира и человека в нём (все мы агенты, которых полирует среда).
Как минимум в науке у RL есть две явные точки приложения, где он уже стал прикладным инструментом: оптимизация логистики (VRP) и рекомендации. Если ищете, где его опробовать с максимальной отдачей, начинайте отсюда.

Рост зелёных тем – прямой ответ на давление регуляторов и рынка.

Здесь видим, где в области компьютерного зрения находятся самые понятные и выгодные задачи. Когда речь идёт о визуальном контроле качества, в подавляющем большинстве случаев это касается поиска физических недостатков: аномалий, дефектов и проблем с сегментацией. Это самая зрелая область, где ROI считается напрямую через снижение брака и ускорение производственной линии.

Этот график показывает два главных поля битвы в мире поиска аномалий: классический антифрод и графовую аналитику, которая ищет аномалии в связях. Именно графы стали ключевым оружием против современного фрода, который все чаще представляет собой не отдельные подозрительные события, а целые сети. Поэтому сегодня графовая аналитика – не просто метод, а самостоятельное и критически важное направление.

Споры о том, как мерить успех, в большинстве случаев уже решены. Наличие этих стандартов сильно упрощает согласование целей и оценку результатов.

График выше выделяет направления, которые служат связующим звеном между разными областями. Именно они дают максимальный мультипликативный эффект: решение, созданное в такой области, можно легко переиспользовать в других проектах. Вывод для бизнеса: инвестиции в такие мосты, как управление рисками или оптимизация цепочек поставок, создают фундамент для всей AI-стратегии компании.

Здесь видно, насколько сфокусировано или распылено внимание исследователей внутри одной большой темы (да, индекс Херфиндаля – экономический показатель концентрации рынка. Но в данном материале использую его для оценки концентрации исследовательского интереса: высокий HHI – все ученые сфокусированы на одной узкой подзадаче, низкий – наоборот). Вывод из графика: где тема собрана – масштабируйте; где расфокус – пилотируйте нишевые кейсы.

Можно начинать с тех методов, которые чаще фигурируют в вашем домене.

Сравниваем, сколько статей описывают технологию (обзоры, фреймворки), а сколько – её реальное применение (кейсы, внедрения).

Теперь к вопросу защиты данных. Вот и смещение фокуса от обсуждения проблемы приватности к конкретным реализациям. Высокая доля on-device/edge – косвенный признак операционной зрелости. Федеративное обучение также значительно опережает простое обсуждение проблемы.
Линии, которые бьют в P&L
Оптимизация логистики и расписаний (VRP) – на тепловой карте видим, что VRP/расписания напрямую связывают со снижением OPEX и повышением пропускной способности
Прогнозирование спроса для управления запасами – по рейтингу бизнес-рычагов управление запасами (inventory и supply chain) и прогнозирование – одни из самых зрелых и влиятельных областей для внедрения
Персонализация через рекомендательные системы – на тепловой карте явно даёт о себе знать и это направление
3 новых ниши на стыках, которые ещё не проявили себя
Как искала: выявляла по две зрелые, хорошо проработанные технологии, которые пока редко используются вместе. Это позволяет создавать новые решения, но с предсказуемым результатом, так как их компоненты уже проверены по отдельности.
RAG + Causal для аудита решений – ассистент, который не только цитирует источники, но и проверяет причинный эффект решения (DiD/IV/uplift) на исторических данных
Где: финансы/страхование/гос-политики/комплаенс
KPI: снижение потерь от неверных решений, скорость согласованияГрафовые рекомендации поставщиков (GNN × Recsys × Risk) – B2B-рекомендации поставщиков с графовым слоем риска (фрод/санкции/надежность) и объяснимостью
Где: производство/ритейл/фарма/госсектор
KPI: снижение времени и риска закупок, экономия на отказахCopilot по инцидентам (TS-прогноз × Vector Search) – не просто обнаруживаем аномалию во временном ряду (TS-прогноз), но и находим в базе похожие инциденты из прошлого, предлагая готовые сценарии решения
Где: банки/телко/промышленность/энергетика
KPI: снижение инцидентов повторного типа
Бонус в виде любопытного графика для поклонников RAG

Как применять результаты анализа – компаниям/стартапам
Выберите 2-3 самые зрелые задачи в вашей отрасли
Установите одну бизнес-цель (деньги, затраты) и одну техническую (точность)
Сразу заложите A/B-тесты, мониторинг, контроль стоимости и приватность
Начните с пилота, который даст быстрый эффект (документы, цены, маршруты)
Надеюсь, представленные выводы будут полезны для принятия ваших решений.
Весь этот анализ – результат работы системы, которую я продолжаю развивать. Если вам интересно обсудить, как эти выводы применимы к вашей отрасли, или есть идеи для дальнейшего развития проекта, буду рада пообщаться.
По терминам
Основные подходы и технологии
LLM – большая языковая модель
RAG – Retrieval-Augmented Generation, генерация с подключением поиска
CV – Computer Vision – компьютерное зрение
RL – обучение с подкреплением
GNN – графовые нейросети для анализа данных в виде связей
Time-series (TS) – анализ и прогнозирование данных, упорядоченных по времени
Vector search – поиск по смысловой близости в векторном пространстве
Causal – причинно-следственный анализ (A/B, DiD, Uplift)
MLOps – набор практик аналогичный DevOps, но для машинного обучения
Privacy – методы защиты персональных данных
Edge/On-Device – вычисления прямо на устройстве без отправки данных в облако
Federated (федеративное обучение) – модель обучается на данных прямо на устройствах, не забирая их на сервер
Оптимизация моделей
Quantization (квантование) – cнижение разрядности чисел, которыми оперирует модель, чтобы она занимала меньше места и работала быстрее (без сильной потери точности)
Distillation (дистилляция) – перегонка знаний от большой, сложной модели к маленькой и быстрой. Маленькая модель учится имитировать поведение большой, становясь эффективной для реального применения
Pruning (прореживание) – удаление избыточных или маловажных связей в нейросети
LoRA – метод быстрой и дешевой дообучки больших моделей под конкретную задачу без необходимости изменять всю модель
Алгоритмы и архитектуры
Transformer – архитектура нейронных сетей, основанная на механизме внимания
LSTM – тип нейросетей для работы с последовательными данными (временные ряды, текст)
XGBoost / CatBoost – алгоритмы градиентного бустинга
N-BEATS, TFT, Autoformer, Prophet, SARIMA, ETS – модели для прогнозирования временных рядов, от статистических (SARIMA, ETS) до нейросетевых (N-BEATS, TFT)
Two-tower (двухбашенная архитектура) – архитектура для построения рекомендательных систем и поиска
Бизнес-концепции, задачи
P&L (Profit and Loss) – финансовый показатель, который показывает, зарабатывает ли компания/проект деньги
ROI (Return on Investment) – окупаемость инвестиций
VRP (маршрутизация транспорта) – классическая задача оптимизации, цель – найти самые короткие и дешевые маршруты, чтобы обслужить всех клиентов. Включает варианты с окнами доставки (VRPTW) и для электромобилей (EV-VRP)
Fraud / Anomaly Detection (поиск мошенничества/аномалий) – поиск нетипичных событий и паттернов в данных, которые могут указывать на мошеннические операции, сбои оборудования или другие проблемы
Recsys (рекомендательные системы) – системы, которые предсказывают предпочтения пользователя и предлагают ему релевантные товары, услуги, контент итд
HHI (индекс Херфиндаля) – экономический показатель концентрации рынка. Но в данном материале использую его для оценки концентрации исследовательского интереса: высокий HHI означает, что все ученые сфокусированы на одной узкой подзадаче, низкий — интерес распылен
Метрики
Accuracy – доля правильных ответов модели
Precision и Recall – метрики для задач классификации
F1 – гармоническое среднее между Precision и Recall
AUC (Area Under the Curve) – показывает, насколько хорошо модель способна разделять классы
RMSE / MAE / MAPE – метрики для оценки ошибок в задачах прогнозирования чисел, показывают среднее отклонение прогнозов от реальных значений
NDCG / Recall@k – метрики качества для систем ранжирования