
Здравоохранение переживает беспрецедентную трансформацию. За последние шесть лет глобальные расходы на медицину выросли с $6–7 трлн до более чем $12 трлн, а в США они уже составляют 17% ВВП, увеличиваясь вдвое быстрее экономического роста. В условиях такого взрывного роста затрат именно технологии машинного обучения становятся ключевым инструментом оптимизации медицинских процессов.
От диагностики заболеваний до предсказания пространственной структуры белков — ML-системы уже сегодня меняют подходы к решению стандартных вопросов. При этом речь уже не идет об экспериментальных разработках — многие решения активно применяются в клинической практике и показывают впечатляющие результаты. Об этих решениях и пойдет речь в нашей статье.
Текущий ландшафт ML в медицине
Интерес к машинному обучению в медицине растет экспоненциально. По данным PubMed, если в начале 2000-х годов ML упоминалось в единичных клинических исследованиях, то к 2021 году каждая четвертая статья по диагностической точности в ведущих медицинских журналах фокусируется на применении ML-алгоритмов. При этом годовой прирост публикаций с использованием ML составляет 39% против 8% для традиционных исследований.

Впрочем, путь от исследовательских прототипов к реальным клиническим инструментам оказался сложнее, чем ожидалось. Разработчики столкнулись с множеством вызовов: от недостаточной прозрачности моделей и регуляторных ограничений до дефицита качественных датасетов.
Тем не менее, последние годы показывают, что индустрия находит способы преодолевать эти барьеры. ML-системы уже работают в клиниках, помогая врачам в диагностике, обработке медицинской документации и даже в разработке новых лекарств. Давайте рассмотрим самые интересные примеры.
Автоматизация диагностики и скрининга
Диагностика остается одним из самых ресурсоемких процессов в медицине: анализ гистологических изображений, оценка биомаркеров, расшифровка КТ и МРТ требуют колоссальных временных затрат и высочайшей квалификации специалистов. ML-системы не только автоматизируют рутинные аспекты этих процессов, но и помогают выявлять паттерны, которые может упустить человеческий глаз.
Анализ гистологических изображений для диагностики рака
Оценка биомаркеров при раке молочной железы требует дополнительных иммуногистохимических (IHC) и гибридизационных (ISH) исследований — это заметно удлиняет диагностику и повышает ее стоимость. Исследователи из Panakeia Technologies предложили решение — систему PANProfiler, способную определять статус ключевых биомаркеров непосредственно по H&E-окрашенным гистологическим срезам.

Система демонстрирует возможности ML в анализе статуса ключевых биомаркеров рака груди: эстрогеновых рецепторов (ER), прогестероновых рецепторов (PR) и HER2. Техническое ядро PANProfiler построено на основе сверточных нейронных сетей (CNN) и включает несколько этапов:
Разбиение изображения на тайлы размером 256×256 пикселей.
Фильтрация фоновых участков с помощью анализа стандартного отклонения.
Сегментация опухолевой ткани для исключения нерелевантных областей.
Нормализация цвета и яркости по методу Macenko.
Классификация с использованием ансамбля предобученных CNN-моделей.
В ходе клинической валидации, проведенной на 648 независимых случаях для ER и PR и 560 случаях для HER2, решение показало точность 87% для определения статуса эстрогеновых рецепторов, 83% для PR и 87% для HER2. При этом система способна определить, когда она недостаточно уверена в прогнозе, и передать такие случаи врачу.
Диагностика сердечно-сосудистых заболеваний
Оценка состояния коронарных артерий и выявление ишемии миокарда остаются важными задачами кардиологии. Обычные методы диагностики либо недостаточно информативны, либо инвазивны. Компания Cleerly разработала комплексное решение, объединяющее две технологии: платформу Comprehensive Care Management и систему ISCHEMIA.
Платформа Comprehensive Care Management
Платформа использует алгоритмы машинного обучения для анализа данных коронарной КТ-ангиографии (CCTA). Система строит 3D-модель коронарных артерий, измеряет их просвет и толщину стенок, локализует стенозы и количественно оценивает атеросклеротические бляшки. Алгоритмы обучены на более чем 10 миллионах изображений от 40 000 пациентов.

В клинических испытаниях система продемонстрировала результаты, сопоставимые с данными внутрисосудистого ультразвука (IVUS), спектроскопии в ближней инфракрасной области (NIRS), фракционного резерва кровотока (FFR), оптической когерентной томографии (OCT) и количественной коронарной ангиографии (QCA). Интеграция платформы осуществляется через специальный шлюз, который обеспечивает защищенную передачу данных между медицинскими учреждениями и облачным сервисом.
Система ISCHEMIA
ISCHEMIA представляет собой специализированную ML-систему для оценки вероятности коронарной ишемии на уровне отдельных сосудов. Система анализирует 37 параметров состояния сердца и использует эти данные для прогнозирования значений фракционного резерва кровотока (FFR).

Эффективность системы подтверждена несколькими крупными клиническими исследованиями. В проспективном многоцентровом исследовании CREDENCE (n=612) система продемонстрировала более высокую диагностическую точность по сравнению с FFRCT и стресс-тестами при оценке 868 инвазивных измерений FFR. В исследовании PACIFIC система показала AUC 0.91 на уровне пациента, что сопоставимо с FFRCT (0,90) и ПЭТ (0,88), и значительно превосходит ОФЭКТ (0,71).
Интересны результаты исследования CERTAIN, где использование системы привело к изменению диагноза и тактики ведения у 57,1% из 750 последовательных пациентов. При этом наблюдалось изменение оценки CAD-RADS у 39,3% пациентов, плана вмешательств у 16,9% и схемы медикаментозной терапии у 23,1% пациентов.
Оптимизация медицинской документации и коммуникации
Знаете ли вы, сколько времени врачи тратят на заполнение документов? Согласно отчету Medscape за 2023 год, в среднем 15,5 часов в неделю уходит на бумажную работу и административные задачи. Для некоторых специальностей эта цифра еще выше: физиотерапевты тратят 19 часов, неврологи и онкологи —18 часов, а семейные врачи — 17 часов в неделю. Время, которое могло бы быть потрачено на пациентов, уходит на рутинную документацию.
Индустрия не могла игнорировать эту проблему, и за последние годы появился ряд ML-решений, способных автоматизировать работу с медицинской документацией.
Автоматизация врачебной документации
Рутинное заполнение документации давно превратилось в одну из главных причин профессионального выгорания врачей. Когда внимание доктора сосредоточено на компьютере, а не на пациенте, это негативно влияет на качество коммуникации и, как следствие, на эффективность лечения. Возможное решение проблемы — система Ambient AI scribes, разработанная для автоматизации ведения медицинских записей и снижения нагрузки на врачей.
Технология использует микрофон смартфона для транскрипции врачебных консультаций в реальном времени, автоматически преобразуя речь в структурированные медицинские записи.
За первые десять недель использования 3442 врача применили систему в более чем 303 000 консультациях. При этом 968 медиков использовали Ambient AI как минимум в 100 случаях, а один врач — в 1210 консультациях. Статистический анализ показал, что время на работу с документацией сократилось: пользователи системы стали проводить намного меньше времени за работой с электронными медицинскими картами вне стандартных рабочих часов (с 7:00 до 19:00) по сравнению с контрольной группой.

Качество автоматически генерируемых записей оценивалось по модифицированной шкале PDQI-9 с десятью параметрами. Анализ 35 транскриптов показал средний балл 48 из 50 возможных, с особенно высокими оценками по таким критериям, как отсутствие предвзятости, внутренняя согласованность и лаконичность. Впрочем, иногда система все же допускает ошибки (например, может принять планируемые процедуры за уже выполненные).
Интеллектуальная обработка медицинских текстов
Каждый день медицинские учреждения генерируют терабайты текстовых данных: электронные медицинские карты, научные статьи, инструкции к лекарствам, диагностические записи. В этом массиве информации нужно точно распознавать и классифицировать медицинские термины: названия болезней, лекарств, симптомов. BioBERT — специализированная языковая модель, разработанная именно для этой задачи.
В основе BioBERT лежит технология распознавания именованных сущностей (named entity recognition, NER) с использованием двунаправленного кодировщика на основе трансформеров. В отличие от стандартных языковых моделей, BioBERT обучена на биомедицинских текстах, что позволяет ей точнее понимать профессиональную терминологию. В сравнительных экспериментах на датасете MIMIC-III (более 40 000 реальных медицинских записей) система показала точность 89,8% и F1-score 87,6%, существенно превзойдя другие модели, включая BERT (82,5% и 81,0%) и ClinicalBERT (85,2% и 83,5%).
Помимо высокой точности распознавания, важным преимуществом BioBERT является встроенная защита конфиденциальных данных. Система работает с деидентифицированными текстовыми векторами, что позволяет извлекать полезную информацию без риска раскрытия личных данных пациентов. Это особенно важно в контексте строгих требований к безопасности медицинской информации.
Анализ медицинского мышления
Как оценить реальную глубину понимания медицинских концепций искусственным интеллектом? Стандартные тесты с множественным выбором не дают полной картины, а высокие результаты могут быть следствием простого распознавания паттернов, а не настоящего клинического мышления. Исследователи разработали систему MedG-KRP для визуализации и анализа медицинских рассуждений ML-моделей.
MedG-KRP строит графы знаний, отражающие понимание моделью причинно-следственных связей в медицине. Начиная с одного медицинского концепта, система рекурсивно расширяет граф, определяя причины и следствия. В сравнительном исследовании трех моделей (GPT-4, Llama3-70b и PalmyraMed-70b) на 20 различных медицинских состояниях эксперты оценивали точность и полноту построенных графов. GPT-4 показала лучшие результаты по обоим параметрам (3,37/4.0 за точность и 3,23/4,0 за полноту), тогда как специализированная медицинская модель PalmyraMed неожиданно продемонстрировала более слабые показатели (3,13 и 2,97 соответственно).
Любопытно, что PalmyraMed генерировала более специфичные медицинские концепты, но хуже справлялась с различением прямых и косвенных причинно-следственных связей. Вывод: даже модели, настроенные специально для медицинских задач, могут уступать универсальным системам в понимании сложных клинических взаимосвязей.
Поддержка клинических исследований
Клинические исследования сильно тормозят процесс разработки лекарств. Согласно статистике, около 80% испытаний задерживаются или закрываются из-за проблем с набором пациентов, а 37% исследовательских центров не могут набрать нужное количество добровольцев. При этом каждый день задержки обходится фармкомпаниям в сумму от $600 000 до $8 млн.
ML-системы предлагают радикальное решение этого вопроса, автоматизируя не только поиск подходящих участников, но и другие аспекты проблемы.
Ускорение набора пациентов в клинические исследования
Традиционный поиск участников клинических исследований напоминает поиск иголки в стоге сена: исследователям приходится вручную просматривать тысячи медицинских карт, сопоставляя каждую с десятками критериев включения и исключения. Deep 6 AI предложила новый подход к этой проблеме.
Технически система работает на двух уровнях. Первый — обработка структурированных данных: кодов МКБ-10 и LOINC, а также стандартизированных полей вроде возраста или пола. Второй, более сложный уровень — анализ неструктурированной информации: клинических заметок, результатов лабораторных исследований, описаний изображений. Система картирует эти данные по более чем 120 онтологиям, создавая динамические «графы пациентов» для точного сопоставления с критериями исследований.

В онкологических исследованиях платформа анализирует данные о 19 000 генах и поддерживает поиск по множеству типов мутаций (например, дупликации и делеции), охватывая более 30 000 локус-специфичных мутаций. Это особенно важно, учитывая, что около 80% информации о геномных маркерах содержится в неструктурированных отчетах и заметках врачей.
По данным компании, использование системы позволяет находить на 25% больше подходящих пациентов, при этом 15–20% участников обнаруживаются только благодаря анализу неструктурированных данных.
ИИ-системы в управлении данными клинических исследований
В ходе клинических исследований накапливаются большие объемы разнородных данных: описания симптомов, процедур, побочных эффектов, истории болезни и сопутствующих медикаментов. Все эти данные требуют кодирования по стандартным словарям вроде MedDRA и WHODrug для соответствия требованиям регуляторов. Medidata разработала систему, автоматизирующую этот процесс.
В основе решения лежат ML-алгоритмы, обученные на более чем 60 миллионах решений профессиональных медицинских кодировщиков: 30+ миллионов для MedDRA и столько же для WHODrug. Система не только предсказывает подходящие коды для новых терминов, но и оценивает уверенность в своих предсказаниях как высокую, среднюю или низкую. При высоком уровне уверенности точность достигает 96% для MedDRA и 92% для WHODrug, а время кодирования сокращается с 5 минут до нескольких секунд на термин.

Помимо кодирования, система выполняет сверку данных из разных источников. Она оценивает и ранжирует сложные связи между побочными эффектами, сопутствующими медикаментами и историей болезни, автоматически выявляя потенциальные несоответствия. Это не только экономит время на ручной проверке, но и снижает риск пропуска важных расхождений в данных.
Ускорение разработки лекарств
Самое сложное в разработке новых лекарств — не стать жертвой статистики. Только 10–15% препаратов, дошедших до клинических исследований, получают одобрение регуляторов. Причины могут быть разными: от недостаточной эффективности и побочных эффектов до проблем с методологией исследований и экономической целесообразностью. Но что, если ML поможет изменить эти цифры?
Поиск мишеней для лекарств
Поиск мишеней для нового лекарства требует множества лабораторных экспериментов, которые отнимают время и ресурсы. Чтобы ускорить выявление перспективных мишеней, группа китайских ученых предложила предсказательный алгоритм COMET, сочетающий анализ сходства лигандов, молекулярный докинг и предсказание аффинности с использованием искусственного интеллекта.

Система работает с базой из 2 685 терапевтических мишеней и почти миллиона известных взаимодействий белок-лиганд. В отличие от других платформ, COMET не просто предсказывает мишени, но и показывает, как именно молекула может с ними взаимодействовать. При тестировании на 500 тщательно отобранных соединениях с как минимум двумя подтвержденными мишенями система правильно определила 72,18% всех известных мишеней, причем для 77,8% молекул как минимум одна истинная мишень попадала в топ-15 предсказаний.
Интересно, что в основе успеха COMET лежит комбинация разных подходов. Система сначала использует классические методы анализа сходства лигандов для первичного скрининга, затем применяет графовую нейросеть PLANET для предсказания аффинности и проводит молекулярный докинг с помощью AutoDock Vina. Финальный рейтинг мишеней формируется алгоритмом машинного обучения, который учитывает все эти факторы.
Моделирование взаимодействия белок-лиганд
Чтобы создать новое лекарство, нужно сначала понять, как именно оно будет взаимодействовать со своей мишенью в организме. FlowDock превращает этот процесс из многомесячного марафона дорогостоящих экспериментов в 39-секундный анализ на обычном компьютере.

Система использует геометрическое сопоставление потоков для одновременного предсказания структуры комплекса белок-лиганд и силы их взаимодействия. На тестовом наборе из 363 комплексов точность предсказания структуры достигает 51% — это второй показатель после Chai-1, модели в 10 раз большего размера. При этом FlowDock потребляет всего 25.6 ГБ видеопамяти, тогда как другим системам необходимо до 73 ГБ и от 88 до 3443 секунд на один анализ.
В предсказании силы связывания FlowDock и вовсе стал лучшим: корреляция Пирсона 0,705 и среднеквадратичная ошибка 1,363 на стандартном наборе PDBBind. Эффективность системы подтвердилась и в «боевых» условиях: на соревновании CASP16 FlowDock вошел в топ-5 систем по предсказанию взаимодействий белок-лиганд для фармацевтически значимых мишеней, став единственной гибридной моделью среди финалистов.
Предсказание пространственной структуры белка
Определение 3D-структуры белков и их комплексов — ключевой этап в разработке лекарств. В 2021 году DeepMind выпустила AlphaFold 2 — нейросеть, которая совершила прорыв в предсказании белковых структур. Однако моделирование белковых комплексов с лигандами, нуклеиновыми кислотами и модифицированными аминокислотами по-прежнему оставалось нерешенной задачей. В мае 2024 года компания представила AlphaFold 3 — новое поколение системы, способное предсказывать структуры всех этих молекул в рамках единой архитектуры.

Главное нововведение AF3 — переход на диффузионную архитектуру, которая позволяет напрямую предсказывать координаты атомов. Инженеры DeepMind существенно упростили обработку множественных выравниваний последовательностей, заменив сложный блок evoformer на более эффективный pairformer.
В тестах на наборе PoseBusters AF3 значительно превзошел классические методы докинга, даже не используя информацию о структуре белка, которая обычно необходима таким инструментам. При этом система демонстрирует высокую точность и для других типов взаимодействий, включая комплексы белок-антитело, где точность предсказаний растет с увеличением числа используемых моделей до 1000.
Время расчета на GPU V100 составляет около минуты для белков длиной 256 остатков, 1,1 минуты для 384 остатков и 2,1 часа для последовательностей длиной 2500 остатков. Такая производительность делает возможным массовый анализ белковых комплексов в масштабах целых протеомов.
Хочется также упомянуть открытую базу данных AlphaFold DB — совместный проект DeepMind и Европейского института биоинформатики (EMBL-EBI).
В ней собрано более 200 миллионов предсказанных структур, включая полные протеомы человека и 47 других модельных организмов. База интегрирована с UniProt и предоставляет свободный доступ к структурным данным для исследователей по всему миру.
Настоящее и будущее ML в медицине
Медицинское сообщество долгое время скептически относилось к внедрению ML-систем в клиническую практику. И дело не только в консерватизме врачей — алгоритмы действительно страдали от фундаментальных ограничений. Главное из них получило название «distributional shift»: ML-модели оказались неспособны адаптироваться к изменению контекста и продолжали выдавать ошибочные результаты в нестандартных ситуациях.
В отличие от врача, который может распознать пробел в своих знаниях и скорректировать тактику, алгоритмы упорно следуют заложенным паттернам. Именно поэтому развитие идет по пути создания узкоспециализированных систем (Artificial Narrow Intelligence) для решения конкретных задач — от анализа рентгеновских снимков до подбора схем лечения. Попытки создать универсальный ИИ, способный работать в любом контексте на качественном уровне (Artificial General Intelligence), пока остаются в целях на будущее.
Впрочем, даже в текущем виде ML-системы уже трансформируют медицину. Они берут на себя рутинные задачи вроде скрининга и базовой диагностики, позволяя врачам сосредоточиться на действительно важных и сложных задачах.
Успешные примеры внедрения, которые мы рассмотрели, показывают, что потенциал технологии раскрывается только при правильном подходе к разработке. Создание медицинских ML-систем требует глубокого понимания как технической стороны вопроса, так и специфики отрасли. Важно не просто разработать алгоритм, но и обеспечить его надежность, прозрачность и соответствие строгим медицинским стандартам. Особенно критичны вопросы надежности и прозрачности решений: когда речь идет о здоровье людей, цена ошибки слишком высока.
Будущее медицины за синергией человеческого опыта и технологических возможностей. Машинное обучение поможет врачам сфокусироваться на главном — общении с пациентами и принятии сложных клинических решений, освободив их от рутинных задач. А значит, впереди нас ждет медицина, которая станет более персонализированной, эффективной и доступной для каждого.
На этом у нас все. Делитесь своим мнением в комментариях, будем рады услышать ваше видение на будущее ML в медицинской сфере.