Как стать автором
Обновить
102.89

ИИ против болезней: как машинное обучение меняет медицину

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров1.1K

Здравоохранение переживает беспрецедентную трансформацию. За последние шесть лет глобальные расходы на медицину выросли с $6–7 трлн до более чем $12 трлн, а в США они уже составляют 17% ВВП, увеличиваясь вдвое быстрее экономического роста. В условиях такого взрывного роста затрат именно технологии машинного обучения становятся ключевым инструментом оптимизации медицинских процессов.

От диагностики заболеваний до предсказания пространственной структуры белков — ML-системы уже сегодня меняют подходы к решению стандартных вопросов. При этом речь уже не идет об экспериментальных разработках — многие решения активно применяются в клинической практике и показывают впечатляющие результаты. Об этих решениях и пойдет речь в нашей статье.

Текущий ландшафт ML в медицине

Интерес к машинному обучению в медицине растет экспоненциально. По данным PubMed, если в начале 2000-х годов ML упоминалось в единичных клинических исследованиях, то к 2021 году каждая четвертая статья по диагностической точности в ведущих медицинских журналах фокусируется на применении ML-алгоритмов. При этом годовой прирост публикаций с использованием ML составляет 39% против 8% для традиционных исследований.

Синяя линия — клинические исследования на тему «диагноз», опубликованные в PubMed с 2000 по 2021 год. Зеленая линия — часть этих исследований, в названии или аннотации которых упоминается «машинное обучение», «искусственный интеллект» или «глубокое обучение». Источник
Синяя линия — клинические исследования на тему «диагноз», опубликованные в PubMed с 2000 по 2021 год. Зеленая линия — часть этих исследований, в названии или аннотации которых упоминается «машинное обучение», «искусственный интеллект» или «глубокое обучение». Источник изображения

Впрочем, путь от исследовательских прототипов к реальным клиническим инструментам оказался сложнее, чем ожидалось. Разработчики столкнулись с множеством вызовов: от недостаточной прозрачности моделей и регуляторных ограничений до дефицита качественных датасетов. 

Тем не менее, последние годы показывают, что индустрия находит способы преодолевать эти барьеры. ML-системы уже работают в клиниках, помогая врачам в диагностике, обработке медицинской документации и даже в разработке новых лекарств. Давайте рассмотрим самые интересные примеры.

Автоматизация диагностики и скрининга

Диагностика остается одним из самых ресурсоемких процессов в медицине: анализ гистологических изображений, оценка биомаркеров, расшифровка КТ и МРТ требуют колоссальных временных затрат и высочайшей квалификации специалистов. ML-системы не только автоматизируют рутинные аспекты этих процессов, но и помогают выявлять паттерны, которые может упустить человеческий глаз.

Анализ гистологических изображений для диагностики рака

Оценка биомаркеров при раке молочной железы требует дополнительных иммуногистохимических (IHC) и гибридизационных (ISH) исследований — это заметно удлиняет диагностику и повышает ее стоимость. Исследователи из Panakeia Technologies предложили решение — систему PANProfiler, способную определять статус ключевых биомаркеров непосредственно по H&E-окрашенным гистологическим срезам.

Результат работы системы. Источник
Результат работы системы. Источник изображения

Система демонстрирует возможности ML в анализе статуса ключевых биомаркеров рака груди: эстрогеновых рецепторов (ER), прогестероновых рецепторов (PR) и HER2. Техническое ядро PANProfiler построено на основе сверточных нейронных сетей (CNN) и включает несколько этапов:

  • Разбиение изображения на тайлы размером 256×256 пикселей.

  • Фильтрация фоновых участков с помощью анализа стандартного отклонения.

  • Сегментация опухолевой ткани для исключения нерелевантных областей.

  • Нормализация цвета и яркости по методу Macenko.

  • Классификация с использованием ансамбля предобученных CNN-моделей.

В ходе клинической валидации, проведенной на 648 независимых случаях для ER и PR и 560 случаях для HER2, решение показало точность 87% для определения статуса эстрогеновых рецепторов, 83% для PR и 87% для HER2. При этом система способна определить, когда она недостаточно уверена в прогнозе, и передать такие случаи врачу.

Диагностика сердечно-сосудистых заболеваний

Оценка состояния коронарных артерий и выявление ишемии миокарда остаются важными задачами кардиологии. Обычные методы диагностики либо недостаточно информативны, либо инвазивны. Компания Cleerly разработала комплексное решение, объединяющее две технологии: платформу Comprehensive Care Management и систему ISCHEMIA.

Платформа Comprehensive Care Management

Платформа использует алгоритмы машинного обучения для анализа данных коронарной КТ-ангиографии (CCTA). Система строит 3D-модель коронарных артерий, измеряет их просвет и толщину стенок, локализует стенозы и количественно оценивает атеросклеротические бляшки. Алгоритмы обучены на более чем 10 миллионах изображений от 40 000 пациентов.

Интерфейс платформы. Источник
Интерфейс платформы. Источник изображения

В клинических испытаниях система продемонстрировала результаты, сопоставимые с данными внутрисосудистого ультразвука (IVUS), спектроскопии в ближней инфракрасной области (NIRS), фракционного резерва кровотока (FFR), оптической когерентной томографии (OCT) и количественной коронарной ангиографии (QCA). Интеграция платформы осуществляется через специальный шлюз, который обеспечивает защищенную передачу данных между медицинскими учреждениями и облачным сервисом.

Система ISCHEMIA

ISCHEMIA представляет собой специализированную ML-систему для оценки вероятности коронарной ишемии на уровне отдельных сосудов. Система анализирует 37 параметров состояния сердца и использует эти данные для прогнозирования значений фракционного резерва кровотока (FFR).

Принцип работы ISCHEMIA. Система анализирует коронарные сосуды и рассчитывает индекс Cleerly ISCHEMIA (CII). Он помогает определить вероятность ишемии, сравнивая данные с порогом, эквивалентным инвазивным показателям FFR (>0,80 — ишемия маловероятна; ≤0,80 — вероятна). Источник
Принцип работы ISCHEMIA. Система анализирует коронарные сосуды и рассчитывает индекс Cleerly ISCHEMIA (CII). Он помогает определить вероятность ишемии, сравнивая данные с порогом, эквивалентным инвазивным показателям FFR (>0,80 — ишемия маловероятна; ≤0,80 — вероятна). Источник изображения

Эффективность системы подтверждена несколькими крупными клиническими исследованиями. В проспективном многоцентровом исследовании CREDENCE (n=612) система продемонстрировала более высокую диагностическую точность по сравнению с FFRCT и стресс-тестами при оценке 868 инвазивных измерений FFR. В исследовании PACIFIC система показала AUC 0.91 на уровне пациента, что сопоставимо с FFRCT (0,90) и ПЭТ (0,88), и значительно превосходит ОФЭКТ (0,71).

Интересны результаты исследования CERTAIN, где использование системы привело к изменению диагноза и тактики ведения у 57,1% из 750 последовательных пациентов. При этом наблюдалось изменение оценки CAD-RADS у 39,3% пациентов, плана вмешательств у 16,9% и схемы медикаментозной терапии у 23,1% пациентов.

Оптимизация медицинской документации и коммуникации

Знаете ли вы, сколько времени врачи тратят на заполнение документов? Согласно отчету Medscape за 2023 год, в среднем 15,5 часов в неделю уходит на бумажную работу и административные задачи. Для некоторых специальностей эта цифра еще выше: физиотерапевты тратят 19 часов, неврологи и онкологи —18 часов, а семейные врачи — 17 часов в неделю. Время, которое могло бы быть потрачено на пациентов, уходит на рутинную документацию.

Индустрия не могла игнорировать эту проблему, и за последние годы появился ряд ML-решений, способных автоматизировать работу с медицинской документацией. 

Автоматизация врачебной документации

Рутинное заполнение документации давно превратилось в одну из главных причин профессионального выгорания врачей. Когда внимание доктора сосредоточено на компьютере, а не на пациенте, это негативно влияет на качество коммуникации и, как следствие, на эффективность лечения. Возможное решение проблемы — система Ambient AI scribes, разработанная для автоматизации ведения медицинских записей и снижения нагрузки на врачей.

Технология использует микрофон смартфона для транскрипции врачебных консультаций в реальном времени, автоматически преобразуя речь в структурированные медицинские записи.

За первые десять недель использования 3442 врача применили систему в более чем 303 000 консультациях. При этом 968 медиков использовали Ambient AI как минимум в 100 случаях, а один врач — в 1210 консультациях. Статистический анализ показал, что время на работу с документацией сократилось: пользователи системы стали проводить намного меньше времени за работой с электронными медицинскими картами вне стандартных рабочих часов (с 7:00 до 19:00) по сравнению с контрольной группой.

Анализ качества расшифровок визитов, созданных искусственным интеллектом, показал высокие результаты по всем 10 параметрам. Для оценки использовались 35 случайно выбранных записей по разным клиническим специальностям. (источник изображения)
Анализ качества расшифровок визитов, созданных искусственным интеллектом, показал высокие результаты по всем 10 параметрам. Для оценки использовались 35 случайно выбранных записей по разным клиническим специальностям. Источник изображения

Качество автоматически генерируемых записей оценивалось по модифицированной шкале PDQI-9 с десятью параметрами. Анализ 35 транскриптов показал средний балл 48 из 50 возможных, с особенно высокими оценками по таким критериям, как отсутствие предвзятости, внутренняя согласованность и лаконичность. Впрочем, иногда система все же допускает ошибки (например, может принять планируемые процедуры за уже выполненные).

Интеллектуальная обработка медицинских текстов

Каждый день медицинские учреждения генерируют терабайты текстовых данных: электронные медицинские карты, научные статьи, инструкции к лекарствам, диагностические записи. В этом массиве информации нужно точно распознавать и классифицировать медицинские термины: названия болезней, лекарств, симптомов. BioBERT — специализированная языковая модель, разработанная именно для этой задачи.

В основе BioBERT лежит технология распознавания именованных сущностей (named entity recognition, NER) с использованием двунаправленного кодировщика на основе трансформеров. В отличие от стандартных языковых моделей, BioBERT обучена на биомедицинских текстах, что позволяет ей точнее понимать профессиональную терминологию. В сравнительных экспериментах на датасете MIMIC-III (более 40 000 реальных медицинских записей) система показала точность 89,8% и F1-score 87,6%, существенно превзойдя другие модели, включая BERT (82,5% и 81,0%) и ClinicalBERT (85,2% и 83,5%).

Помимо высокой точности распознавания, важным преимуществом BioBERT является встроенная защита конфиденциальных данных. Система работает с деидентифицированными текстовыми векторами, что позволяет извлекать полезную информацию без риска раскрытия личных данных пациентов. Это особенно важно в контексте строгих требований к безопасности медицинской информации.

Анализ медицинского мышления

Как оценить реальную глубину понимания медицинских концепций искусственным интеллектом? Стандартные тесты с множественным выбором не дают полной картины, а высокие результаты могут быть следствием простого распознавания паттернов, а не настоящего клинического мышления. Исследователи разработали систему MedG-KRP для визуализации и анализа медицинских рассуждений ML-моделей.

MedG-KRP строит графы знаний, отражающие понимание моделью причинно-следственных связей в медицине. Начиная с одного медицинского концепта, система рекурсивно расширяет граф, определяя причины и следствия. В сравнительном исследовании трех моделей (GPT-4, Llama3-70b и PalmyraMed-70b) на 20 различных медицинских состояниях эксперты оценивали точность и полноту построенных графов. GPT-4 показала лучшие результаты по обоим параметрам (3,37/4.0 за точность и 3,23/4,0 за полноту), тогда как специализированная медицинская модель PalmyraMed неожиданно продемонстрировала более слабые показатели (3,13 и 2,97 соответственно).

Любопытно, что PalmyraMed генерировала более специфичные медицинские концепты, но хуже справлялась с различением прямых и косвенных причинно-следственных связей. Вывод: даже модели, настроенные специально для медицинских задач, могут уступать универсальным системам в понимании сложных клинических взаимосвязей. 

Поддержка клинических исследований

Клинические исследования сильно тормозят процесс разработки лекарств. Согласно статистике, около 80% испытаний задерживаются или закрываются из-за проблем с набором пациентов, а 37% исследовательских центров не могут набрать нужное количество добровольцев. При этом каждый день задержки обходится фармкомпаниям в сумму от $600 000 до $8 млн.

ML-системы предлагают радикальное решение этого вопроса, автоматизируя не только поиск подходящих участников, но и другие аспекты проблемы.

Ускорение набора пациентов в клинические исследования 

Традиционный поиск участников клинических исследований напоминает поиск иголки в стоге сена: исследователям приходится вручную просматривать тысячи медицинских карт, сопоставляя каждую с десятками критериев включения и исключения. Deep 6 AI предложила новый подход к этой проблеме.

Технически система работает на двух уровнях. Первый — обработка структурированных данных: кодов МКБ-10 и LOINC, а также стандартизированных полей вроде возраста или пола. Второй, более сложный уровень — анализ неструктурированной информации: клинических заметок, результатов лабораторных исследований, описаний изображений. Система картирует эти данные по более чем 120 онтологиям, создавая динамические «графы пациентов» для точного сопоставления с критериями исследований.

С помощью единого интерфейса можно запрашивать данные из миллионов электронных медицинских карт, чтобы искать пациентов с определенными генетическими маркерами. Это позволяет оперативно подбирать пациентов для участия в онкологических клинических испытаниях. Источник
С помощью единого интерфейса можно запрашивать данные из миллионов электронных медицинских карт, чтобы искать пациентов с определенными генетическими маркерами. Это позволяет оперативно подбирать пациентов для участия в онкологических клинических испытаниях. Источник изображения

В онкологических исследованиях платформа анализирует данные о 19 000 генах и поддерживает поиск по множеству типов мутаций (например, дупликации и делеции), охватывая более 30 000 локус-специфичных мутаций. Это особенно важно, учитывая, что около 80% информации о геномных маркерах содержится в неструктурированных отчетах и заметках врачей. 

По данным компании, использование системы позволяет находить на 25% больше подходящих пациентов, при этом 15–20% участников обнаруживаются только благодаря анализу неструктурированных данных.

ИИ-системы в управлении данными клинических исследований

В ходе клинических исследований накапливаются большие объемы разнородных данных: описания симптомов, процедур, побочных эффектов, истории болезни и сопутствующих медикаментов. Все эти данные требуют кодирования по стандартным словарям вроде MedDRA и WHODrug для соответствия требованиям регуляторов. Medidata разработала систему, автоматизирующую этот процесс.

В основе решения лежат ML-алгоритмы, обученные на более чем 60 миллионах решений профессиональных медицинских кодировщиков: 30+ миллионов для MedDRA и столько же для WHODrug. Система не только предсказывает подходящие коды для новых терминов, но и оценивает уверенность в своих предсказаниях как высокую, среднюю или низкую. При высоком уровне уверенности точность достигает 96% для MedDRA и 92% для WHODrug, а время кодирования сокращается с 5 минут до нескольких секунд на термин.

Список задач кодирования в Rave Coder+, показывающий стенограммы, прогнозы кодирования, созданные алгоритмом, и соответствующий уровень достоверности. Источник
Список задач кодирования в Rave Coder+, показывающий стенограммы, прогнозы кодирования, созданные алгоритмом, и соответствующий уровень достоверности. Источник изображения

Помимо кодирования, система выполняет сверку данных из разных источников. Она оценивает и ранжирует сложные связи между побочными эффектами, сопутствующими медикаментами и историей болезни, автоматически выявляя потенциальные несоответствия. Это не только экономит время на ручной проверке, но и снижает риск пропуска важных расхождений в данных.

Ускорение разработки лекарств

Самое сложное в разработке новых лекарств — не стать жертвой статистики. Только 10–15% препаратов, дошедших до клинических исследований, получают одобрение регуляторов. Причины могут быть разными: от недостаточной эффективности и побочных эффектов до проблем с методологией исследований и экономической целесообразностью. Но что, если ML поможет изменить эти цифры?

Поиск мишеней для лекарств

Поиск мишеней для нового лекарства требует множества лабораторных экспериментов, которые отнимают время и ресурсы. Чтобы ускорить выявление перспективных мишеней, группа китайских ученых предложила предсказательный алгоритм COMET, сочетающий анализ сходства лигандов, молекулярный докинг и предсказание аффинности с использованием искусственного интеллекта. 

Фреймфорк алгоритма COMET. Источник
Фреймфорк алгоритма COMET. Источник

Система работает с базой из 2 685 терапевтических мишеней и почти миллиона известных взаимодействий белок-лиганд. В отличие от других платформ, COMET не просто предсказывает мишени, но и показывает, как именно молекула может с ними взаимодействовать. При тестировании на 500 тщательно отобранных соединениях с как минимум двумя подтвержденными мишенями система правильно определила 72,18% всех известных мишеней, причем для 77,8% молекул как минимум одна истинная мишень попадала в топ-15 предсказаний.

Интересно, что в основе успеха COMET лежит комбинация разных подходов. Система сначала использует классические методы анализа сходства лигандов для первичного скрининга, затем применяет графовую нейросеть PLANET для предсказания аффинности и проводит молекулярный докинг с помощью AutoDock Vina. Финальный рейтинг мишеней формируется алгоритмом машинного обучения, который учитывает все эти факторы.

Моделирование взаимодействия белок-лиганд

Чтобы создать новое лекарство, нужно сначала понять, как именно оно будет взаимодействовать со своей мишенью в организме. FlowDock превращает этот процесс из многомесячного марафона дорогостоящих экспериментов в 39-секундный анализ на обычном компьютере. 

Обзор моделирования распределения биомолекул с помощью FlowDock. Источник
Обзор моделирования распределения биомолекул с помощью FlowDock. Источник

Система использует геометрическое сопоставление потоков для одновременного предсказания структуры комплекса белок-лиганд и силы их взаимодействия. На тестовом наборе из 363 комплексов точность предсказания структуры достигает 51% — это второй показатель после Chai-1, модели в 10 раз большего размера. При этом FlowDock потребляет всего 25.6 ГБ видеопамяти, тогда как другим системам необходимо до 73 ГБ и от 88 до 3443 секунд на один анализ.

В предсказании силы связывания FlowDock и вовсе стал лучшим: корреляция Пирсона 0,705 и среднеквадратичная ошибка 1,363 на стандартном наборе PDBBind. Эффективность системы подтвердилась и в «боевых» условиях: на соревновании CASP16 FlowDock вошел в топ-5 систем по предсказанию взаимодействий белок-лиганд для фармацевтически значимых мишеней, став единственной гибридной моделью среди финалистов.

Предсказание пространственной структуры белка 

Определение 3D-структуры белков и их комплексов — ключевой этап в разработке лекарств. В 2021 году DeepMind выпустила AlphaFold 2 — нейросеть, которая совершила прорыв в предсказании белковых структур. Однако моделирование белковых комплексов с лигандами, нуклеиновыми кислотами и модифицированными аминокислотами по-прежнему оставалось нерешенной задачей. В мае 2024 года компания представила AlphaFold 3 — новое поколение системы, способное предсказывать структуры всех этих молекул в рамках единой архитектуры.

Примеры предсказанных структур. Источник
Примеры предсказанных структур. Источник

Главное нововведение AF3 — переход на диффузионную архитектуру, которая позволяет напрямую предсказывать координаты атомов. Инженеры DeepMind существенно упростили обработку множественных выравниваний последовательностей, заменив сложный блок evoformer на более эффективный pairformer. 

В тестах на наборе PoseBusters AF3 значительно превзошел классические методы докинга, даже не используя информацию о структуре белка, которая обычно необходима таким инструментам. При этом система демонстрирует высокую точность и для других типов взаимодействий, включая комплексы белок-антитело, где точность предсказаний растет с увеличением числа используемых моделей до 1000.

Время расчета на GPU V100 составляет около минуты для белков длиной 256 остатков, 1,1 минуты для 384 остатков и 2,1 часа для последовательностей длиной 2500 остатков. Такая производительность делает возможным массовый анализ белковых комплексов в масштабах целых протеомов.

Хочется также упомянуть открытую базу данных AlphaFold DB — совместный проект DeepMind и Европейского института биоинформатики (EMBL-EBI). 

В ней собрано более 200 миллионов предсказанных структур, включая полные протеомы человека и 47 других модельных организмов. База интегрирована с UniProt и предоставляет свободный доступ к структурным данным для исследователей по всему миру.

Настоящее и будущее ML в медицине 

Медицинское сообщество долгое время скептически относилось к внедрению ML-систем в клиническую практику. И дело не только в консерватизме врачей — алгоритмы действительно страдали от фундаментальных ограничений. Главное из них получило название «distributional shift»: ML-модели оказались неспособны адаптироваться к изменению контекста и продолжали выдавать ошибочные результаты в нестандартных ситуациях.

В отличие от врача, который может распознать пробел в своих знаниях и скорректировать тактику, алгоритмы упорно следуют заложенным паттернам. Именно поэтому развитие идет по пути создания узкоспециализированных систем (Artificial Narrow Intelligence) для решения конкретных задач — от анализа рентгеновских снимков до подбора схем лечения. Попытки создать универсальный ИИ, способный работать в любом контексте на качественном уровне (Artificial General Intelligence), пока остаются в целях на будущее.

Впрочем, даже в текущем виде ML-системы уже трансформируют медицину. Они берут на себя рутинные задачи вроде скрининга и базовой диагностики, позволяя врачам сосредоточиться на действительно важных и сложных задачах.

Успешные примеры внедрения, которые мы рассмотрели, показывают, что потенциал технологии раскрывается только при правильном подходе к разработке. Создание медицинских ML-систем требует глубокого понимания как технической стороны вопроса, так и специфики отрасли. Важно не просто разработать алгоритм, но и обеспечить его надежность, прозрачность и соответствие строгим медицинским стандартам. Особенно критичны вопросы надежности и прозрачности решений: когда речь идет о здоровье людей, цена ошибки слишком высока.

Будущее медицины за синергией человеческого опыта и технологических возможностей. Машинное обучение поможет врачам сфокусироваться на главном — общении с пациентами и принятии сложных клинических решений, освободив их от рутинных задач. А значит, впереди нас ждет медицина, которая станет более персонализированной, эффективной и доступной для каждого.

На этом у нас все. Делитесь своим мнением в комментариях, будем рады услышать ваше видение на будущее ML в медицинской сфере. 

Теги:
Хабы:
+11
Комментарии2

Публикации

Информация

Сайт
magnus-tech.ru
Дата регистрации
Дата основания
2017
Численность
201–500 человек
Местоположение
Россия

Истории