Anthropic расширила медицинские возможности Claude — флагманская модель Opus 4.5 набрала 92,3% на агентском бенчмарке MedAgentBench от Стэнфорда, и компания решила дать ей доступ к реальным данным о здоровье пользователей. Это продолжение октябрьского запуска Claude for Life Sciences, но теперь фокус сместился с лабораторий на клиники и обычных людей.

MedAgentBench — это симуляция реальных задач врача: работа с электронными медкартами, назначение анализов, выписка рецептов. Еще год назад лучшие модели справлялись с ним на 70%. Opus 4.5 с расширенным мышлением показал 92,3% — почти потолок. На втором бенчмарке, MedCalc, измеряющем точность медицинских расчетов, результат скромнее: 61,3% против 21,8% у Sonnet 3.5. Anthropic также сослалась на внутренние тесты, показывающие снижение галлюцинаций.
Подписчики Claude Pro и Max в США теперь могут подключить к модели свои данные о здоровье. Запущены интеграции с HealthEx (агрегатор медкарт) и Function (сервис расширенного тестирования), на этой неделе в бета-версии появятся Apple Health и Android Health Connect через мобильные приложения. Claude сможет читать результаты анализов, объяснять их простым языком, находить паттерны в фитнес-метриках и формулировать вопросы для визита к врачу.
Anthropic подчеркивает, что интеграции «приватны по дизайну»: пользователь сам выбирает, какие данные передавать, и может отключить доступ в любой момент. Данные не используются для обучения моделей. Claude будет добавлять дисклеймеры и направлять к врачам за персональными рекомендациями — по крайней мере, так обещает компания.
Это уже второй за три месяца крупный шаг Anthropic в медицину. В октябре компания запустила инструменты для ученых, теперь добавила решения для страховщиков, клиник и пациентов. Среди партнеров — Sanofi, Novo Nordisk, Banner Health. Интеграции с персональными данными пока работают только в США, но направление очевидно: Anthropic хочет, чтобы Claude стал посредником между человеком и его здоровьем.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
