Наука становится всё менее человеческой; ИИ увеличивает скорость открытий

Этим летом таблетка, предназначенная для лечения хронического, пока неизлечимого заболевания лёгких, вошла в среднюю фазу испытаний на людях. Предыдущие исследования показали, что препарат безопасен при проглатывании, но улучшит ли он симптомы болезненного фиброза, на который нацелен, пока неизвестно; это и предстоит выяснить в ходе нынешних испытаний, которые, возможно, закончатся в следующем году. Такое предварительное достижение вряд ли заслуживало бы внимания, если бы не один нюанс в происхождении лекарства: это, вероятно, первое лекарство, полностью разработанное искусственным интеллектом, которое зашло так далеко в разработке.

Создатель таблетки, биотехнологическая компания Insilico Medicine, использовала сотни моделей искусственного интеллекта, чтобы найти новую мишень в организме, способную помочь в лечении фиброза, и определить, какие молекулы можно было бы синтезировать для получения лекарства. Эти программы позволили Insilico пройти путь от нуля до запуска препарата в первую фазу испытаний на людях за два с половиной года, а не за пять, как это обычно бывает. Даже если таблетка окажется бесполезной, что вполне реально, на подходе уже множество других лекарств, разработанных с помощью искусственного интеллекта. Учёные и компании надеются, что они доберутся до аптек гораздо быстрее, чем традиционные лекарства, на вывод которых на рынок обычно уходит более десяти лет, а процент неудач которых очень высок.

Медицина — лишь один из аспектов масштабных преобразований в науке. Только за последние несколько месяцев ИИ стал предсказывать тропические штормы с такой же точностью и гораздо быстрее, чем обычные модели; компания Meta¹ выпустила модель, которая может анализировать снимки мозга, чтобы воспроизвести то, на что смотрит человек; Google недавно использовала ИИ, чтобы найти миллионы новых материалов, которые могут улучшить суперкомпьютеры, электромобили и многое другое. Подобно тому, как технология стирает границы между текстом и изображениями, созданными человеком и компьютером, меняя способы работы, обучения и общения людей, инструменты ИИ ускоряют и изменяют некоторые базовые элементы науки. «Мы действительно можем совершить открытия, которые были бы невозможны без использования ИИ», — сказала мне Маринка Зитник, исследователь биомедицины и ИИ в Гарварде.

Наука никогда не была такой быстрой, как сегодня. Но внедрение ИИ также в некотором смысле делает науку менее человечной. На протяжении веков познание мира основывалось на наблюдении и объяснении. Многие из современных моделей ИИ искажают это стремление, предоставляя ответы без обоснования и заставляя учёных изучать собственные алгоритмы так же, как они изучают природу. При этом ИИ, возможно, бросает вызов самой природе открытий.

ИИ существует для того, чтобы выводить невероятно сложные закономерности из наборов данных, которые слишком велики для человека, чтобы их постичь. Это мистическое явление стало более привычным после появления ChatGPT в прошлом году. Чат-бот — инструмент, внезапно оказавшийся у каждого под рукой и, кажется, синтезирующий весь интернет, — изменил наши способы доступа к знаниям и их применения, но в то же время запятнал большую часть нашего мышления сомнениями. Мы не понимаем, как именно генеративные чат-боты с искусственным интеллектом составляют свои ответы, — только то, что они звучат удивительно по-человечески, из-за чего очень трудно понять, что теперь реально, логично или заслуживает доверия, а также является ли текст, даже наш собственный, полностью человеческим или имеет кремниевый привкус. Когда ответ оказывается осмысленным, может показаться, что он предлагает срезать путь, и не даёт истинного понимания того, как и почему он был получен.

ИИ, вероятно, делает нечто подобное в широком спектре научных дисциплин. Среди наиболее заметных научных достижений, полученных с помощью ИИ, можно назвать результаты в области молекулярной биологии от DeepMind, ведущей исследовательской лаборатории ИИ, которая теперь базируется в Google. После того как в 2016 году программа DeepMind победила в игре го — игре, которая настолько сложнее шахмат, что многие считали, что компьютеры никогда не смогут её освоить, — Демис Хассабис, генеральный директор DeepMind, рассказал мне, что он начал думать о том, как создать программу ИИ для решения задачи фолдинга белков, которая существует уже несколько десятилетий. Всевозможные биологические процессы зависят от белков, а каждый белок состоит из последовательности аминокислот. То, как эти молекулы складываются в трёхмерную форму, определяет функцию белка, и картирование этих структур может помочь учёным разработать новые вакцины, уничтожить бактерии, устойчивые к антибиотикам, и найти новые методы лечения рака. Без трёхмерной формы белка у учёных есть не более чем кучка кирпичиков Lego без инструкции по их сборке.

Раньше на определение структуры одного белка по последовательности аминокислот уходили годы. Но в 2022 году флагманская научная модель DeepMind, AlphaFold, нашла наиболее вероятную структуру почти всех известных науке белков — около 200 миллионов. Подобно шахматным программам и программам для игры в го, которые ищут наилучший возможный ход, AlphaFold перебирает множество возможных структур для последовательности аминокислот, чтобы найти наиболее вероятную. Программа сокращает до нескольких секунд работу, которая потянула бы на целую докторскую диссертацию, и её широко хвалят за «революционное влияние» как на фундаментальную биологию, так и на разработку новых методов лечения. Тем не менее независимые исследователи отмечают, что, несмотря на нечеловеческую скорость, модель не полностью объясняет, почему та или иная структура является вероятной. В результате учёные пытаются расшифровать предсказания AlphaFold, и Хассабис отметил, что эти усилия приносят хорошие результаты.

По словам Хассабиса, ИИ позволяет исследователям изучать сложные системы в «мире битов» гораздо быстрее, чем в «мире атомов», а затем физически проверять свои гипотезы уже на последнем шаге. Эта технология продвигает прогресс во многих других дисциплинах, не только повышая скорость и масштабы, но и меняя представления о том, какие исследования возможны. Например, неврологи из Мета¹ и других университетов превращают искусственные нейронные сети, обученные «видеть» фотографии или «читать» текст, в гипотезы о том, как мозг обрабатывает изображения и язык. Биологи используют искусственный интеллект, обученный на генетических данных, для изучения редких заболеваний, совершенствования иммунотерапии и лучшего понимания проблемных вариантов атипичной пневмонии (SARS-CoV-2). «Теперь у нас есть жизнеспособные гипотезы, а раньше были загадки», — сказал мне Джим ДиКарло, нейробиолог из Массачусетского технологического института, который стал пионером в использовании ИИ для изучения зрения в мозге.

Астрономы и физики используют машинное обучение для обработки массивов данных из Вселенной, которые раньше были слишком огромны, чтобы к ним прикоснуться, рассказал мне Брис Менар, астрофизик из Университета Джона Хопкинса. Некоторые эксперименты, такие как коллайдер частиц CERN, производят слишком много информации, чтобы её можно было физически хранить. Исследователи полагаются на искусственный интеллект, который отбрасывает знакомые наблюдения, сохраняя неизвестные для анализа. «Мы не знаем, как выглядит иголка, потому что это необнаруженные физические явления, но мы знаем, как выглядит стог сена, — сказал мне Александр Салай, директор Института интенсивной обработки данных при Университете Джонса Хопкинса. — Поэтому компьютеры обучены распознавать сено и, по сути, отбрасывать его».

По словам Зитника, в долгосрочной перспективе можно даже объединить модели ИИ и физические эксперименты в своего рода «самодвижущуюся лабораторию», где компьютерные программы и роботы будут генерировать гипотезы, планировать эксперименты для их проверки и анализировать результаты. До создания таких лабораторий ещё далеко, хотя прототипы уже существуют, например, роботизированная система Scientific Autonomous Reasoning Agent, которая уже обнаружила новые материалы для возобновляемых источников энергии. SARA использует лазер для итерационного анализа и изменения материалов, причём каждый цикл длится несколько секунд, рассказала мне Карла Гомес, специалист по информатике из Корнелла, что позволяет сократить время исследований с нескольких дней до нескольких часов. Если такое будущее наступит, то программное обеспечение и роботы превратятся из инструментов в коллабораторов и даже соавторов знаний.

Данных в квантовых экспериментах слишком много, чтобы их мог хранить человек, эксперименты слишком быстры, чтобы их мог проводить человек, нейронаучные гипотезы слишком сложны, чтобы их мог вывести человек — даже когда искусственный интеллект позволяет выполнять научную работу, которая раньше казалась невозможной, эти же инструменты создают эпистемическую дилемму. Они будут производить революционные знания, одновременно разрушая понятия собственно знания.

«Святой Грааль науки — это понимание, — говорит Зитник. — Чтобы понять явление, будь то поведение клетки или планетарной системы, нужно уметь определять причины и следствия». Но модели ИИ, как известно, непрозрачны. Они выявляют закономерности на основе гигантских массивов данных с помощью программных архитектур, внутреннее устройство которых не поддаётся человеческой интуиции и рассуждениям. Эксперты стали называть их «чёрными ящиками».

Это создаёт очевидные проблемы для научного метода. «Мы должны понять, что происходит внутри этого чёрного ящика, чтобы понять, откуда взялось это открытие», — сказал мне Салай. Предсказание события без понимания, почему эти предсказания точны, может переместить нас в сторону науки другого типа, в которой знания и вытекающие из них действия не всегда сопровождаются объяснением. Модель ИИ может предсказать наступление грозы, но не объяснить физику и атмосферные изменения, которые её вызвали, проанализировать рентгеновский снимок, не показав, как она пришла к своему диагнозу, или предложить абстрактные математические гипотезы, не доказав их. Подобные переходы от наблюдений и обоснованных рассуждений к математическим вероятностям случались в науке и раньше: уравнения квантовой механики, появившиеся в XX веке, точно предсказывают субатомные явления, которые физики до сих пор не до конца понимают, что заставило самого Альберта Эйнштейна усомниться в квантовой теории.

Сама наука может предложить решение этой головоломки. За последнее столетие физические эксперименты многое открыли о квантовом мире, и точно так же инструменты ИИ могут казаться непостижимыми отчасти потому, что исследователи не потратили достаточно времени на их изучение. «Сначала нужно создать артефакт, прежде чем разбирать его на части и анализировать с научной точки зрения», — сказал мне Хассабис, а учёные только недавно начали создавать модели ИИ, достойные изучения. Даже старые численные симуляции, хотя и гораздо менее сложные, чем современные модели ИИ, трудно интерпретировать интуитивно, но тем не менее они десятилетиями служили основой для новых открытий.

Если исследователи поймут, как искусственные нейроны реагируют на изображение, они смогут перенести эти предсказания на биологические нейроны; если исследователи поймут, какие части модели ИИ связывают мутацию с болезнью, учёные смогут получить новые знания о геноме человека. Такие модели представляют собой «полностью наблюдаемые системы. Вы можете измерить все части», — говорит ДиКарло. В то время как он не может измерить каждый нейрон и синапс в мозге обезьяны во время операции, он может сделать это для модели ИИ. При правильном доступе программы ИИ могут предоставлять учёным не столько «чёрные ящики», сколько новый тип объектов, требующих нового типа исследований — не столько «модели» естественного мира, сколько дополнения к нему. Некоторые учёные даже надеются создать «цифровых двойников» для моделирования клеток, органов и планеты.

Однако ИИ это не панацея. AlphaFold может быть революционным, и, возможно, Insilico действительно радикально сократит время, необходимое для разработки новых лекарств. Но у этой технологии есть существенные ограничения. Например, модели ИИ должны обучаться на большом количестве релевантных данных. AlphaFold — это «впечатляющий успех», — сказала мне Дженнифер Листгартен, специалист по вычислительной биологии и компьютерным наукам из Калифорнийского университета в Беркли, — но он также «опирался на очень дорогие, тщательно контролируемые данные, которые генерировались десятилетиями в лаборатории по очень чётко определённой проблеме, которую можно было оценить очень чисто». Отсутствие высококачественных данных в других дисциплинах может помешать использованию ИИ или ограничить его.

Даже при наличии таких данных реальный мир может быть более сложным и динамичным, чем кремниевая симуляция. Например, преобразование статичной структуры молекулы в её взаимодействие с различными системами организма — это проблема, над которой исследователи всё ещё работают, сказал мне Андреас Бендер, изучающий молекулярную информатику в Кембриджском университете. ИИ может быстро предлагать новые лекарства, но «вам всё равно нужно будет запустить процесс поиска лекарств, который, конечно, довольно длительный», — сказал мне Джон Джампер, исследователь из DeepMind, возглавлявший разработку AlphaFold.

Клинические испытания длятся годами, и многие из них оказываются безуспешными; многие стартапы и инициативы по созданию лекарств на основе ИИ были свёрнуты. Эти неудачи в некотором смысле являются доказательством того, что наука работает. Результаты экспериментов, наряду с известными физическими законами, позволяют учёным предотвратить галлюцинации своих моделей, сказала мне Анима Анандкумар, специалист по информатике из Калифорнийского технологического института. Аналогичных законов лингвистической точности для чат-ботов не существует — потребители вынуждены доверять Big Tech.

В лаборатории новые предсказания можно физически и безопасно проверить в изолированных условиях. Но при разработке лекарств или лечении пациентов ставки гораздо выше. Существующие карты генома человека, например, ориентированы на белых европейцев, но проявление многих заболеваний, таких как диабет, существенно зависит от расы и этнической принадлежности. Как предвзятые наборы данных порождают расистские чат-боты, так и перекосы в биологических данных могут означать, что «модели неприменимы к людям неевропейского происхождения», — сказал мне Бендер, или к людям другого возраста, или с существующими заболеваниями, или принимающим сопутствующие лекарства. Программа диагностики рака или лечения, разработанная ИИ, может быть особенно эффективной только для небольшой части населения.

Модели ИИ могут изменить не только то, как мы понимаем мир, но и то, как мы понимаем само понимание. Если это так, то мы должны создать новые модели знания — чему мы можем доверять, почему и когда. В противном случае наше доверие к чат-боту, инструменту для поиска лекарств или прогнозу урагана с помощью ИИ может выйти за рамки науки. Это может быть больше похоже на веру.

¹ Решением Тверского районного суда города Москвы от 21 марта 2022 года американская транснациональная холдинговая компания Meta Platforms Inc. (1) признана осуществляющей экстремистскую деятельность. На территории России запрещены работа Meta и реализация её продуктов: социальных сетей Facebook (2) и Instagram (3).

Наука становится всё менее человеческой; ИИ увеличивает скорость открытий – но какой ценой?

Публикации