
MIT представил BoltzGen — генеративную модель искусственного интеллекта, которая проектирует белковые "биндеры" для почти любых биологических мишеней и нацелена в первую очередь на трудноизлечимые заболевания.
Большинство современных лекарств работают по принципу "ключа и замка": они должны быть определенной формы (ключ), чтобы прицепиться к своей мишени (замок) — участку белка, рецептору на поверхности клетки, ферменту или фрагменту ДНК/РНК — и либо заблокировать его, либо, наоборот, активировать. Классический подход к поиску таких "ключей" десятилетиями строился вокруг перебора: берется библиотека из миллионов соединений, которые по очереди тестируются в пробирке, а с недавнего времени — и при помощи машинного обучения. Процесс подбора нужного соединения таким образом долог и не всегда надежен.
Модели типа BoltzGen кардинально меняют этот процесс. Это всеатомная диффузионная модель, которая получает информацию о мишени и, вместо того чтобы выбирать из имеющегося каталога, предсказывает структуру комплекса "мишень–биндер" и конструирует трехмерный белок-биндер формы, необходимой для присоединения. Модель работает сразу с несколькими типами молекул — от нанотел и минибелков до линейных и циклических пептидов, связанных с белками, РНК/ДНК или малыми молекулами. При этом в генерацию встроены жесткие физико-химические ограничения, разработанные вместе с экспериментальными лабораториями: модель "наказана" за невозможные геометрии, нарушение валентностей и прочие вещи, которые не переживет настоящая молекула.
BoltzGen прогнали через восемь лабораторных исследований. Всего команда протестировала 26 мишеней, сознательно выбирая самые неприятные случаи: новые белки без известных биндеров, плохо структурированные участки, биоактивные пептиды и даже малые молекулы. Отдельный блок экспериментов был посвящен девяти принципиально новым белковым мишеням, для которых в базе данных вообще нет похожих комплексов; при тестировании порядка 15 кандидатов на каждую цель модель показала около 66% успеха там, где большинство ИИ предыдущего поколения даже не пытались что-то спроектировать. Это показывает потенциал использования BoltzGen в поиске лекарств для трудноизлечимых заболеваний.
BoltzGen полностью открыта: под лицензией MIT доступны обучающие данные, веса, код обучения и инференса, а также готовый конвейер, который на вход принимает задачу "нужен биндер к такой-то мишени с такими-то ограничениями" и на выходе дает отсортированное и диверсифицированное множество конструкций. Важно понимать и ограничения: BoltzGen ускоряет только процесс поиска биндеров-кандидатов, которым затем предстоит пройти годы доклиники и клинических испытаний, прежде чем стать реальным лекарством.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
