
Калифорнийский стартап Profluent опубликовал в Nature Biotechnology языковую модель белков Protein2PAM, которая предсказывает и перенастраивает PAM-специфичность CRISPR-Cas ферментов — без итеративных лабораторных экспериментов. Модель обучена на 45 000+ парах Cas-белков и PAM-последовательностей и позволяет за один шаг спроектировать варианты Cas9, способные разрезать ДНК в участках, ранее недоступных для редактирования. В экспериментах in vitro скорость разрезания выросла до 50 раз по сравнению с природным ферментом.
Проблема, которую решает Protein2PAM, — фундаментальное ограничение технологии CRISPR. Чтобы Cas-белок "зацепился" за нужный участок ДНК, рядом с ним должна находиться короткая последовательность — PAM (protospacer adjacent motif). Если подходящего PAM поблизости нет, редактировать участок невозможно. По оценкам лаборатории Бенджамина Клайнстивера из Гарвардской медицинской школы, до недавнего времени около трех четвертей генома человека оставались недоступны именно из-за этого ограничения. Традиционные методы изменения PAM-специфичности — направленная эволюция и ручной инжиниринг белка — требуют множества раундов дорогостоящих лабораторных экспериментов.
Protein2PAM работает иначе: модель принимает на вход аминокислотную последовательность Cas-белка и предсказывает, какой PAM тот распознает. С помощью виртуального мутагенеза (in silico mutagenesis) она выявляет аминокислотные остатки, критичные для PAM-распознавания, — без использования 3D-структуры белка. Затем "вычислительная эволюция" генерирует варианты белка Nme1Cas9 с расширенным PAM-распознаванием. По данным авторов, модель в четыре раза чувствительнее и в 500 раз быстрее существующих биоинформатических методов предсказания PAM. Результаты подтверждены в лаборатории Клайнстивера в Центре геномной медицины Массачусетского госпиталя.
Обучающие данные и веса Protein2PAM выложены открыто, а для исследователей запущен бесплатный доступ. До клинического применения пока далеко — результаты получены in vitro, и сама статья осторожно говорит о "потенциальном повышении гибкости таргетирования в персонализированном редактировании генома". Но если подход масштабируется, он может существенно расширить спектр генетических заболеваний, доступных для CRISPR-терапии, — и сделать подбор инструмента редактирования под конкретного пациента рутинной задачей для ИИ, а не для лаборатории.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
