Как стать автором
Обновить

В МТИ нейросеть научили предсказывать, как соединяются белки

Время на прочтение4 мин
Количество просмотров1.9K

Исследователи Массачусетского технологического института создали модель машинного обучения, которая может предсказывать комплекс, образуемый при соединении двух белков. Их метод в 80–500 раз быстрее существующих, и часто предсказывает структуры белков, которые ближе к наблюдаемым экспериментально. 

Один белок (выделен серым цветом) стыкуется с другим белком (фиолетового цвета) с образованием белкового комплекса в Equidock / МТИ
Один белок (выделен серым цветом) стыкуется с другим белком (фиолетового цвета) с образованием белкового комплекса в Equidock / МТИ

Антитела, небольшие белки, вырабатываемые иммунной системой, могут прикрепляться к определенным частям вируса, чтобы нейтрализовать его. Поскольку ученые продолжают бороться с SARS-CoV-2, одним из возможных методов является синтетическое антитело, которое связывается с шиповидными белками вируса, чтобы предотвратить проникновение вируса в клетку человека.

Чтобы разработать успешное синтетическое антитело, исследователи должны точно представлять процесс прикрепления белка. Белки с комковатыми трехмерными структурами, содержащими множество складок, могут склеиваться в миллионах комбинаций, поэтому поиск правильного белкового комплекса среди почти бесчисленного количества кандидатов требует чрезвычайно много времени.

Новый метод может помочь ученым лучше понять некоторые биологические процессы, связанные с взаимодействием белков, такие как репликация и восстановление ДНК; что также могло бы ускорить процесс разработки новых лекарств.

«Глубокое обучение очень хорошо фиксирует взаимодействия между различными белками, которые химикам или биологам трудно записать экспериментально. Некоторые из этих взаимодействий очень сложны, и люди не нашли хороших способов их выразить. Эта модель глубокого обучения может изучать такие типы взаимодействий на основе данных», — говорит Октавиан-Юген Ганеа, постдок Лаборатории компьютерных наук и искусственного интеллекта МТИ (CSAIL).

Разработанная исследователями модель под названием Equidock фокусируется на процессе, когда два белка соединяются путем вращения или перемещения в трехмерном пространстве, но их формы не сжимаются и не изгибаются.

Модель берет трехмерные структуры двух белков и преобразует их в трехмерные графики, которые могут обрабатываться нейросетью. Белки состоят из цепочек аминокислот, и каждая из этих аминокислот представлена ​​узлом на графике.

Исследователи включили в модель геометрические знания, поэтому она понимает, как объекты могут меняться, если их вращать или перемещать в трехмерном пространстве. В модель также встроены математические знания, которые гарантируют, что белки всегда прикрепляются одинаково, независимо от того, где они находятся в трехмерном пространстве. 

Используя эту информацию, система машинного обучения идентифицирует атомы двух белков, которые с наибольшей вероятностью будут взаимодействовать и образовывать химические реакции, известные как точки связывания. Затем она использует эти точки, чтобы объединить два белка в комплекс.

«Если мы сможем понять по белкам, какие отдельные части, вероятно, будут этими точками связывания, это позволяет получить всю информацию, необходимую для соединения двух белков вместе. Предполагая, что мы можем найти эти два набора точек, мы можем просто выяснить, как вращать и перемещать белки, чтобы один набор соответствовал другому набору», — объясняет Ганеа.

Одной из самых больших проблем при построении модели была нехватка обучающих данных. По словам Ганеа, поскольку существует мало экспериментальных трехмерных данных для белков, было особенно важно включить геометрические знания в Equidock. 

После обучения модели исследователи сравнили ее с четырьмя существующими программными методами. Equidock может предсказать конечный белковый комплекс всего за одну-пять секунд. Обычно этот процесс занимал гораздо больше времени, от 10 минут до часа и более.

В показателях качества, которые подсчитывают, насколько точно предсказанный белковый комплекс соответствует фактическому, Equidock часто оказывается сопоставима с исходными методами, но иногда уступает им.

«Мы все еще отстаем от одного из базовых показателей. Но наш метод можно использовать в очень большом виртуальном скрининге, где мы хотим понять, как тысячи белков могут взаимодействовать и образовывать комплексы. Также его можно было бы использовать для очень быстрого создания начального набора кандидатов, а затем обрабатывать его с помощью некоторых более точных, но более медленных традиционных методов», — отмечает Ганеа.

Команда МТИ хочет включить в Equidock специфические атомные взаимодействия, чтобы система могла делать более точные прогнозы. Например, иногда атомы в белках присоединяются посредством гидрофобных взаимодействий, в которых участвуют молекулы воды.

По словам Ганеи, их метод также может быть применен для разработки небольших молекул, подобных лекарствам. Эти молекулы особым образом связываются с поверхностью белка, поэтому быстрое определение того, как происходит это присоединение, может сократить сроки разработки лекарств.

В будущем исследователи планируют улучшить Equidock, чтобы система могла прогнозировать гибкую стыковку белков. Самым большим препятствием является нехватка данных для обучения, поэтому они работают над созданием синтетических данных, которые они могли бы использовать для улучшения модели.

В 2021 году компания DeepMind выпустила версию своей нейросети с глубоким обучением AlphaFold 2 для определения трехмерной структуры белков. Она имеет открытый исходный код, а разработчики подробно описали, как работает модель. DeepMind ранее показала, как ее программное обеспечение может точно предсказывать структуру многих белков, используя только их последовательность, которая определяется ДНК. Исследователи работали над своей системой в течение десятилетий, и AlphaFold 2 отлично показала себя в рамках критической оценки прогнозирования структуры белка CASP, решив 50-летнюю проблему фолдинга или «сворачивания» белков.

Теги:
Хабы:
Всего голосов 5: ↑5 и ↓0+5
Комментарии1

Другие новости

Истории

Работа

Data Scientist
85 вакансий

Ближайшие события

19 сентября
CDI Conf 2024
Москва
24 сентября
Конференция Fin.Bot 2024
МоскваОнлайн
30 сентября – 1 октября
Конференция фронтенд-разработчиков FrontendConf 2024
МоскваОнлайн