Как стать автором
Обновить

Комментарии 19

«загадочных» мест

Во-во. Реклама это. Пляски с бубном — искусственный интеллект и до белков добрался.

Если говорить серьёзно, всё это хорошо конечно. Только вот ничего особенного не случилось. Ну еще один метод сворачивания подтянулся. Примерно с теми же результатами что и другие. Может чуть лучше, формально. Пол века назад говорили — 80% белковых укладок можно предсказать по последовательности. Вот теперь, в 2020 — мы 85% правильно предсказали. Судя по графику. А остальные 15? Вот они-то и самые интересные. Те, что не типичным образом уложены. А раз не типичным, то стат методы не работают, хоть ИИ их назови, хоть горшком.

Во вторых, здесь важно понимание, а не предсказания черного ящика. Как белок работает? Это главное. Тот факт что черный ящик правильно предсказывает чуть больше типичных ситуаций, понимания не добавляет.

Это не критика работы. Работа отличная. Чем больше угадываем, тем лучше. Только вот повода для пляски не видно.
Только вот ничего особенного не случилось.

Точность предсказания третичной структуры белка достигла точности экспериментального определения этой самой структуры. Это значит, что нужно будет повторять измерения, чтобы определить что ближе к реальности: ранее полученные экспериментальные данные или предсказания AlphaFold.


Только вот повода для пляски не видно.

Некоторые специалисты так не думают. https://twitter.com/MoAlQuraishi/status/1333383634649313280

НЛО прилетело и опубликовало эту надпись здесь
эквивалент 100-200 графических процессоров

Так 100 или 200? Разница в два раза достаточно существенна.
Система дает надежные прогнозы базовой физической структуры белка за считанные дни.

Считанные дни — это сколько, день, два, десять? Так то множество натуральных чисел тоже счетно, только бесконечно.
Она использует примерно 128 ядер TPUv3

Если на этом же кластере запустить F@H или его аналоги, какова будет скорость расчета?
Система дает надежные прогнозы базовой физической структуры белка за считанные дни.

А она не дает. Это фантазии автора. Смотрите на график в самой же статье.

"Не даёт" != "Во множестве случаев даёт достаточно, чтобы намного быстрее расшифровать результаты рентгеновской кристаллографии"

«Не даёт» != «Во множестве случаев даёт достаточно, чтобы намного быстрее расшифровать результаты рентгеновской кристаллографии»

А с этим никто не спорит. Это другой тезис. В статье написано:
Система дает надежные прогнозы...
Нет недопонимания.

«Во множестве случаев даёт достаточно, чтобы намного быстрее расшифровать результаты рентгеновской кристаллографии»

Такого в статье нет.

Такого в статье нет.

Экстраполировал по цитате с https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology


Professor Andrei Lupas, Director of the Max Planck Institute for Developmental Biology and a CASP assessor, let us know that, “AlphaFold’s astonishingly accurate models have allowed us to solve a protein structure we were stuck on for close to a decade, relaunching our effort to understand how signals are transmitted across cell membranes.”

"Профессор Андрей Лупас — директор института биологии развития имени Макса Планка и член комиссии конкурса CASP — сообщил нам следующее: "Замечательно точные модели создаваемые AlphaFold помогли нам определить структуру белка, над которой мы бились почти десять лет, и позволили заново начать работу над определением механизмов передачи сигналов через клеточные мембраны".


По информации из других источников они там за час смогли интерпретировать результаты рентгеновской кристаллографии.

Алгоритм AlphaFold от DeepMind решил 50-летнюю задачу фолдинга белка
Это вранье. Пора вам, бандерлоги, привыкать, что все наши статьи о DeepMind начинаются с вранья. Правильный заголовок должен быть таким:
Алгоритм AlphaFold от DeepMind решил 50-летнюю задачу фолдинга белка c точностью 85%
А теперь сюрприз. 85% точность это мало или много? 85% точности (15% ошибка) это почти бесполезно для понимания того, что делает белок. Работа белков основана на комплементарном пространственном попадании активных центров в нужные места других молекул с последующим понижением потенциального барьера реакции за счет собственных электронных орбиталей и механическим отводом/подводом продуктов реакции/исходных веществ. То есть попадание в субстрат долждо быть как минимум 1/10-1/5 атома. При ошибке в 1/2 атома ожидаю полную неработоспособность белка и невозможность понять что делает белок по причине проблем с поиском субстрата. 99.9% белков состоят из 64 — 2500 аминокислотных остатков. Каждая аминокислота в среднем 17 атомов, что дает 1100 — 42000 атомов всего. При условии кубической 3х мерной упаковки, что конечно не совсем так, получаем размеры белка 10х10х10 атомов — 35х35х35 атомов. 15% ошибка по любой размерности дает ошибку позиционирования в 1.5 — 5.25 атома. Что либо понять о работе самого простого белка при такой ошибке не представляется возможным. То есть задача не решена ни в какой мере. Допустимая максимальная ошибка 2% — 0.6% для задачи. То есть для реального же решения задачи необходимо улучшить результаты в 7-25 раз от продемонстрированных.
Исходя из того, что потребовалось 14 лет, чтобы уменьшить ошибку с 65% до 15% то есть в 4.5 раза, можно предположить, что с текущим подходом уменьшить ошибку в 7 раз (а тем более в 25 раз) будет не возможно никогда. И уж как минимум времени на это пондобится более 14 лет. За то все эти 14 лет можно будет писать статьи о ежегодном успешном и революционном решении задачи без достижения каких либо результатов.

Моделирование взаимодействия белковых структур — это другая задача, для которой сначала нужно определить как эти белки свернутся. Ну и свернутые белки — это не абсолютно жёсткие конструкции, там группы атомов могут болтаться на десяток ангстрем и больше.

Рентгеновские структуры обычно имеют разрешение порядка нескольких ангстрем. И ничего, как-то работают с ними.
Вы немного перебарщиваете. Да, эта статья насквозь лжива, начиная с заголовка, как уже справедливо написали.

Другое дело сама работа DeepMind. DeepMind сделала вещь работающую несколько лучше чем известные методы. Она «несколько точнее», а не «решил 50-летнюю задачу» и «дает надежные прогнозы», как тут написано. Не решил, и не дает. Однако, если это будет доступно, то практическое применение конечно будет. Даже самые ненадежные прогнозы имеют практическое применение пока нет надежных, а тут вполне приличный процент.

Ваши рассуждения о разрешении верны применительно к этой статье, поскольку тут заявлено что «усё решено», и не верны применительно к работе DeepMind. Там экспериментальное разрешение и не предполагается. Там предлагается грубый набросок белка. Он сам по себе полезен и его можно уточнять другими методами. Как вообще разрабатываются лекарства? Там же не конструируются молекулы с предопределенными свойствами. Делается грандиозный перебор. Однако не совсем слепой. Любое увеличение вероятности дает большой эффект. Улучшение предсказания на 1% это экономический эффект.

Значение работы DeepMind будет большим если они все откроют и опишут идеи. Тогда для многих откроются интересные пути. Что сомнительно, кажется они завязаны на коммерцию.

начение работы DeepMind будет большим если они все откроют и опишут идеи.

Они всё открыли и описали идеи. https://github.com/deepmind/deepmind-research/tree/master/alphafold_casp13 https://www.nature.com/articles/s41586-019-1923-7

НЛО прилетело и опубликовало эту надпись здесь
«проблема сворачивания белков», и последние 50 лет было серьезным вопросом биологии
И сейчас таким остается. Мы сейчас уже много знаем о том, как сворачиваются белки, но это не мешает программам предсказания порой выдавать полную хрень.

В течение многих лет для определения структур белков использовали ядерный магнитный резонанс и рентгеновскую кристаллографию
И сейчас используют. И будут использовать.

в течение почти 50 лет исследователи искали возможность предсказать трехмерную структуру белка
И в целом давно нашли. Методы моделирования по гомологии, трединга и даже предсказания ab initio.

нейросетевую систему, обученную от начала до конца, чтобы интерпретировать структуру этого графа, одновременно рассуждая о неявном графе, который он строит.
Что?
Если серьезно, в оригинальной статье примерно то же самое. По-моему, это следовало бы расписать подробнее и понятнее. Насколько я понял, грубо говоря, метод сочетает предсказание по гомологии (т.е. основывается на известных структурах похожих последовательностей) с молекулярной динамикой (или просто статистикой?) взаимодействия боковых цепей. Ну так это давно все делают. А дальше начинается какая-то нейросетевая магия.

Кроме того, AlphaFold может предсказать, какие части каждой предсказанной структуры белка являются надежными, с помощью внутреннего показателя достоверности.
Это во всех программах есть.

AN3333 прав. Еще один метод предсказания. Именно предсказания структуры, а не решения проблемы сворачивания. Заголовок статьи — ужасно спекулятивный.
Именно предсказания структуры, а не решения проблемы сворачивания.

А что будет решением проблемы сворачивания? Квантовый компьютер, который будет считать всё из первых принципов?

Квантовый не надо, парадокс Левинталя уже разрешен.
Проблема сворачивания лежит в плоскости фундаментальной физики белка, а не вычислений. Просто еще не все факторы, влияющие на фолдинг, выяснили и учли. Имхо.

То есть найти упрощённую модель для происходящих квантово-механических процессов, позволяющую рассчитать энергетический ландшафт конформаций с достаточной для практического применения точностью. И, судя по времени, которое ушло на то, чтобы не решить эту проблему — это сложно.


Видимо квантовая механика на таких масштабах не сильно поддаётся упрощению, и простейшая модель может быть не намного меньше по сложности, чем AlphaFold.

Проблема сворачивания лежит в плоскости фундаментальной физики белка, а не вычислений. Просто еще не все факторы, влияющие на фолдинг, выяснили и учли.

Именно.

А что будет решением проблемы сворачивания?

Учет энергетических эффектов с точностью до kT.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости

Истории