Как стать автором
Обновить

Алгоритм AlphaFold от DeepMind решил 50-летнюю задачу фолдинга белка

Время на прочтение 3 мин
Количество просмотров 7.8K
Научно-популярное Биотехнологии Искусственный интеллект Здоровье
image

Выяснение того, в какую форму складываются белки, известное как «проблема сворачивания белков», и последние 50 лет было серьезным вопросом биологии. В DeepMind заявили, что последняя версия системы искусственного интеллекта AlphaFold помогла решить эту задачу. Прорыв признали организаторы проводимой раз в два года критической оценки прогнозирования структуры белка (CASP). В 2018 году AlphaFold уже заняла первое место на CASP.
Всего голосов 12: ↑11 и ↓1 +10
Комментарии 19

ИИ от DeepMind для определения структуры белка выложили в открытый доступ

Время на прочтение 2 мин
Количество просмотров 1.8K
Open source *Научно-популярное Искусственный интеллект Здоровье Химия

Компания DeepMind выпустила версию своей нейронной сети с глубоким обучением AlphaFold 2 для определения трехмерной структуры белков с открытым исходным кодом. Разработчики также подробно описали, как работает модель.  

Читать далее
Всего голосов 12: ↑11 и ↓1 +10
Комментарии 3

Фолдинг белков превратили в компьютерную игру

Время на прочтение 2 мин
Количество просмотров 15K
Биотехнологии
Потрясающую игру разработали учёные из Вашингтонского университета (США). Программа под названием Fold.it представляет собой модель сворачивания белков в трёхмерные конструкции. Геймер должен попытаться сделать это наиболее удачным образом. В программу будут загружаться реальные данные о настоящих, только что изобретённых протеинах, которые непонятно как сворачиваются. Результаты отправятся через интернет в центр обработки, где их проверят на суперкомпьютере (это будет с осени, а пока что в программу заложены уже решённые загадки, так что сейчас она выполняет роль тренажёра).



В самом деле, все геймеры нашего мира тратят миллиарды человеко-часов на бесполезные для человечества игры типа WoW, Counter-Strike или пасьянса «Косынка». В то же время они могли бы использовать интеллект более эффективно: например, сворачивая белки на экране своего монитора. Это ведь тоже по-своему интересно.
Читать дальше →
Всего голосов 41: ↑39 и ↓2 +37
Комментарии 36

Геймеры в Fold.it решили научную проблему

Время на прочтение 2 мин
Количество просмотров 8.5K
Краудсорсинг
В мае 2008 года мы обсуждали новую компьютерную игру Fold.it, которую разработали учёные из Вашингтонского университета (США). Программа представляет собой модель сворачивания белков в трёхмерные конструкции. Геймер должен попытаться сделать это наиболее удачным образом, работая с настоящими протеинами. Результаты отправляются в центр обработки, где их проверяют на суперкомпьютере.



За три прошедших года игроки смогли сложить несколько удачных молекул, но их последняя находка не идёт ни в какое сравнение с предыдущими: была обнаружена и подтверждена точная модель фермента протеазы, который играет ключевую роль в заражении организма обезьян ретровирусом ВИЧ. Модель этого белка не удавалось получить в течение уже 15-ти лет. Теперь же можно попробовать создать лекарство, которое воздействует на этот фермент.
Читать дальше →
Всего голосов 166: ↑156 и ↓10 +146
Комментарии 121

Часть №1. Введение в биовычисления по сворачиванию. От белков к РНК

Время на прочтение 4 мин
Количество просмотров 3.5K
Алгоритмы *
Сразу надо сказать, что буду излагать вопрос о биовычислениях с определенной кибернетико-геометрической точки зрения. Это мое название и это направление не распространено. Уверен, что так будет легче понять тем кто не в теме этой биологической проблематики. Те кто уже в теме — готов и с вами подискутировать и показать почему традиционные методы не пригодны с точки зрения кибернетического подхода (но в этой статье не вы моя аудитория — уж извините, но уверен и вам она будет полезна как расширение мировоззрения на проблематику).

Практическое применение для биологов имеет больше вопрос сворачивания белков. В определенной степени очень много практических задач можно свести к этой задаче (знанию того как сворачивается белок), основная из которых — разработка лекарств по борьбе с вирусами и болезнями.

Но эта задача в общем виде не решена. Это как нерешенные задачи в математике, только с биологическим контекстом (см. парадокс Левинталя). Биологи могут лишь с определенной погрешностью увидеть путем биоэкспериментов состояние в уже свернутом состоянии, но проследить как это происходит пока не возможно. Но все это кроме того очень дорого. Почему и занимаются компьютерными вычислениями — это дешево, даже не смотря на то, что используется тысячи компьютеров в распределенных проектах.

Но введения хватит, далее с корабля на бал…

Читать дальше →
Всего голосов 51: ↑51 и ↓0 +51
Комментарии 5

Часть №2. Введение в биовычисления по сворачиванию. Мат. критерии

Время на прочтение 3 мин
Количество просмотров 2K
Алгоритмы *
Это продолжение статьи Часть №1. Введение в биовычисления по сворачиванию. От белков к РНК. Здесь мы опишем ковалентные и водородные связи математически. Посмотрим какие углы мы будем вращать у РНК для сворачивания. И прикоснемся к вопросу «а в чем трудность то?»

Читать дальше →
Всего голосов 40: ↑37 и ↓3 +34
Комментарии 78

Часть №3. Биовычисления по сворачиванию. Как уменьшить число поворотов цепи?

Время на прочтение 5 мин
Количество просмотров 1.5K
Алгоритмы *
В этой части мы поговорим о том, как можно так сократить число поворотов цепи, чтобы сократить расчеты, но при этом не потеряв возможность попадания в нужные состояния.

Но вначале хочу обратиться к специалистам в этой области:

Вначале развею возможное недопонимание: я любитель, и не занимаюсь этой темой профессионально. Я заметил, что тут есть специалисты в этой теме. Странно, что я не читаю ваших статей, а вы читаете мои. Очень надеюсь, что эта ситуация поменяется. Я хочу почитать ваши статьи, и желательно написанные простым языком, и где вы даете ответы, а не отправляете в известном направлении в гугл. Просто у меня есть некий негативный опыт, когда только начинал ряд специалистов, которых удавалось находить в интернете делали умный вид и не помогали словом, и делом — а отправляли в указанном направлении. Здесь я пытаюсь рассказать свой маленький опыт — но может это позволит кому-то легче стартовать.

Тем же кто желает тут похоливарить. Давайте так. Я такой любитель — которому погоны специалистов значут мало, а наука такое дело требует повторяемости (а не бизнес-скрытности, это же не бизнес, чтобы скрывать детали своих алгоритмов и не публиковать их код?), поэтому просто разговоры меня интересуют мало. Но меня очень интересует когда мне показывают, что я занимаюсь немного не тем, и что есть люди которые действительно чего-то добились. Вот задача над которой я мучаюсь. Решите и покажите, что это просто — буду очень благодарен.

Я даю произвольную (реально существующую) первичную последовательность до 100 нуклеотидов. Указываю все водородные связи которые нужно образовать. Вы на выходе даете мне файл .pdb, в котором третичная структура из указанной первичной последовательности и где образованы все требуемые водородные связи. Ни каких других требований.


Прошу или показать, что это просто или ответственно подтвердить, что эта задача скажем за неделю (или другой разумный срок) — не решается.

Ну, а пока этого нет и нет ваших статей, например, о других подходах, вроде молекулярной динамики и т.д., извольте читать о предлагаемом мной подходе и критиковать конструктивно, помогать своими знаниями, участвовать в обсуждении проблемы и может быть даже объединить со мной усилия и чего-то сделать вместе.

И снова моей аудитории, которая не является специалистами: важно поверить, что это легко, и не обязательно знать физику, биологию, и сложную математику — надеюсь вы умеете программировать и этого достаточно. Выше кстати, задача, которую мы и будем решать… но не все сразу. По плюсам — я понял что Вы читаете. Но неужели все понятно и нет вопросов? Если что жду комментариев, даже самых наивных. Пора делать эту область исследований хотя бы простой по описанию, а не скрывать ее за не нужными тонами сложностей.

Читать дальше →
Всего голосов 22: ↑20 и ↓2 +18
Комментарии 42

Часть №4. Биовычисления по сворачиванию. Как оценить ход сворачивания односпиральной РНК?

Время на прочтение 4 мин
Количество просмотров 1K
Алгоритмы *
Итак, если еще не устали от цикла «Hello, RNA World» — ловите последнюю статью сезона :)

В прошлой статье я обосновал, почему следует (или хотя бы целесообразно) отказаться от оценки энергии как целевой функции. Если кто не в курсе — целевая функция, это такая придуманная нами функция, по которой можно оценить приближаемся мы к поставленной нами цели или нет, т.е. «правильно» сворачивается РНК или нет.

Если энергия — это мало репрезентативная цель, тогда что более стабильно/чётче указывает куда двигаться? Если бы у нас была абсолютно формализованная и точная цель — это уже означало бы, что мы задачу решили, т.к. сама формализация целевой функции — есть не что иное как полноценное понимание процесса.

Но у нас такой роскоши нет. Мы вынуждены вначале выдвигать гипотезу — каким закономерностям подчиняется процесс, и определенным образом отражать это в целевой функции.

Читать дальше →
Всего голосов 19: ↑19 и ↓0 +19
Комментарии 44

Часть №5. Биовычисления по сворачиванию. Одна фундаментальная проблема

Время на прочтение 3 мин
Количество просмотров 1.3K
Алгоритмы *
В этой статье мы рассмотрим как свернуть одну спираль в РНК. Для понимания нужно прочитать все предыдущие части От белков к РНК, Мат. критерии, Как уменьшить число поворотов цепи?, Как оценить ход сворачивания односпиральной РНК?, Ограничение оптимизирующих методов в играх с противником и без. Если ранее у нас все шло как по маслу, то здесь мы столкнемся с серьезной проблемой. Может кто-то подскажет как её решить.

Читать дальше →
Всего голосов 11: ↑7 и ↓4 +3
Комментарии 48

Часть №6. Введение в сворачивание многоспиральных РНК

Время на прочтение 3 мин
Количество просмотров 1.6K
Алгоритмы *
Итак, в прошлых частях мы разобрались как сравнительно просто сворачивать спирали РНК. Теперь нам предстоит понять, как вообще сворачивается РНК. То РНК, которое мы взяли в виде примера имеет три спирали. Две из них L1 и L2 можно свернуть независимо. А вот с третьей проблемы. Эта третья состоит из концов РНК, и при ее сворачивании начинают двигаться наши свернутые спирали L1 и L2. Во-первых, при этом они мешают друг другу, и следовательно и сворачиванию третьей спирали. Во-вторых, возможно образование около десятка разнообразных псевдосимметричных структур — спирали L1, L2 могут по разному располагаться по отношению к сворачиваемым концам РНК.

Здесь мы попробуем разобраться как эти проблемы решить.

Читать дальше →
Всего голосов 33: ↑26 и ↓7 +19
Комментарии 6

Часть №7. RNAInSpace — программное обеспечение для полуавтоматического конструирования РНК в пространстве

Время на прочтение 3 мин
Количество просмотров 1.3K
Разработка веб-сайтов *Программирование *
В предыдущих частях От белков к РНК, Мат. критерии, Как уменьшить число поворотов цепи?, Как оценить ход сворачивания односпиральной РНК?, Ограничение оптимизирующих методов в играх с противником и без, Одна фундаментальная проблема, Введение в сворачивание многоспиральных РНК я рассказал основы к предлагаемому мной кибернетико-геометрическому подходу для задачи сворачивания РНК. Повторю формулировку задачи:

Имеем произвольную, реально существующую, первичную последовательность до 100 нуклеотидов. Знаем все водородные связи которые нужно образовать. На выходе получаем файл .pdb, в котором третичная структура из указанной первичной последовательности и где образованы все требуемые водородные связи.


Здесь я расскажу о практике, чтобы каждый мог попробовать что это такое. Мной было разработано ПО для расчета того, о чем я рассказывал. Здесь я даю ссылку на демо версию. И объясняю, что вы сможете увидеть. Ведь лучше один раз увидеть, чем 100 раз услышать :)

Читать дальше →
Всего голосов 7: ↑5 и ↓2 +3
Комментарии 24

История одного реинжиниринга или RNAInSpace v.1.3. Demo

Время на прочтение 3 мин
Количество просмотров 1.6K
Работа с 3D-графикой *
Тут недавно был такой пост Правила разработки сложных систем. История одного проекта, где автор описывает как он удачно «копался» в одном проекте, а потом все выкинул и переписал с нуля.

Я попробую рассказать обратную историю. Тут около месяца назад я не удачно попытался представить демо версию одной своей разработки (см. Часть №7. RNAInSpace — программное обеспечение для полуавтоматического конструирования РНК в пространстве).

Оказалось, что у скачивающих не работает один модуль, ответственный за показ графики. В двух словах проект RNAInSpace — это программное обеспечение для полуавтоматического конструирования РНК в пространстве. Обеспечивает 3D визуализацию структуры РНК, позволяет её изменять и с помощью связи с модулем RNAWorld позволяет автоматизировать некоторые этапы сворачивания РНК.

Чтобы войти в тему — я тут написал некоторое множество статей:
От белков к РНК, Мат. критерии, Как уменьшить число поворотов цепи?, Как оценить ход сворачивания односпиральной РНК?, Ограничение оптимизирующих методов в играх с противником и без, Одна фундаментальная проблема, Введение в сворачивание многоспиральных РНК

Но эту статью можно обсуждать и не зная предметной области, кстати заодно проверим можно ли судить о качестве ПО не зная семантики предметной области (я утверждаю, что можно).

Так вот эта 3D визуализация (модуль RNAInSpaceDisplay) и не работала на некоторых компьютерах. Для реализации графики я использовал существующий проект VMD 1.8.7.

Ниже история о том как я адаптировал VMD 1.8.7 под свои нужды.

Читать дальше →
Всего голосов 6: ↑6 и ↓0 +6
Комментарии 7

Биовычисления по сворачиванию. Снова простым языком о полученной модели сворачивания

Время на прочтение 6 мин
Количество просмотров 1.6K
Алгоритмы *
Я тут написал уже более 7 статей на тему одного своего подхода (набора алгоритмов и проблем) к задаче сворачивания РНК. Читающих становилось с каждой статьей все меньше, а кое кто признавался, что мозг выносило уже после второй статьи. Сравнительный успех первых двух статей, по сравнению с остальными — кажется заключается в простоте изложения и не углубления в детали. Хотя последние статьи давали возможность самим взять демо моей программы и прочувствовать проблематику — это видимо интересует меньше.

Поэтому я постараюсь тут изложить простым языком еще одну проблему, которая мешает решить эту задачу. И мне представляется, что эта проблема связанна не только с выбранным мной подходом к решению, а она скорее общая для задачи фолдинга.

В своем ПО RNAInSpace — я реализовал возможность «покрутить» спираль РНК вручную, чтобы стала понятна геометрия и ограничения такого вращения. Но так как по предыдущим статьям — это ПО не сильно заинтересовало, то тут очередную демо версию этого ПО я пока представлять не буду. А поговорим о том, что получается у меня.

Читать дальше →
Всего голосов 38: ↑36 и ↓2 +34
Комментарии 75

Как понять, что нейросеть решит вашу проблему. Прагматичное руководство

Время на прочтение 12 мин
Количество просмотров 12K
Блог компании VK Алгоритмы *Обработка изображений *Машинное обучение *Искусственный интеллект
Перевод
Haystacks at Sunset Reimagined by AshnoAlice

Инженер по машинному обучению Джордж Хосу задает вопрос: «Какие проблемы решает машинное обучение?». Или конкретнее, с учетом современного развития отрасли: «Какие проблемы нейросеть способна решить на практике?». Команда Mail.ru Cloud Solutions перевела статью, так как рассуждения на эту тему, как нам кажется, встречаются редко.
Читать дальше →
Всего голосов 45: ↑45 и ↓0 +45
Комментарии 9

Взламываем код биологических молекулярных ключей

Время на прочтение 6 мин
Количество просмотров 1.8K
Машинное обучение *Биотехнологии
Перевод

Нейросети обучили быстро считывать информацию о поверхности белков – молекул, критически важных для многих биологических процессов. Эта технология уже используется для создания защиты от вируса, ответственного за COVID-19



Геометрическое глубокое обучение может распознавать сложные поверхности белков, что позволяет исследователям предсказывать взаимодействие биологических молекул

У специалиста по вычислительной биологии Бруно Коррейа в лаборатории было правило: никакого машинного обучения (МО). Он не считал эту дисциплину строгой наукой. Но недавно Коррейа использовал её для поиска потенциальных способов взаимодействия белков – сложных свёрнутых молекул, отвечающих за многие биологические процессы – и получил результат в 40 000 раз быстрее обычных методов. На обложке журнала Nature Methods за февраль 2020 красуется его система. О своём нежелании принимать МО Коррейа говорит: «Я ошибался, и рад, что ошибался».
Читать дальше →
Всего голосов 6: ↑5 и ↓1 +4
Комментарии 0

AlphaFold2: глубокий разум и его правильное применение

Время на прочтение 17 мин
Количество просмотров 7.8K
Блог компании BIOCAD Биотехнологии
✏️ Технотекст 2021
Диана Кондинская, руководитель отдела структурной биоинформатики BIOCAD, рассказывает про алгоритм AlphaFold2 от компании DeepMind.
Читать дальше →
Всего голосов 13: ↑13 и ↓0 +13
Комментарии 3

Как работает DeepMind AlphaFold2?

Время на прочтение 33 мин
Количество просмотров 9.8K
Машинное обучение *Биотехнологии Биология
Из песочницы
Перевод

На мой взгляд DeepMind AlphaFold2 и Github Copilot являются одними из самых значимых достижений науки и техники в 2021 году. Спустя два года после их первоначального прорыва команда из DeepMind фактически смогла решить (с небольшими оговорками) задачу фолдинга белка, остававшуюся нерешенной более 50 лет. В этом посте я подробно разбираю устройство данной системы.

Читать далее
Всего голосов 29: ↑29 и ↓0 +29
Комментарии 9

Компьютерная революция в примерах. Вычисления кардинально улучшили мир за полвека

Время на прочтение 8 мин
Количество просмотров 3.3K
Блог компании Сбер Алгоритмы *История IT Научно-популярное Процессоры

В последнее время слышно много жалоб: технический прогресс затормозился, научных открытий стало меньше, софт тормозит сильнее прежнего. Чуть ли не тотальная деградация.

Однако нельзя отрицать экспоненциального роста вычислительной мощности компьютеров в последние десятилетия. Более того, закон Мура и революция IT — один из главных факторов экономического прогресса в XX–XXI вв. Давайте вспомним некоторые отрасли, которые кардинально продвинулись вперёд благодаря экспоненциальному росту вычислений.

Один из очевидных примеров — моделирование (прогноз) погоды. Если вы не заметили, в последние десятилетия прогнозы погоды стали намного более детализированными, включая температуру с точностью до градуса, вероятность осадков, атмосферное давление, влажность, силу и направление ветра — всё это с почасовой раскладкой на день или несколько дней вперёд благодаря компьютерным вычислениям. В прежние времена такого невозможно было себе представить.

Читать далее
Всего голосов 17: ↑12 и ↓5 +7
Комментарии 35