Как стать автором
Обновить

Комментарии 26

Если белка нет в Protein Data Bank, и не хочется заморачиваться с его построением, то для оценочных прикидок можно заглянуть в https://alphafold.ebi.ac.uk, у него нормальная точность, по крайней мере на тех белках с которыми я работаю (семейство CHD)

Спасибо за статью, студентам будет полезно!

Вам спасибо за комментарий.)

Ничего не понял, но плюс на всякий случай поставил.

Подскажите пожалуйста. Если рассматривать построение модели белка с математической точки зрения то она сводится к NP задачи коммивояжёра?

Практически сводится к NP.

Хотя я не взял во внимание взаимоположение частей— какие активные участки окажутся снаружи. Тогда угадывание "сводиться" не будет к NP=)

Спасибо, познавательно. Но все же не очень понятно, как этим знанием можно воспользоваться.

Было бы очень интересно почитать про полный тулчейн в биотехе.

Например, вот мы описали белок какого-то клеточного рецептора и хотим к нему что-нибудь прицепить. Вот так определяем требования к белку, который сможет прицепиться к рецептору и к полезной нагрузке. Вот таким способом подбираем кодирующую последовательность, которая свернется в нужный белок. Потом выбираем платформу, которой будем производить нужный белок и связывать его с полезной нагрузкой. А вот так доставлять его в целевой организм. Ну и далее в том же духе.

Не просто hello world, а хотя бы биотешный todo list :)

Спасибо за комментарий. Возможно выкатим подобную статью, но явно не скоро.

Обычно это не обязательно белок-белковые взаимодействия. но да, определяются лиганды, которые хорошо связываются и из них по критериям (токсичность, избирательность и т.п.) выбираются похожие на будущие лекарства, затем клинические исследования и вывод препарата на рынок

Интересная статья, хотя и сложно понимаемая :) И у меня сразу появился вопрос: учитывает ли этот алгоритм направление построения аминокислотной последовательности во времени. По сути, вторичная структура появляется уже сразу в рибосоме. И очевидно, что при одном и том же наборе трикодонов, но прописанных слева направо или справа налево, вторичная конформация может быть разной. В одном случае сразу появится какая-либо связь между участками аминокислот и будет одна пространственная геометрия, а в другом такой связи может и не случиться.

Для начала отмечу, что в биосинтезе направление синтеза задается четкими последовательностями начала и конца, а это значит, что рибосома не садится абы на какой кусок. Из этого вытекает, что мы можем предсказать пространственную геометрию характерную для определенной конформации с определенной вероятностью.

Собственно здесь и вступают в игру алгоритмы. Их цель проста— они ищут правдоподобные вероятности. Но ищут они, если ты прописал в них "полочки с книгами" в которых нужно искать объект подобия. Вот они там и ищут. И находят самый реалистичный вариант на основании эмперических данных. Эти данные алгоритмы и учитывают. Задача алгоритмов предсказать самый реалистичный вариант из всех. Насколько он реалистичный говорит статистическая значимость, поддержка модели, точнее ее качество. Все строго на физических и математических законах, чем выше качество модели, тем выше её достоверность и ошибка крайне маловероятна. Не очень часто бывает так, что высококачественная модель может врать. Эмперических данных все же хватает.

Спасибо за ответ. А бывают белки, которые имеют одинаковую последовательность, но разные конформации (как например правосторонние и левосторонние молекулы - хиральность) и при этом разные свойства ?

Скорее да, чем нет.

1) Многие белки проходят пострансляционные модификации (например фосфорилирование), которые могут менять конформацию и активность белка.

2) Связывания с лигандами как с природными, так и с ксенобиотиками (например, лекарствами) может существенно менять конформацию некоторых участков.

3) Многие белки эукариот сворачиваются не сами по себе, а в этом процессе участвуют белки - шапероны.

4) Амилоид - по сути белок который неправильно свёрнут.

5) Рядом с пунктом 4 тусуются преоны - патогенные белки, которые могут искажать конфорацию нормальных белков превращая их в преонную токсичную форму.

Опередили. Спасибо за комментарий.

Очень интересно! Спасибо :) Продолжайте просвещать!!! И вот еще вопрос возник, анализируется ли этими алгоритмами структуры РНК молекул? Они же тоже имеют разные пространственные формы и разные функции ( вроде по последним данным, сначала жизнь была исключительно РНКовой и эти молекулы выполняли все функции для обеспечения жизнедеятельности)

На самом деле интересный вопрос. Однако, честно скажу, что ни я, и не автор не моделировали РНК подобными алгоритмами. Мы работали с белками, но Вы можете попробовать спросить у Жуковой Алины Александровны (в статье ссылка). Она биоинформатик и думаю ответит лучше нас на этот вопрос. Тем не менее анализирование генов кодирующих РНК разумеется есть, в частности для построения различных эволюционных деревьев. Например, в качестве маркера идентификации эукариотических организмов используют рибосомальные РНК гены 18S. И по построению эволюционных деревьев алгоритмы могут быть схожи.

Огромная благодарность! :) Какие интересные профессии появились за последние десятилетия! Буду ждать новых статей!

Вам спасибо за прочтение.

А как в двух словах результат описать? И да, эмпирических. Все выглядит как то шатко.

В двух словах если, то : результат— модель

Тут вопрос в том, что моделирование пространственной структуры белка, даже с использованием нейросетей (привет Alpha fold) не является той самой серебряной пулей мол. биологии, которая вот вот оставит без работы меня (РСА), ЯМР-структурщиков и электронных микроскопистов. Скажем так: хорошо предсказывается структура высококонсервативных участков и/или малоподвижных элементов. Всё остальное, по-моему опыту сравнения экспериментальных структур и моделирования - не очень. (По-правде с высоско-подвижными длинными петлями и РСА не всегда справляется). Если интересно - могу описать подробнее.

не является той самой серебряной пулей мол. биологии, которая вот вот оставит без работы меня (РСА), ЯМР-структурщиков и электронных микроскопистов

Разумеется не оставит, ибо без микроскопии и рентгенографии никуда. Это точно также, как никуда и молекулярной кладистике без морфологии по объективным причинам. Насколько я знаю, то структурная геномика и протеомика нужны не для убийства каких либо отраслей. Будь-то микроскопия, или моделирование белков, вещи в равной степени неообходимы. И они дополняют друг друга. Исключать из этих двух вещей, одну— это стрелять в себе в колено.

Стоит упомянуть https://fold.it/ - для учебно-познавательных целей удобнее и спортивно-игровая составляющая там хорошо сделана

Стыдно признаться, но... я так и не понял как извлекать пользу? Это же полезный материал? Наверное где-то рядом на сайте лежит статья, в которой приведены многочисленные пример найденных таким способом белков, которые перевернули мир человеков, сделали его лучше...

Здравствуйте. Была статья о структурной геномике от нашего биотехнолога здесь. Там освещалось зачем нужно предсказывать структуру белков. Также данный материал может быть полезным и для студентов, собственно выше в комментариях об этом верно подметили.

многочисленные пример найденных таким способом белков,

Зачем "найденных"? Изготовленных. Нужен Вам некий белок — и у Вас есть два варианта: епстись со стандартным химическим производством, либо перекодировать белок обратно в ДНК, внедрить эту ДНК при помощи CRISPR в дрожжи — и вуаля: в Вашем биореакторе полным-полно произведённого дрожжами нужного белка.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий