tac Aug 12 2012 at 03:28

Получена траектория сворачивания вироидного рибозима или новости с фронтов при использовании ПО RNAInSpace

5 min

2.4K

Algorithms * Website development *

+51

123

Comments 123

giner Aug 12 2012 at 06:46

Можно в двух словах о том, что означает «свернуть вироидный рибозим»?

giner Aug 12 2012 at 06:48

Вообще что это за задача «свернуть РНК» и почему вы её решаете?

sielover Aug 12 2012 at 07:13

Все структуры белка — вторичная, третичная, четвертичная — определяются первичной структурой, т.е. аминокислотной последовательностью. Т.е. зная эту самую последовательность, можно быть уверенным в том, как именно «свернется» эта молекула, то есть какую именно пространственную структуру образует. И задача по сворачиванию — это именно определение итоговой четвертичной структуры.

SovGVD Aug 12 2012 at 09:06

А зачем это, т.е. для чего в итоге можно будет применить? Хорошо бы с примерами, так как для меня «свернуть вироидный рибозим» звучит как заклинание из какой то мифологии.

sielover Aug 12 2012 at 09:38

Упс. Прошу прощения за неточность, в данном случае изучается все-таки не белок, а РНК — единственная компонента вироида.

Работа рибозима — катализ расщепления других РНК или белков. Но катализ в молекулярной биологии, т.е. взаимодействие между катализатором и субстратом, определяется пространственными структурами. И, зная путь сворачивания рибозима, можно на этот катализ определенным способом на определенном этапе воздействовать.

Этим мои скромные познания в биоинформатике, пожалуй, ограничиваются

ixside Aug 12 2012 at 09:47

А можно написать про практической применение в реальном мире для обычных людей?

sielover Aug 12 2012 at 09:56

Вироид — патоген. Деактивировали вироид — считай, вылечили заболевание.

SovGVD Aug 12 2012 at 10:04

Т.е. как я понял — есть некая структура, которая неизвестно как закручивается, а если знать как она закручивается и какой формы становиться, то можно найти вариант уничтожения этой загогулины. Грубо говоря написать антивирус, зная сигнатуру вируса.

taral Aug 12 2012 at 17:56

Спасибо! Из за вас я смог понять о чем статья!

SovGVD Aug 12 2012 at 18:14

Чуть ниже расписали более подробно.

zar0ku1 Aug 12 2012 at 07:01

Больше интересно что это даст? для чего это все?

giner Aug 12 2012 at 08:23

Вот этот комментарий даёт хоть немного объяснения в чем вообще задача: habrahabr.ru/post/145917/#comment_4908800. Его нужно в начеле каждой статьи из этого цикла публиковать.

Литература говорите, вы мне лучше покажите программу которая сворачивает РНК, причем только с вводом первичной последовательности и предполагаемых водородных связей. Зачем мне читать сказки на ночь, которые не приближают к результату не на грамм? Для общего развития, спасибо — лучше фантастику Лема почитаю.

UFO landed and left these words here

ohifck Aug 12 2012 at 09:38

К сожалению, на мембране давно ничего не публикуется. Какие-то проблемы у них.

vxsw Aug 12 2012 at 09:44

Мембрана скурвилась.

hellman Aug 12 2012 at 10:06

Свернулась же…

vxsw Aug 12 2012 at 11:42

Криво свернулась, однако. Никакого вторичного катализа:(

int03e Aug 12 2012 at 09:49

Вы бы действительно вступление написали, зачем это всё. А то читаешь статью, и чувствуешь себя дебилом.

asci Aug 12 2012 at 11:29

Думаю именно так себя чувствуют работники не айтишных профессий, когда программисты рассказывают ему об отличии абстрактного класса от интерфейса.

UFO landed and left these words here

trikadin Aug 13 2012 at 14:00

«Рассказал другу профессиональный анекдот — полчаса объяснял терминологию».

Barsevich Aug 12 2012 at 17:07

Был такой коммент на хабре — повторю его:
Ничего не понял, но плюсанул :)

vxsw Aug 12 2012 at 11:30

Вот что я имею в виду, когда говорю, что сфера потенциальных применений ИТ никак не должна ограничиваться социалками-шмоциалками и производными от них сервисами. И что имеет в виду Рэй Курцвейл, когда говорит, что биология на наших глазах превращается в информационную технологию.

Почему это важно? Грубо говоря, у нас есть программно-аппаратная система без исходников и с обилием legacy-кода, в единственном экземпляре, без бэкапов, работающая практически на честном слове — работоспособность и кое-какие базовые ее функции поддерживаются только лишь благодаря изначальному многократному резервированию. В целом для изучения теоретически доступны несколько миллиардов экземпляров подобных систем с разными кодами инициализации (за небольшим исключением), связанными в общее дерево, а точнее граф, форков и мерджей; плюс к тому же имеется возможность создавать новые (с возрастающей ресурсоемкостью), но все они при этом поражены очень неприятным древним багом — тайм-бомбой. (Когда-то этот баг был фичей для ускорения очистки отработанных статичных базовых компонентов, но по мере усложнения систем продолжал валить все без разбору вместе со всеми приватными пользовательскими данными и самими пользователями.) Да и прочих, менее распространенных багов хватает. А эволюция и девелопмент систем исходно были ограничены только этапом производства дочерних процессов (тем самым, который теперь отнимает все больше ресурсов, ибо новый экземпляр системы теперь и обучать надо больше, и администрировать поначалу, ибо вокруг куча малвари, при этом материнскую систему тоже желательно побыстрее возвращать в строй) — и теперь все это выливается в хроническое торможение развития. Reset и тем более shutdown никому не нужен, кроме особо упоротых ламеров, и каждый из нас таким образом напрямую заинтересован в поддержании работы доставшегося ему экземпляра, независимо от типа разъемов, цветовых схем и соотношений сторон, исходных и дополнительных локалей и прочих фич этого средоточия багов.

Данная же технология означает прорыв в компиляции целого класса базовых компонентов, что потенциально способно ускорить процесс отладки (которую теперь в большей мере можно перенести на внешние платформы, свободные от перечисленных выше ограничений) и разработки патчей. Разумеется, это пока еще далеко не полный разбор завалов унаследованного кода; но возможность моделирования процессов на внешних вычислительных мощностях — это именно то, что рано или поздно позволит нам эти завалы разобрать, убрать тайм-бомбу и другие баги, взять под полный контроль рандомную генерацию дочерних процессов, обеспечить апгрейд существующих экземпляров систем «на лету» без перезагрузки, а затем подойти к полноценному бэкапу, портированию на альтернативные типы носителей и в другие пространственные среды.

SovGVD Aug 12 2012 at 12:54

Ну вот, так бы сразу =) а то какие то сворачивания, рибозимы и прочие вироидные штуки.

vxsw Aug 12 2012 at 13:00

Ну дык попробуй переведи это всё сразу на ИТшный язык (сразу предупреждаю: аналогия вольная и всего лишь приблизительно описывает для неспециалистов уровень сложности в отрасли, актуальные задачи и ситуацию с их решением).

iscsi Aug 12 2012 at 16:48

Доступными словами о сложном, спасибо.

mediagenia Aug 12 2012 at 17:36

А теперь представьте некого любопытного «обывателя», который сначала прочитал сам пост, а затем простое его объяснение доступными словами :)

Valery35 Aug 13 2012 at 07:13

Еще интересней посмотреть на биолога :)

trikadin Aug 13 2012 at 14:04

Ага, для него это был перевод с китайского на японский.

tac Aug 12 2012 at 20:08

Честно говоря, сразу не в курил…

Но похоже это то самое, что я описал как:

Так же можно говорить, о задачах псевдо-биологических. На самом деле, это будущие робототехники — наноработотехники — уже сейчас можно синтезировать искусственно РНК и белки. Но чтобы они работали они должны иметь определенную структуру. Для это надо просчитать из каких нуклеотидов/аминокислот нужно составить РНК/белок, чтобы он выполнял желаемую функцию. Тогда придумал механизм — и построили его путем синтезирования искусственной РНК/белков.

pfalcon Aug 14 2012 at 12:26

Душевно, ей-богу, это вам нужно писать статьи на такие темы ;-). Один из тех нечастых случаев, когда жалеешь, что плюсануть нельзя дважды. Реально в стиле Лема ;-).

stalkerg Aug 12 2012 at 12:37

Спасибо! Очень интересно. Надеюсь на развёрнутую статью где-нибудь в Nature ;)

PS Как хорошо что занимался этой областью и для меня все эти слова не пустой звук.

tac Aug 12 2012 at 13:01

> Надеюсь на развёрнутую статью где-нибудь в Nature

Вы мне льстите :) Я не биолог поэтому вряд ли меня в Nature пропустят… но пару статей уже в «компьютерных журналах» написаны… правда пока решается вопрос о публикации второй — уже получены новые результаты ;)

Но написать, что-то более точное я планирую… вот думаю — будет ли интересно проследить более точно за этапами сворачивания. Здесь то дан только фильм с одного ракурса, на сам деле имеется 20000 шагов сворачивания, и на каждом отрезки важно то или иное и можно рассмотреть с разных ракурсов… т.е. нужно ли аннотирование траектории сворачивания? (или это не представляет интереса для местной аудитории?)

stalkerg Aug 12 2012 at 13:40

1. в Nature не только биологи пишут статьи.
2. ну на Scientific American точно пойдёт

3. я думаю что то делать более детально будет интересно только в практическом смысле для учёных, для технарей не стоит.

vak Aug 12 2012 at 16:16

прикольно, что у нас тоже кто-то фолдингом занимается, да ещё и результативно. респект!

насчёт «траектории» мои 2 цента:

1. её в обычном понимании нет. процесс вообще не имеет внятной середины. это скорее семейство траекторий.

2. анотирование фаз свёртки — это по идее жутко важная задача: если вы опишите локальные конфигурации, через которые обязательно проходит фолдинг вашего белка, то вы можете предопределить, куда можно бы агрессивно прикрепиться мелким шустрым белкам с целью блокирования свёртки.

а вообще, вы молодец.

tac Aug 12 2012 at 19:15

Действительно нужно правильно понимать суть «траектории».

1. Действительно в природе не может быть последовательного сворачивания — оно идет параллельно сразу в нескольких местах. Вычислительно мы это принципиально не может промоделировать. Поэтому стоит чисто кибернетическая задача, в которой нужно реальную параллельную траекторию разложить на последовательные фазы.
2. С другой стороны, конечно с большой точностью получить траекторию нельзя — она и в реальности меняется под действием хаотических колебаний. Но она постепенно стабилизируется водородными связями, т.е. проходит через определенные этапы сворачивания. Вот только с точностью до этих этапов и можно промоделировать.

А вообще, спасибо.

vak Aug 12 2012 at 19:20

почти подпишусь под обоими пунктами. Впрочем, воздерживаюсь лезть не в свой монастырь со своими уставами, но если позволите, то навяжусь ещё с 2 центами.

tac Aug 12 2012 at 19:21

Конечно, пишите…

vak Aug 12 2012 at 19:48

1. «кибернетически», in silico — все эти слова рано или поздно подточат вес ваших хороших результатов, если вы будете нажимать на эти козырные карты без остановки. Рано или поздно вам попадутся коллеги действительно высокого уровня, а они захотят внятных и адекватных моделей. И у вас скорее всего будет лишь один выход, если вы продолжите поднимать планку — стохастическое (вероятностное) моделирование свёртки белков. детерминированность старой классической физики + стохастика. ближайшие сотни лет не будет ничего более мощного.

2. к деталям по стохастике: для каждого выбранного локального участка цепи белка есть вероятность той или иной трансформации при условиях соседних конфигураций цепи — это сеймейство законов распределения. да это множество жутко мощное, ну и что?

3. не обязательно формально доказывать, что все пути будут обязательно вести к той самой конечной сборке, достаточно «на уровне Монте-Карло» эсперементально показать, что из 10 независимо выбранных путей, все чудесно сошлись к вашей сборке (конечной конфигурации), вероятность которой в общем множестве была, казалось бы, ничтожна.

4. если правильно играть пунктами 2-4, то можно получить: а) модель свёртки, б) существование решения для свёртки выбранного вами белка, в) суждения о единственности свёртки, г) предоставить ваши же алгоритмы,… к которым будет уже совсем другое отношение.

vak Aug 12 2012 at 19:50

опечатки править нельзя, ну, да и ладно :)

tac Aug 12 2012 at 19:55

Этот комментарий почти о том же, и в принципе истина где-то рядом :)

tac Aug 12 2012 at 19:21

И да, суть аннотирования — как раз в том, чтобы показать в каких местах траектория реальная, а где проблематика моделирования. Дело в том, что моделирование это принципиально такая вещь, что можно получить сходство с реальным объектом только в определенных параметрах, а из-за вычислений (а не реального поведения) необходимо допускать вещи, которые в реальности не бывают.

Но все это надо очень тщательно писать… вот я и думаю, заниматься этим или лучше пойти свернуть тРНК…

tac Aug 12 2012 at 12:54

Итак, главный вопрос остался — зачем?

Выше уже сделали несколько пояснений: «это программа которая сворачивает РНК, причем только с вводом первичной последовательности и предполагаемых водородных связей», «зная эту самую последовательность, можно быть уверенным в том, как именно «свернется» эта молекула, то есть какую именно пространственную структуру образует»,

«есть некая структура, которая неизвестно как закручивается, а если знать как она закручивается и какой формы становиться, то можно ..»

а можно на самом деле много — действительно можно создать лекарственные препараты, для уничтожения вирусов. Если это не вирус, то знание сворачивания позволяет понять чем именно занимается эта РНК или белок — т.е. узнать функцию конкретного белка/РНК в организме (а это не всегда известно).

Так же можно говорить, о задачах псевдо-биологических. На самом деле, это будущие робототехники — наноработотехники — уже сейчас можно синтезировать искусственно РНК и белки. Но чтобы они работали они должны иметь определенную структуру. Для это надо просчитать из каких нуклеотидов/аминокислот нужно составить РНК/белок, чтобы он выполнял желаемую функцию. Тогда придумал механизм — и построили его путем синтезирования искусственной РНК/белков.

Ну, а менее фантастично — мы же еще не знаем как происходила жизнь. Изучить самодостаточен ли т.н. РНК-мир? Изучить эволюцию и происхождение видов. Все это еще не решенные задачи.

Но там каждый раз встречаешься с этой задачей — хочешь знать что делает белок/РНК — узнай как он свернулся.

Еще можно почитать мое введение в проблематику Геномика бросает вызов искусственному интеллекту.

Но что касается моих дальнейших изысканий, то недавно публиковал статьи Интересные результаты о эволюционной систематике прокариот или «многовидовое происхождение» и Использование UML для эксперимента по эволюционной систематике прокариот, теперь уже есть более обширные данные, скоро их обработаю и напишу статью. Но сравнивать тРНК нужно учитывая пространственную структуру — и так соединяться задача сворачивания и задачей эволюционной систематики… но это будущие.

iscsi Aug 12 2012 at 16:49

wetware developer

qnub Aug 12 2012 at 13:01

Всё, чувак, я твой фанат! Надеюсь кода-то у меня будет твой автограф…

eskofen Aug 12 2012 at 16:52

почему вы считаете, что Ваша модель сворачивает правильно? Для правильной трёхмерной структуры белка надо учитывать не только стерические факторы и комплиментарность водородных связей. Как насчёт термодинамики процесса с установлением конечной энергии системы? А то знаете, с математической точки зрения и коэффициенты в уравнениях можно понараставлять…
PbS+2O3=PbSO4+O2
PbS+4O3=PbSO4+4O2
6PbS+10O3=6PbSO4+3O2

mikhanoid Aug 12 2012 at 18:14

Вот именно. Человек говорит: давайте нафиг выбросим физику и химию с биологией, чего-то там посчитаем, и получим результат. Да ещё, вроде как, из статьи видно, что как-то он интересно воспринимает методы Монте-Карло. Хм… Как бы, надо сначало пойти к биологам с результатом и спросить: ребята, а у меня верно свернулось? А потом уже говорить: Свершилось!

tac Aug 12 2012 at 18:48

Это вопрос для данного конкретного случая решенный. В статье Биовычисления по сворачиванию. Снова простым языком о полученной модели сворачивания был дан «скелет» РНК, который я использую как базовый (2QUS). Он принципиально сходный с тем что получилось у меня для другого рибозима (в другом организме). Эти рибозимы имеют принципиально одинаковую структуру.

Нуклеотиды связанные водородными связями просто не могут занять другое положение. А полный набор водородных связей предопределяет структуру всех остальных нуклеотидов, иначе он просто не сможет образоваться.

eskofen Aug 12 2012 at 19:13

Очень замечательно, что вы пишете статьи, но в научном мире (на часть которого Вы явно желаете претендовать), помимо ссылок на свои публикации принято ссылаться на публикации в рецензируемых научных изданиях, подтверждающих Ваши доводы.

tac Aug 12 2012 at 19:23

Об этом будем говорить когда я буду писать очередную статью, и не тут в кулуарах с рецензентами :)

eskofen Aug 12 2012 at 19:08

да, Вы правы.
Однако, желание автора творить и изобретать изумляет (пусть и самонадеянно, но всё придёт с опытом).
Единственное, чего хотелось бы пожелать — это не пренебрегать опытом других отраслей науки и быть скромнее.

tac Aug 12 2012 at 19:37

> «не пренебрегать опытом других отраслей науки»

Не в коем случае я этого не делаю. Вы возможно не так поняли. Я всего лишь говорю, что методы популярные сейчас в биологии — не могут диктовать выбор методов для данной задачи при решении кибернетическим подходом. Биология заканчивается там где мы отбираем данные для эксперимента: секвенированную первичную последовательность, и предсказание водородных связей на основе расчета минимальной энергии. Далее черных кибернетический ящик. И на выходе полученная структура и траектория. Если полученная структура не совпадает с реальной — это не главный критерий, это лишь указывает, что что то мы не учли в смысле геометрических связей. Перевести физику на геометрию — это важный этап. Но если структуры сходятся (не в точности а принципиально), то наоборот, не биология может на нас влиять, а мы на биологию — делая достаточно осторожные выводы о фазах сворачивания.

eskofen Aug 12 2012 at 20:26

Ну нельзя после биологии просто взять и перейти к компьютеру, да и биология тут сомнительна, скорее биохимия. Выбор тех или иных методов, как правило, диктуется их надёжностью и предсказуемостью поведения. Именно поэтому этими методами и пользуются. Хотите новый инструмент для работы — да пожалуйста, но надо делать на основе того, что проверено и реально работает. Не может наука прыгать через ступень и не терпит за своей спиной белых пятен. В формировании третичной структуры в реальных условиях помимо стерического фактора различных групп и водородных связей будет оказывать влияние pH среды (да, среда может быть неблагоприятной или клетка может быть больна), может происходить «защита» какой-либо группы, которая будет влиять на структуру той же РНК. Влияющих факторов может быть вагон и тележка.
Если бы всё было так просто, как Вы пишете, то в боинке никто бы не создавал проект распределённого вычисления третичной структуры белков. Вот если бы Вам удалось создать модель с учётом «полных» физики и химии процесса, то это бы было замечательно.

tac Aug 12 2012 at 21:17

> если бы Вам удалось создать модель с учётом «полных» физики и химии процесса

В том то и дело, что это излишнее. Данный пример это демонстрирует. Будут и другие. И это как раз не прыганье, а именно начало как и требовалось с основ. Но сейчас все озаботились не идеализированными случаями, а сразу с «полной» физикой и химией процесса. И соответственно, ничего не выйдет. Как только «полную» физику и химию процесса перенесли на компьютер — все вы рассчитываете не физику и химию, а компьютерную модель, которая по определению отличается от реальной физики и химии. И похоже это все забывают. Строить компьютерные модели — это не тоже самое, что рассчитывать физику и химию процесса — ничего не получится. Все на самом деле достаточно просто и не связано с химией и физикой. Таким образом, тут правильнее даже применять не термин моделирование РНК, а конструирование РНК.

И действительно, влияющие факторы определяются не физикой/химией процесса — а точностью идеализированной модели. Захотим проследить что-то большие включим, но должна быть основа. И эта основа водородные связи — они есть может быть получена приближенная модель. А модели которые не образуют водородных связей, но учитывают «полную» физику и химию — это фикция — сродни «вечном двигателю».

Или Вы думаете, что можно получить несколько принципиальных разных структур, но у которых есть требуемые водородные связи? Вы ошибаетесь, чем сложнее РНК, тем все меньше вариантов. И уже у данного рибозима нет других вариантов структур, но со всеми имеющимися связями. В моей модели есть лишь малые неточности в положении отдельных нуклеотидов, но наличие образованных все водородных связей гарантирует правильность и совпадение с реальной структурой.

Ну, или иначе как в математике: доказывайте от обратного — получите еще хоть одну структуру данного рибозима со всеми водородными связями и имеющую другую структуру? Не получится, значит постулат моего кибернетическо-геометрического подхода верен. Получится, мне придется его уточнять. И вот так и только так я и пойду мелкими шашками. А то что сейчас делают биологи, физики и химики — это фикция — все равно, что получить атомную бомбу в каменном веке — вероятность около нуля. В то время как я разработал уже «теорию деления ядер».

eskofen Aug 12 2012 at 21:39

«А то что сейчас делают биологи, физики и химики — это фикция — все равно, что получить атомную бомбу в каменном веке — вероятность около нуля. В то время как я разработал уже «теорию деления ядер».»

Вы думаете, Ваше предположение никому никогда не приходило в голову? Или никто никогда не пытался решить эту задачу таким способом?

tac Aug 12 2012 at 21:45

Покажите где?

eskofen Aug 12 2012 at 22:11

да хотя бы тут. pubs.acs.org.sci-hub.org/doi/abs/10.1021/bi9906118 или тут www.sciencemag.org.sci-hub.org/content/185/4149/435.short. Все знают, все понимают, но механизм куда сложнее.

tac Aug 12 2012 at 22:14

Access Denied — это как то не «Все знают, все понимают»

tac Aug 12 2012 at 22:18

о заработало… можете мне облегчить и дать цитату того, что вы считаете «Все знают, все понимают»?

eskofen Aug 12 2012 at 22:46

нет, не могу. Вы претендуете на новизну, но при этом не провели литературный поиск? ВСе знают и все понимают — да банально в школе на уроках химии рассказывали, что возможность образования водородных связей в белках позволяет формировать третичную структуру, а затем и в универе этот вопрос распиливался неоднократно.

tac Aug 12 2012 at 22:59

Разговор не о чем.

Valery35 Aug 13 2012 at 07:25

Если раньше не сталкивались, посмотрите на sci-hub повнимательней — хороший сервис для анализа состояния вопроса. То что в этой публикации его нет — не страшно. Но делать его все равно придется.

Из общих впечатлений — напоминает взаимодействие it-метематики-геологии. Оно началось, видимо, пораньше. И наблюдаются сходные подходы и проблемы.

Valery35 Aug 13 2012 at 07:30

Еще. Из школы вспомнилось…
Биосинтез. Полирибосома бежит по ДНК, к ней подтягиваются РНК с аминокислотами на хвосте, и рибосома проводит проверку соответствия кода РНК коду ДНК. Если подходит, то аминокислота добавляется к строящейся молекуле.
Вы этот процесс моделируете?

tac Aug 13 2012 at 12:49

Нет это другое.

tac Aug 12 2012 at 22:16

«Все знают, все понимают» — и этого мало, где ПО которое позволяет получить третичную структуру на основании водородных связей? Пусть это и «просто и не точно», но где? И уж это будет точнее, того что вообще нет.

eskofen Aug 12 2012 at 22:31

ищите, смотрите научную литературу, соответствующий софт и описание базисов, используемых при расчёте.

tac Aug 12 2012 at 23:31

Опять совет ни о чем, выдающийся за показательно содержательный. Как Вы думаете, если ведущие специалисты (rosseta@home) не включили в свою игру FoldIt то, что «все знают, все понимают» — может это не так просто, как кажется?

tac Aug 12 2012 at 22:24

В одной статье у которой у меня есть доступ — нет ни слова о компьютерном моделировании. О чем вы тогда?

Vayun Aug 13 2012 at 09:19

У вас коротковата логическая цепочка «этот рибозим можно свернуть единственным образом, значит все существующие белки и РНК можно свернуть только одним образом».

Вообще не понятно, если программа суперавтоматически сворачивает что угодно, то почему бы не привести в пример свертку 1000 белков или хотя бы сотни. Это обычная практика в науке — воспроизведение известных результатов. Понятно что начинают с одного «тренировочного» примера, но заявление «она может всё» на основе этого не делают.

eskofen Aug 13 2012 at 12:41

бесполезно. Я уже пытался это объяснить.

tac Aug 13 2012 at 12:51

Заявлений «она может всё» никто не делал, читайте внимательнее, также речь не шла о суперавтоматике, наоборот речь о полуавтоматике.

eskofen Aug 13 2012 at 14:31

Ваша полуавтоматика — это суперупрощённая модель из используемых ныне методов расчёта структуры белков, основанных на молекулярной динамике. Разница заключается в том, что Вы на самом деле кричите об изобретении колеса, когда все кругом уже лет так 50-60 ездят на автомобилях с ДВС.
Разница в том, что современные методы учитывают огромное количество параметров, таких как полярность групп, парные взаимодействия (в которые, кстати, попадают и водородные связи), гибкость связей и пр. А дополняя всё это полуэмпирическим методам квантовой химии проводят оптимизацию геометрии и энергии молекулы. И да, это всё очень и очень ресуркоёмкие задачи, требующие длительного времени расчёта и оптимизации всех параметров. А когда структура рассчитана, то на её основании моделируется спектр ямр или рентгенограмма, которые сравниваются с таковыми для реальных образцов.

tac Aug 13 2012 at 15:04

Вы не понимаете о чем говорите, учитесь.

eskofen Aug 13 2012 at 15:39

До магистра химии доучился. а Вы?

tac Aug 13 2012 at 16:01

Не люблю трепаться с пустословами, мнящими из себя специалистов. Поэтому повторю то, что писал еще в 3 статье на эту тему:

Тем же кто желает тут похоливарить. Давайте так. Я такой любитель — которому погоны специалистов значут мало, а наука такое дело требует повторяемости (а не бизнес-скрытности, это же не бизнес, чтобы скрывать детали своих алгоритмов и не публиковать их код?), поэтому просто разговоры меня интересуют мало. Но меня очень интересует когда мне показывают, что я занимаюсь немного не тем, и что есть люди которые действительно чего-то добились. Вот задача над которой я мучаюсь. Решите и покажите, что это просто — буду очень благодарен.

Я даю произвольную (реально существующую) первичную последовательность до 100 нуклеотидов. Указываю все водородные связи которые нужно образовать. Вы на выходе даете мне файл .pdb, в котором третичная структура из указанной первичной последовательности и где образованы все требуемые водородные связи. Ни каких других требований.

А «мерится» идите в другое место…

eskofen Aug 13 2012 at 17:10

«Померяться» вообще-то захотели Вы первым. Кричите о своей крутости, но при этом банально не хотите признавать опыт и наработки других людей. Я ж Вам написал ссылку на скай-хаб (можно скачать практически любую научную статью) — ищите, читайте, смотрите. На самом деле не всё так просто, как кажется. На хабре Вам никто ничего толком не скажет, а если Вы хотите испытать модель на «живучесть», напишите статью в Journal of Computational Science или Proteins и у Вас будет возможность побеседовать с профи, занимающихся такой же тематикой.

И повторюсь ещё раз: ссылаться только на свои статьи — признак дурного тона. Будьте осторожны, а то помню одно время к нам на факультет приходил мужик и требовал признания его «периодической системы».

tac Aug 13 2012 at 17:21

Мне не надо ничего искать, если Вы как специалист не знаете о таких системах, чтобы решить мою простенькую задачу — значит их нет.

Поэтому моя фраза: А это пусть малое — но достижение. Такой автоматики, которая проста на самом деле и пусть еще не до конца автоматизирована — еще нет ни у кого. — далеко не эквивалент «кричите о своей крутости», если вы так воспринимаете мои слова — это сугубо ваша психологическая проблема.

tac Aug 13 2012 at 17:25

Вы читали мою научную статью? Там ссылки только на мои статьи? Тогда о чем Вы?

eskofen Aug 13 2012 at 18:00

так с этого и надо было начинать, а не с 12 статей на одном ресурсе.

Kolegg Aug 12 2012 at 19:34

А тестировался ли этот метод на молекуле с известной структурой? какой процент совпадений?
Например, если на вход поместить недлинную нуклеотидную последовательность, то получим спираль на выходе?

tac Aug 12 2012 at 19:50

Если для не длиной последовательности вы зададите расположение водородных связей — то конечно будет достаточно быстро получена спираль. Но надо учитывать, что вариаций спиралей может быть достаточно много. Тогда какой смысл их сравнивать с известной, не понятно тогда что-такое процент совпадений.

Когда речь уже о двух спиралях, свернуть отдельно две спирали не проблема, но между спиралями тоже есть водородные связи. Это существенно уменьшает число вариаций контакта этих спиралей и их формы. Это диктует окончательную структуру РНК. Но опять же как это сравнивать с известной?

В данном эксперименте такой цели не было — оценили на глаз, т.е. структура по сути принципиально такая же. Разница может быть только в мелких не так повернутых нуклеотидах, которые не имеют водородных связей.
Цель эксперимента была в другом — можно ли этим методом и как получить все заданные водородные связи. Т.е. в терминах теории игр: обеспечивает ли ход игры обязательное попадание из начального положения в конечное. Все текущие методы не озабочиваются этим вопросов, что существенно не правильно. Нельзя методом который не обеспечивает попадание из начального состояния в конечное получить что-то приближенное к реальности.

Но следующий эксперимент с тРНК специально будет для желающих совпадения — на известной структуре тРНК. Но вопрос с адекватной оценкой совпадений тоже остается, где гарантии, что известная структура не может колебаться в малых расстояниях — РНК то подвижна. И потом методы получения известной структуры тоже с ошибками — кристаллография и ЯМР — тоже имеет ошибки. Так как сравнивать?

eskofen Aug 12 2012 at 21:10

суть физических методов, будь то ЯМР или РСА в том, что они могут взаимодополнять друг друга, и если по данным двух методов результаты идентичны, то их с большой долей вероятности можно считать правильными
Смысл вопроса в том, что если взять белок известной структуры и просто задать его вашей программе в виде -A-U-U-C-A-A-C-G-U-G-C-A-C- (последовательности аминокислотных остатков), то Ваша софтина его «свернёт» правильно?
(корректность структуры нужно определять не «на глаз»)

tac Aug 12 2012 at 21:27

Ваша последовательность не имеет водородных связей , соответственно не свернется вообще. Дайте мне тогда реальную последовательность. И расскажите как правильно нужно определять корректность (т.е. ответьте на вопрос ниже).

Тогда посмотрим в чем отличия. Но на односпиральных последовательностях, вполне может быть другой угол наклона спирали, но для многоспиральных последовательностях это уже исправляется за счет необходимости спиралям контактировать между собой.

А вот если односпиральная РНК в моей модели будет отличаться (думаю только углом спирали) — то вот тогда и будет вопрос биологам — чем определяется именно вот такой угол наклона спирали. Это уже не моя епархия, и мне нужен ответ биолога. Но они однозначно не могут на это ответить.

tac Aug 12 2012 at 20:51

Следующий эксперимент будет на известной структуре тРНК.

Специалистам вопрос — как правильно сравнивать (т.е. как это сейчас принято) полученную структуру с тем что есть. Есть ли программы которые это делают (вида подали два pdb файла, и получили разницу)?

eskofen Aug 12 2012 at 21:17

поищите тут.

eskofen Aug 12 2012 at 21:24

снова ссылка потерялась… predictioncenter.org/

или попинайте биохимиков на forum.xumuk.ru/

tac Aug 12 2012 at 21:44

Хотелось бы конкретнее, очень мне не хотелось бы писать этот алгоритм расчета самому (скажут еще, что не так написал ;) ) — речь идет о каком либо стандартном средстве.

Надо еще правда определится с показателем расчета, так например многие используют величину RMSD, но в то же время пишут:

величина RMSD не может служить достоверным показателем степени свернутости биологической молекулы. В данной работе авторы применительно к РНК предложили использовать величину «нативная характеристика» — NC, которая была определена как разница количества межатомных контактов, присутствующих в нативной конформации и количество контактов, не характерных для нативной конформации

Но если речь о такой «нативной характеристике» — то в данной модели 100% совпадение (т.к. какие могут быть еще «межатомные контакты» в РНК кроме водородных связей — непонятно)

chupvl Aug 13 2012 at 04:04

Важная вещь: если вы надеетесь найти в биологических или химических науках ФАКТЫ, то вы разочаруетесь — вы найдете лишь приближения и допущения, реальные для данных условий.

tac Aug 13 2012 at 04:20

Согласен. Но хотелось бы хотя бы четко сформулированные приближения и допущения, реальные для данных условий, а не размытые по ряду статей.

А то поразительная вещь — хотим получать точные модели, а входные данные которые мне нужны сформулировать математически не можем.

tac Aug 13 2012 at 04:23

В принципе я уже переболел этим (поиском точности и фактов) — теперь я к биологам, физикам и химикам отношусь так же как программист к пользователям, которые объясняет какой ему нужен GUI, а сам не знает.

eskofen Aug 13 2012 at 12:46

>теперь я к биологам, физикам и химикам отношусь так же как программист к пользователям

а вы к нашей диаспоре и не относитесь. Вы для нас всего-лишь термодинамическая система биологического происхождения

tac Aug 12 2012 at 21:49

В общем уточним вопрос: кто в курсе

есть ли стандартная признанная в сообществе биологов программа расчета RMSD по двум .pdb файлам?

eskofen Aug 12 2012 at 21:56

много различных моделей расчёта структуры белков бывает тут onlinelibrary.wiley.com/journal/10.1002/(ISSN)1096-987X

посомтрите, может что-то будет относительно сравнения

tac Aug 12 2012 at 22:09

там же все статьи платные, не годится :)

eskofen Aug 12 2012 at 22:16

sci-hub.org никто не отменял ;)

chupvl Aug 12 2012 at 22:48

тсссс…

chupvl Aug 12 2012 at 22:19

Я опять буду злым и нудным ученым, знающим биологию, химию и физику.
1. Поздравляю, будет интересно прочитать
2. Можно чуть подробнее как вы использовали 2QUS?
3. Как вы определили что вы правильно свернули?

tac Aug 12 2012 at 22:35

1. Спасибо, но будьте помягче :) и ответьте на встречные вопросы, которые у меня есть для знающих биологию, химию и физику

2. 2QUS — для определения межспиральных водородных связей, которые должны быть в моем рибозиме, а также для визуального определения структуры

3. Визуально по форме совпадения с 2QUS. Да я знаю, что вы захотите большей точности, чем принципиальное совпадение. Этого мне не было нужно. Я это уже пояснял. Цель эксперимента в другом. Но теперь можно поиграть и по вашим правилам. Но ответьте мне тогда на мой вопрос: какой метод определения «правильности» вас (биологов) удовлетворит? Какие программы вы для этого сочтете убедительными? Какие допущения в расхождение относятся к незначительным?

chupvl Aug 12 2012 at 22:38

Для меня подойдет RMSD основное цепи + совпадение топологии. О сравнение РНК вы сами упоминали ряд статей.

chupvl Aug 12 2012 at 22:38

и еще: а вы делали выравнивание последовательностей этих двух РНК?

tac Aug 12 2012 at 22:41

> вы делали выравнивание последовательностей этих двух РНК?

Да, но вручную, т.к. автоматическое выравнивание тут не справляется (по вполне понятным мне причинам).

chupvl Aug 12 2012 at 22:49

я это упомянул по простой причине, вы все же в какой-то мере использовали шаблон для построения модели, поэтому вопрос: какова идентичность между последовательностями?

tac Aug 12 2012 at 22:52

Она совпадает в очень малой, но именно важной консервативной части — этого достаточно. Впрочем судите сами:

Сравнение двух рибозимов

tac Aug 12 2012 at 22:42

> совпадение топологии

Как определяется? Визуально или есть методы?

tac Aug 12 2012 at 22:43

> RMSD основное цепи

Можете подсказать программы куда подаешь два .pdb и получаешь эту оценку?

chupvl Aug 12 2012 at 22:44

попробуйте biopython, я просто пользуюст другими программами

tac Aug 12 2012 at 22:50

А может есть что нибудь, не требующие устанавливать Питон, и нормально работающие на Windows 7? Может PyMol это умеет?

chupvl Aug 12 2012 at 22:51

Точно, Pymol умеет — align rna1,rna2. Вроде так.

tac Aug 12 2012 at 22:53

спасибо

tac Aug 12 2012 at 23:07

Правильно я понимаю, что «RMSD основное цепи» (align rna1,rna2) посчитает соответствие только основой цепи (Backbone), а положение радикалов (sidechain) в эту оценку не войдет?

chupvl Aug 12 2012 at 23:09

не уверен, но мне кажется backbone входит в учет RMSD, но его можно отключить
www.pymolwiki.org/index.php/Align

chupvl Aug 12 2012 at 23:10

посмотрите еще вот сюда на всякий случай
pymolwiki.org/index.php/Cealign

tac Aug 12 2012 at 23:12

А когда Вы говорили «Для меня подойдет RMSD основное цепи + совпадение топологии.» — имели введу с backbone или нет?

chupvl Aug 12 2012 at 23:14

я считаю, что основной цепи достаточно (но это вроде как общепринятое).

tac Aug 12 2012 at 23:15

И еще какой RMSD считается допустимым? Это как то зависит от длины последовательности?

chupvl Aug 13 2012 at 00:12

не могу сказать за РНК, но для белков до 4 ангстрем, но все относительно, если петля куда-то ушла в сторону, и не с чем не взаимодействует, то сложно говорить о том, что выравнивание плохое.

tac Aug 13 2012 at 01:26

4 ангстрем — это именно RMSD, т.е. как сумма по всем нуклеотидам?

chupvl Aug 13 2012 at 02:00

да

tac Jul 12 2014 at 07:17

Прокомментирую тут пока… добрался я померить RMSD для одной известной тРНК (71 нуклеотид)

Вот статья для которой авторы хвастаются, что для РНК длиной до 30 нуклеотидов (по сути одна спираль, а не 3 связанных как в моем случае) они получают RMSD до 4 Ангстрем
www.ncbi.nlm.nih.gov/pubmed/17726102

У меня для черновика получилось 7.2 А… причем был сюрприз, сложные петли образовались достаточно хорошо, а вот начальная А-петля отошла значительно…

tac Jul 12 2014 at 07:22

это примерно для 630 из 740 атомов (остальные атомы он выкинул как далекие)

tac Aug 12 2012 at 22:40

3. Ах, да еще просто уверен, что если совпадают все водородные связи в РНК, то получить нечто совершенно отличное от реальной структуры РНК — просто не возможно. Эта моя уверенность ничем не доказана, но не доказано и обратное. В этом вообще темное пятно в науке, хотя на мой взгляд не профессионала на это нужно отвечать в первую очередь — хорошо бы даже в школьной программе.

chupvl Aug 12 2012 at 22:52

что значит совпадает?
идентичные основания образуют одинаковые водородные связи?

tac Aug 12 2012 at 22:58

Нет, нет. Речь идет не о сравнении с образцом ( 2QUS ). Для первичной последовательности достаточно легко предсказываются места водородных связей. Используем их. Далее если правильно выравнить с образцом (ссылку дал выше), то можно получить и места межспиральных водородных связей.

Тогда если получается получить (сформировать) эти водородные связи в модели, то она будет лишь не существенно отличаться от реальной структуры РНК.