Все потоки
Поиск
Написать публикацию
Обновить

Комментарии 123

Можно в двух словах о том, что означает «свернуть вироидный рибозим»?
Вообще что это за задача «свернуть РНК» и почему вы её решаете?
Все структуры белка — вторичная, третичная, четвертичная — определяются первичной структурой, т.е. аминокислотной последовательностью. Т.е. зная эту самую последовательность, можно быть уверенным в том, как именно «свернется» эта молекула, то есть какую именно пространственную структуру образует. И задача по сворачиванию — это именно определение итоговой четвертичной структуры.
А зачем это, т.е. для чего в итоге можно будет применить? Хорошо бы с примерами, так как для меня «свернуть вироидный рибозим» звучит как заклинание из какой то мифологии.
Упс. Прошу прощения за неточность, в данном случае изучается все-таки не белок, а РНК — единственная компонента вироида.

Работа рибозима — катализ расщепления других РНК или белков. Но катализ в молекулярной биологии, т.е. взаимодействие между катализатором и субстратом, определяется пространственными структурами. И, зная путь сворачивания рибозима, можно на этот катализ определенным способом на определенном этапе воздействовать.

Этим мои скромные познания в биоинформатике, пожалуй, ограничиваются
А можно написать про практической применение в реальном мире для обычных людей?
Вироид — патоген. Деактивировали вироид — считай, вылечили заболевание.
Т.е. как я понял — есть некая структура, которая неизвестно как закручивается, а если знать как она закручивается и какой формы становиться, то можно найти вариант уничтожения этой загогулины. Грубо говоря написать антивирус, зная сигнатуру вируса.
Спасибо! Из за вас я смог понять о чем статья!
Чуть ниже расписали более подробно.
Больше интересно что это даст? для чего это все?
Вот этот комментарий даёт хоть немного объяснения в чем вообще задача: habrahabr.ru/post/145917/#comment_4908800. Его нужно в начеле каждой статьи из этого цикла публиковать.
Литература говорите, вы мне лучше покажите программу которая сворачивает РНК, причем только с вводом первичной последовательности и предполагаемых водородных связей. Зачем мне читать сказки на ночь, которые не приближают к результату не на грамм? Для общего развития, спасибо — лучше фантастику Лема почитаю.
НЛО прилетело и опубликовало эту надпись здесь
К сожалению, на мембране давно ничего не публикуется. Какие-то проблемы у них.
Мембрана скурвилась.
Свернулась же…
Криво свернулась, однако. Никакого вторичного катализа:(
Вы бы действительно вступление написали, зачем это всё. А то читаешь статью, и чувствуешь себя дебилом.
Думаю именно так себя чувствуют работники не айтишных профессий, когда программисты рассказывают ему об отличии абстрактного класса от интерфейса.
НЛО прилетело и опубликовало эту надпись здесь
«Рассказал другу профессиональный анекдот — полчаса объяснял терминологию».
Был такой коммент на хабре — повторю его:
Ничего не понял, но плюсанул :)
Вот что я имею в виду, когда говорю, что сфера потенциальных применений ИТ никак не должна ограничиваться социалками-шмоциалками и производными от них сервисами. И что имеет в виду Рэй Курцвейл, когда говорит, что биология на наших глазах превращается в информационную технологию.

Почему это важно? Грубо говоря, у нас есть программно-аппаратная система без исходников и с обилием legacy-кода, в единственном экземпляре, без бэкапов, работающая практически на честном слове — работоспособность и кое-какие базовые ее функции поддерживаются только лишь благодаря изначальному многократному резервированию. В целом для изучения теоретически доступны несколько миллиардов экземпляров подобных систем с разными кодами инициализации (за небольшим исключением), связанными в общее дерево, а точнее граф, форков и мерджей; плюс к тому же имеется возможность создавать новые (с возрастающей ресурсоемкостью), но все они при этом поражены очень неприятным древним багом — тайм-бомбой. (Когда-то этот баг был фичей для ускорения очистки отработанных статичных базовых компонентов, но по мере усложнения систем продолжал валить все без разбору вместе со всеми приватными пользовательскими данными и самими пользователями.) Да и прочих, менее распространенных багов хватает. А эволюция и девелопмент систем исходно были ограничены только этапом производства дочерних процессов (тем самым, который теперь отнимает все больше ресурсов, ибо новый экземпляр системы теперь и обучать надо больше, и администрировать поначалу, ибо вокруг куча малвари, при этом материнскую систему тоже желательно побыстрее возвращать в строй) — и теперь все это выливается в хроническое торможение развития. Reset и тем более shutdown никому не нужен, кроме особо упоротых ламеров, и каждый из нас таким образом напрямую заинтересован в поддержании работы доставшегося ему экземпляра, независимо от типа разъемов, цветовых схем и соотношений сторон, исходных и дополнительных локалей и прочих фич этого средоточия багов.

Данная же технология означает прорыв в компиляции целого класса базовых компонентов, что потенциально способно ускорить процесс отладки (которую теперь в большей мере можно перенести на внешние платформы, свободные от перечисленных выше ограничений) и разработки патчей. Разумеется, это пока еще далеко не полный разбор завалов унаследованного кода; но возможность моделирования процессов на внешних вычислительных мощностях — это именно то, что рано или поздно позволит нам эти завалы разобрать, убрать тайм-бомбу и другие баги, взять под полный контроль рандомную генерацию дочерних процессов, обеспечить апгрейд существующих экземпляров систем «на лету» без перезагрузки, а затем подойти к полноценному бэкапу, портированию на альтернативные типы носителей и в другие пространственные среды.
Ну вот, так бы сразу =) а то какие то сворачивания, рибозимы и прочие вироидные штуки.
Ну дык попробуй переведи это всё сразу на ИТшный язык (сразу предупреждаю: аналогия вольная и всего лишь приблизительно описывает для неспециалистов уровень сложности в отрасли, актуальные задачи и ситуацию с их решением).
Доступными словами о сложном, спасибо.
А теперь представьте некого любопытного «обывателя», который сначала прочитал сам пост, а затем простое его объяснение доступными словами :)
Еще интересней посмотреть на биолога :)
Ага, для него это был перевод с китайского на японский.
Честно говоря, сразу не в курил…

Но похоже это то самое, что я описал как:

Так же можно говорить, о задачах псевдо-биологических. На самом деле, это будущие робототехники — наноработотехники — уже сейчас можно синтезировать искусственно РНК и белки. Но чтобы они работали они должны иметь определенную структуру. Для это надо просчитать из каких нуклеотидов/аминокислот нужно составить РНК/белок, чтобы он выполнял желаемую функцию. Тогда придумал механизм — и построили его путем синтезирования искусственной РНК/белков.
Душевно, ей-богу, это вам нужно писать статьи на такие темы ;-). Один из тех нечастых случаев, когда жалеешь, что плюсануть нельзя дважды. Реально в стиле Лема ;-).
Спасибо! Очень интересно. Надеюсь на развёрнутую статью где-нибудь в Nature ;)

PS Как хорошо что занимался этой областью и для меня все эти слова не пустой звук.
> Надеюсь на развёрнутую статью где-нибудь в Nature

Вы мне льстите :) Я не биолог поэтому вряд ли меня в Nature пропустят… но пару статей уже в «компьютерных журналах» написаны… правда пока решается вопрос о публикации второй — уже получены новые результаты ;)

Но написать, что-то более точное я планирую… вот думаю — будет ли интересно проследить более точно за этапами сворачивания. Здесь то дан только фильм с одного ракурса, на сам деле имеется 20000 шагов сворачивания, и на каждом отрезки важно то или иное и можно рассмотреть с разных ракурсов… т.е. нужно ли аннотирование траектории сворачивания? (или это не представляет интереса для местной аудитории?)
1. в Nature не только биологи пишут статьи.
2. ну на Scientific American точно пойдёт

3. я думаю что то делать более детально будет интересно только в практическом смысле для учёных, для технарей не стоит.
прикольно, что у нас тоже кто-то фолдингом занимается, да ещё и результативно. респект!

насчёт «траектории» мои 2 цента:

1. её в обычном понимании нет. процесс вообще не имеет внятной середины. это скорее семейство траекторий.

2. анотирование фаз свёртки — это по идее жутко важная задача: если вы опишите локальные конфигурации, через которые обязательно проходит фолдинг вашего белка, то вы можете предопределить, куда можно бы агрессивно прикрепиться мелким шустрым белкам с целью блокирования свёртки.

а вообще, вы молодец.
Действительно нужно правильно понимать суть «траектории».

1. Действительно в природе не может быть последовательного сворачивания — оно идет параллельно сразу в нескольких местах. Вычислительно мы это принципиально не может промоделировать. Поэтому стоит чисто кибернетическая задача, в которой нужно реальную параллельную траекторию разложить на последовательные фазы.
2. С другой стороны, конечно с большой точностью получить траекторию нельзя — она и в реальности меняется под действием хаотических колебаний. Но она постепенно стабилизируется водородными связями, т.е. проходит через определенные этапы сворачивания. Вот только с точностью до этих этапов и можно промоделировать.

А вообще, спасибо.
почти подпишусь под обоими пунктами. Впрочем, воздерживаюсь лезть не в свой монастырь со своими уставами, но если позволите, то навяжусь ещё с 2 центами.
Конечно, пишите…
1. «кибернетически», in silico — все эти слова рано или поздно подточат вес ваших хороших результатов, если вы будете нажимать на эти козырные карты без остановки. Рано или поздно вам попадутся коллеги действительно высокого уровня, а они захотят внятных и адекватных моделей. И у вас скорее всего будет лишь один выход, если вы продолжите поднимать планку — стохастическое (вероятностное) моделирование свёртки белков. детерминированность старой классической физики + стохастика. ближайшие сотни лет не будет ничего более мощного.

2. к деталям по стохастике: для каждого выбранного локального участка цепи белка есть вероятность той или иной трансформации при условиях соседних конфигураций цепи — это сеймейство законов распределения. да это множество жутко мощное, ну и что?

3. не обязательно формально доказывать, что все пути будут обязательно вести к той самой конечной сборке, достаточно «на уровне Монте-Карло» эсперементально показать, что из 10 независимо выбранных путей, все чудесно сошлись к вашей сборке (конечной конфигурации), вероятность которой в общем множестве была, казалось бы, ничтожна.

4. если правильно играть пунктами 2-4, то можно получить: а) модель свёртки, б) существование решения для свёртки выбранного вами белка, в) суждения о единственности свёртки, г) предоставить ваши же алгоритмы,… к которым будет уже совсем другое отношение.

опечатки править нельзя, ну, да и ладно :)
Этот комментарий почти о том же, и в принципе истина где-то рядом :)
И да, суть аннотирования — как раз в том, чтобы показать в каких местах траектория реальная, а где проблематика моделирования. Дело в том, что моделирование это принципиально такая вещь, что можно получить сходство с реальным объектом только в определенных параметрах, а из-за вычислений (а не реального поведения) необходимо допускать вещи, которые в реальности не бывают.

Но все это надо очень тщательно писать… вот я и думаю, заниматься этим или лучше пойти свернуть тРНК…
Итак, главный вопрос остался — зачем?

Выше уже сделали несколько пояснений: «это программа которая сворачивает РНК, причем только с вводом первичной последовательности и предполагаемых водородных связей», «зная эту самую последовательность, можно быть уверенным в том, как именно «свернется» эта молекула, то есть какую именно пространственную структуру образует»,

«есть некая структура, которая неизвестно как закручивается, а если знать как она закручивается и какой формы становиться, то можно ..»

а можно на самом деле много — действительно можно создать лекарственные препараты, для уничтожения вирусов. Если это не вирус, то знание сворачивания позволяет понять чем именно занимается эта РНК или белок — т.е. узнать функцию конкретного белка/РНК в организме (а это не всегда известно).

Так же можно говорить, о задачах псевдо-биологических. На самом деле, это будущие робототехники — наноработотехники — уже сейчас можно синтезировать искусственно РНК и белки. Но чтобы они работали они должны иметь определенную структуру. Для это надо просчитать из каких нуклеотидов/аминокислот нужно составить РНК/белок, чтобы он выполнял желаемую функцию. Тогда придумал механизм — и построили его путем синтезирования искусственной РНК/белков.

Ну, а менее фантастично — мы же еще не знаем как происходила жизнь. Изучить самодостаточен ли т.н. РНК-мир? Изучить эволюцию и происхождение видов. Все это еще не решенные задачи.

Но там каждый раз встречаешься с этой задачей — хочешь знать что делает белок/РНК — узнай как он свернулся.

Еще можно почитать мое введение в проблематику Геномика бросает вызов искусственному интеллекту.

Но что касается моих дальнейших изысканий, то недавно публиковал статьи Интересные результаты о эволюционной систематике прокариот или «многовидовое происхождение» и Использование UML для эксперимента по эволюционной систематике прокариот, теперь уже есть более обширные данные, скоро их обработаю и напишу статью. Но сравнивать тРНК нужно учитывая пространственную структуру — и так соединяться задача сворачивания и задачей эволюционной систематики… но это будущие.

wetware developer
Всё, чувак, я твой фанат! Надеюсь кода-то у меня будет твой автограф…
почему вы считаете, что Ваша модель сворачивает правильно? Для правильной трёхмерной структуры белка надо учитывать не только стерические факторы и комплиментарность водородных связей. Как насчёт термодинамики процесса с установлением конечной энергии системы? А то знаете, с математической точки зрения и коэффициенты в уравнениях можно понараставлять…
PbS+2O3=PbSO4+O2
PbS+4O3=PbSO4+4O2
6PbS+10O3=6PbSO4+3O2
Вот именно. Человек говорит: давайте нафиг выбросим физику и химию с биологией, чего-то там посчитаем, и получим результат. Да ещё, вроде как, из статьи видно, что как-то он интересно воспринимает методы Монте-Карло. Хм… Как бы, надо сначало пойти к биологам с результатом и спросить: ребята, а у меня верно свернулось? А потом уже говорить: Свершилось!
Это вопрос для данного конкретного случая решенный. В статье Биовычисления по сворачиванию. Снова простым языком о полученной модели сворачивания был дан «скелет» РНК, который я использую как базовый (2QUS). Он принципиально сходный с тем что получилось у меня для другого рибозима (в другом организме). Эти рибозимы имеют принципиально одинаковую структуру.

Нуклеотиды связанные водородными связями просто не могут занять другое положение. А полный набор водородных связей предопределяет структуру всех остальных нуклеотидов, иначе он просто не сможет образоваться.
Очень замечательно, что вы пишете статьи, но в научном мире (на часть которого Вы явно желаете претендовать), помимо ссылок на свои публикации принято ссылаться на публикации в рецензируемых научных изданиях, подтверждающих Ваши доводы.
Об этом будем говорить когда я буду писать очередную статью, и не тут в кулуарах с рецензентами :)
да, Вы правы.
Однако, желание автора творить и изобретать изумляет (пусть и самонадеянно, но всё придёт с опытом).
Единственное, чего хотелось бы пожелать — это не пренебрегать опытом других отраслей науки и быть скромнее.
> «не пренебрегать опытом других отраслей науки»

Не в коем случае я этого не делаю. Вы возможно не так поняли. Я всего лишь говорю, что методы популярные сейчас в биологии — не могут диктовать выбор методов для данной задачи при решении кибернетическим подходом. Биология заканчивается там где мы отбираем данные для эксперимента: секвенированную первичную последовательность, и предсказание водородных связей на основе расчета минимальной энергии. Далее черных кибернетический ящик. И на выходе полученная структура и траектория. Если полученная структура не совпадает с реальной — это не главный критерий, это лишь указывает, что что то мы не учли в смысле геометрических связей. Перевести физику на геометрию — это важный этап. Но если структуры сходятся (не в точности а принципиально), то наоборот, не биология может на нас влиять, а мы на биологию — делая достаточно осторожные выводы о фазах сворачивания.

Ну нельзя после биологии просто взять и перейти к компьютеру, да и биология тут сомнительна, скорее биохимия. Выбор тех или иных методов, как правило, диктуется их надёжностью и предсказуемостью поведения. Именно поэтому этими методами и пользуются. Хотите новый инструмент для работы — да пожалуйста, но надо делать на основе того, что проверено и реально работает. Не может наука прыгать через ступень и не терпит за своей спиной белых пятен. В формировании третичной структуры в реальных условиях помимо стерического фактора различных групп и водородных связей будет оказывать влияние pH среды (да, среда может быть неблагоприятной или клетка может быть больна), может происходить «защита» какой-либо группы, которая будет влиять на структуру той же РНК. Влияющих факторов может быть вагон и тележка.
Если бы всё было так просто, как Вы пишете, то в боинке никто бы не создавал проект распределённого вычисления третичной структуры белков. Вот если бы Вам удалось создать модель с учётом «полных» физики и химии процесса, то это бы было замечательно.
> если бы Вам удалось создать модель с учётом «полных» физики и химии процесса

В том то и дело, что это излишнее. Данный пример это демонстрирует. Будут и другие. И это как раз не прыганье, а именно начало как и требовалось с основ. Но сейчас все озаботились не идеализированными случаями, а сразу с «полной» физикой и химией процесса. И соответственно, ничего не выйдет. Как только «полную» физику и химию процесса перенесли на компьютер — все вы рассчитываете не физику и химию, а компьютерную модель, которая по определению отличается от реальной физики и химии. И похоже это все забывают. Строить компьютерные модели — это не тоже самое, что рассчитывать физику и химию процесса — ничего не получится. Все на самом деле достаточно просто и не связано с химией и физикой. Таким образом, тут правильнее даже применять не термин моделирование РНК, а конструирование РНК.

И действительно, влияющие факторы определяются не физикой/химией процесса — а точностью идеализированной модели. Захотим проследить что-то большие включим, но должна быть основа. И эта основа водородные связи — они есть может быть получена приближенная модель. А модели которые не образуют водородных связей, но учитывают «полную» физику и химию — это фикция — сродни «вечном двигателю».

Или Вы думаете, что можно получить несколько принципиальных разных структур, но у которых есть требуемые водородные связи? Вы ошибаетесь, чем сложнее РНК, тем все меньше вариантов. И уже у данного рибозима нет других вариантов структур, но со всеми имеющимися связями. В моей модели есть лишь малые неточности в положении отдельных нуклеотидов, но наличие образованных все водородных связей гарантирует правильность и совпадение с реальной структурой.

Ну, или иначе как в математике: доказывайте от обратного — получите еще хоть одну структуру данного рибозима со всеми водородными связями и имеющую другую структуру? Не получится, значит постулат моего кибернетическо-геометрического подхода верен. Получится, мне придется его уточнять. И вот так и только так я и пойду мелкими шашками. А то что сейчас делают биологи, физики и химики — это фикция — все равно, что получить атомную бомбу в каменном веке — вероятность около нуля. В то время как я разработал уже «теорию деления ядер».
«А то что сейчас делают биологи, физики и химики — это фикция — все равно, что получить атомную бомбу в каменном веке — вероятность около нуля. В то время как я разработал уже «теорию деления ядер».»

Вы думаете, Ваше предположение никому никогда не приходило в голову? Или никто никогда не пытался решить эту задачу таким способом?

Покажите где?
Access Denied — это как то не «Все знают, все понимают»
о заработало… можете мне облегчить и дать цитату того, что вы считаете «Все знают, все понимают»?
нет, не могу. Вы претендуете на новизну, но при этом не провели литературный поиск? ВСе знают и все понимают — да банально в школе на уроках химии рассказывали, что возможность образования водородных связей в белках позволяет формировать третичную структуру, а затем и в универе этот вопрос распиливался неоднократно.
Разговор не о чем.
Если раньше не сталкивались, посмотрите на sci-hub повнимательней — хороший сервис для анализа состояния вопроса. То что в этой публикации его нет — не страшно. Но делать его все равно придется.

Из общих впечатлений — напоминает взаимодействие it-метематики-геологии. Оно началось, видимо, пораньше. И наблюдаются сходные подходы и проблемы.
Еще. Из школы вспомнилось…
Биосинтез. Полирибосома бежит по ДНК, к ней подтягиваются РНК с аминокислотами на хвосте, и рибосома проводит проверку соответствия кода РНК коду ДНК. Если подходит, то аминокислота добавляется к строящейся молекуле.
Вы этот процесс моделируете?
Нет это другое.
«Все знают, все понимают» — и этого мало, где ПО которое позволяет получить третичную структуру на основании водородных связей? Пусть это и «просто и не точно», но где? И уж это будет точнее, того что вообще нет.
ищите, смотрите научную литературу, соответствующий софт и описание базисов, используемых при расчёте.
Опять совет ни о чем, выдающийся за показательно содержательный. Как Вы думаете, если ведущие специалисты (rosseta@home) не включили в свою игру FoldIt то, что «все знают, все понимают» — может это не так просто, как кажется?
В одной статье у которой у меня есть доступ — нет ни слова о компьютерном моделировании. О чем вы тогда?
У вас коротковата логическая цепочка «этот рибозим можно свернуть единственным образом, значит все существующие белки и РНК можно свернуть только одним образом».

Вообще не понятно, если программа суперавтоматически сворачивает что угодно, то почему бы не привести в пример свертку 1000 белков или хотя бы сотни. Это обычная практика в науке — воспроизведение известных результатов. Понятно что начинают с одного «тренировочного» примера, но заявление «она может всё» на основе этого не делают.
бесполезно. Я уже пытался это объяснить.
Заявлений «она может всё» никто не делал, читайте внимательнее, также речь не шла о суперавтоматике, наоборот речь о полуавтоматике.
Ваша полуавтоматика — это суперупрощённая модель из используемых ныне методов расчёта структуры белков, основанных на молекулярной динамике. Разница заключается в том, что Вы на самом деле кричите об изобретении колеса, когда все кругом уже лет так 50-60 ездят на автомобилях с ДВС.
Разница в том, что современные методы учитывают огромное количество параметров, таких как полярность групп, парные взаимодействия (в которые, кстати, попадают и водородные связи), гибкость связей и пр. А дополняя всё это полуэмпирическим методам квантовой химии проводят оптимизацию геометрии и энергии молекулы. И да, это всё очень и очень ресуркоёмкие задачи, требующие длительного времени расчёта и оптимизации всех параметров. А когда структура рассчитана, то на её основании моделируется спектр ямр или рентгенограмма, которые сравниваются с таковыми для реальных образцов.
Вы не понимаете о чем говорите, учитесь.
До магистра химии доучился. а Вы?
Не люблю трепаться с пустословами, мнящими из себя специалистов. Поэтому повторю то, что писал еще в 3 статье на эту тему:

Тем же кто желает тут похоливарить. Давайте так. Я такой любитель — которому погоны специалистов значут мало, а наука такое дело требует повторяемости (а не бизнес-скрытности, это же не бизнес, чтобы скрывать детали своих алгоритмов и не публиковать их код?), поэтому просто разговоры меня интересуют мало. Но меня очень интересует когда мне показывают, что я занимаюсь немного не тем, и что есть люди которые действительно чего-то добились. Вот задача над которой я мучаюсь. Решите и покажите, что это просто — буду очень благодарен.

Я даю произвольную (реально существующую) первичную последовательность до 100 нуклеотидов. Указываю все водородные связи которые нужно образовать. Вы на выходе даете мне файл .pdb, в котором третичная структура из указанной первичной последовательности и где образованы все требуемые водородные связи. Ни каких других требований.



А «мерится» идите в другое место…
«Померяться» вообще-то захотели Вы первым. Кричите о своей крутости, но при этом банально не хотите признавать опыт и наработки других людей. Я ж Вам написал ссылку на скай-хаб (можно скачать практически любую научную статью) — ищите, читайте, смотрите. На самом деле не всё так просто, как кажется. На хабре Вам никто ничего толком не скажет, а если Вы хотите испытать модель на «живучесть», напишите статью в Journal of Computational Science или Proteins и у Вас будет возможность побеседовать с профи, занимающихся такой же тематикой.

И повторюсь ещё раз: ссылаться только на свои статьи — признак дурного тона. Будьте осторожны, а то помню одно время к нам на факультет приходил мужик и требовал признания его «периодической системы».
Мне не надо ничего искать, если Вы как специалист не знаете о таких системах, чтобы решить мою простенькую задачу — значит их нет.

Поэтому моя фраза: А это пусть малое — но достижение. Такой автоматики, которая проста на самом деле и пусть еще не до конца автоматизирована — еще нет ни у кого. — далеко не эквивалент «кричите о своей крутости», если вы так воспринимаете мои слова — это сугубо ваша психологическая проблема.
Вы читали мою научную статью? Там ссылки только на мои статьи? Тогда о чем Вы?

так с этого и надо было начинать, а не с 12 статей на одном ресурсе.
А тестировался ли этот метод на молекуле с известной структурой? какой процент совпадений?
Например, если на вход поместить недлинную нуклеотидную последовательность, то получим спираль на выходе?
Если для не длиной последовательности вы зададите расположение водородных связей — то конечно будет достаточно быстро получена спираль. Но надо учитывать, что вариаций спиралей может быть достаточно много. Тогда какой смысл их сравнивать с известной, не понятно тогда что-такое процент совпадений.

Когда речь уже о двух спиралях, свернуть отдельно две спирали не проблема, но между спиралями тоже есть водородные связи. Это существенно уменьшает число вариаций контакта этих спиралей и их формы. Это диктует окончательную структуру РНК. Но опять же как это сравнивать с известной?

В данном эксперименте такой цели не было — оценили на глаз, т.е. структура по сути принципиально такая же. Разница может быть только в мелких не так повернутых нуклеотидах, которые не имеют водородных связей.
Цель эксперимента была в другом — можно ли этим методом и как получить все заданные водородные связи. Т.е. в терминах теории игр: обеспечивает ли ход игры обязательное попадание из начального положения в конечное. Все текущие методы не озабочиваются этим вопросов, что существенно не правильно. Нельзя методом который не обеспечивает попадание из начального состояния в конечное получить что-то приближенное к реальности.

Но следующий эксперимент с тРНК специально будет для желающих совпадения — на известной структуре тРНК. Но вопрос с адекватной оценкой совпадений тоже остается, где гарантии, что известная структура не может колебаться в малых расстояниях — РНК то подвижна. И потом методы получения известной структуры тоже с ошибками — кристаллография и ЯМР — тоже имеет ошибки. Так как сравнивать?
суть физических методов, будь то ЯМР или РСА в том, что они могут взаимодополнять друг друга, и если по данным двух методов результаты идентичны, то их с большой долей вероятности можно считать правильными
Смысл вопроса в том, что если взять белок известной структуры и просто задать его вашей программе в виде -A-U-U-C-A-A-C-G-U-G-C-A-C- (последовательности аминокислотных остатков), то Ваша софтина его «свернёт» правильно?
(корректность структуры нужно определять не «на глаз»)
Ваша последовательность не имеет водородных связей , соответственно не свернется вообще. Дайте мне тогда реальную последовательность. И расскажите как правильно нужно определять корректность (т.е. ответьте на вопрос ниже).

Тогда посмотрим в чем отличия. Но на односпиральных последовательностях, вполне может быть другой угол наклона спирали, но для многоспиральных последовательностях это уже исправляется за счет необходимости спиралям контактировать между собой.

А вот если односпиральная РНК в моей модели будет отличаться (думаю только углом спирали) — то вот тогда и будет вопрос биологам — чем определяется именно вот такой угол наклона спирали. Это уже не моя епархия, и мне нужен ответ биолога. Но они однозначно не могут на это ответить.
Следующий эксперимент будет на известной структуре тРНК.

Специалистам вопрос — как правильно сравнивать (т.е. как это сейчас принято) полученную структуру с тем что есть. Есть ли программы которые это делают (вида подали два pdb файла, и получили разницу)?
поищите тут.
снова ссылка потерялась… predictioncenter.org/

или попинайте биохимиков на forum.xumuk.ru/
Хотелось бы конкретнее, очень мне не хотелось бы писать этот алгоритм расчета самому (скажут еще, что не так написал ;) ) — речь идет о каком либо стандартном средстве.

Надо еще правда определится с показателем расчета, так например многие используют величину RMSD, но в то же время пишут:

величина RMSD не может служить достоверным показателем степени свернутости биологической молекулы. В данной работе авторы применительно к РНК предложили использовать величину «нативная характеристика» — NC, которая была определена как разница количества межатомных контактов, присутствующих в нативной конформации и количество контактов, не характерных для нативной конформации

Но если речь о такой «нативной характеристике» — то в данной модели 100% совпадение (т.к. какие могут быть еще «межатомные контакты» в РНК кроме водородных связей — непонятно)
Важная вещь: если вы надеетесь найти в биологических или химических науках ФАКТЫ, то вы разочаруетесь — вы найдете лишь приближения и допущения, реальные для данных условий.
Согласен. Но хотелось бы хотя бы четко сформулированные приближения и допущения, реальные для данных условий, а не размытые по ряду статей.

А то поразительная вещь — хотим получать точные модели, а входные данные которые мне нужны сформулировать математически не можем.
В принципе я уже переболел этим (поиском точности и фактов) — теперь я к биологам, физикам и химикам отношусь так же как программист к пользователям, которые объясняет какой ему нужен GUI, а сам не знает.
>теперь я к биологам, физикам и химикам отношусь так же как программист к пользователям

а вы к нашей диаспоре и не относитесь. Вы для нас всего-лишь термодинамическая система биологического происхождения
В общем уточним вопрос: кто в курсе

есть ли стандартная признанная в сообществе биологов программа расчета RMSD по двум .pdb файлам?
много различных моделей расчёта структуры белков бывает тут onlinelibrary.wiley.com/journal/10.1002/(ISSN)1096-987X

посомтрите, может что-то будет относительно сравнения
там же все статьи платные, не годится :)
sci-hub.org никто не отменял ;)
тсссс…
Я опять буду злым и нудным ученым, знающим биологию, химию и физику.
1. Поздравляю, будет интересно прочитать
2. Можно чуть подробнее как вы использовали 2QUS?
3. Как вы определили что вы правильно свернули?
1. Спасибо, но будьте помягче :) и ответьте на встречные вопросы, которые у меня есть для знающих биологию, химию и физику

2. 2QUS — для определения межспиральных водородных связей, которые должны быть в моем рибозиме, а также для визуального определения структуры

3. Визуально по форме совпадения с 2QUS. Да я знаю, что вы захотите большей точности, чем принципиальное совпадение. Этого мне не было нужно. Я это уже пояснял. Цель эксперимента в другом. Но теперь можно поиграть и по вашим правилам. Но ответьте мне тогда на мой вопрос: какой метод определения «правильности» вас (биологов) удовлетворит? Какие программы вы для этого сочтете убедительными? Какие допущения в расхождение относятся к незначительным?
Для меня подойдет RMSD основное цепи + совпадение топологии. О сравнение РНК вы сами упоминали ряд статей.
и еще: а вы делали выравнивание последовательностей этих двух РНК?
> вы делали выравнивание последовательностей этих двух РНК?

Да, но вручную, т.к. автоматическое выравнивание тут не справляется (по вполне понятным мне причинам).
я это упомянул по простой причине, вы все же в какой-то мере использовали шаблон для построения модели, поэтому вопрос: какова идентичность между последовательностями?
Она совпадает в очень малой, но именно важной консервативной части — этого достаточно. Впрочем судите сами:

Сравнение двух рибозимов
> совпадение топологии

Как определяется? Визуально или есть методы?
> RMSD основное цепи

Можете подсказать программы куда подаешь два .pdb и получаешь эту оценку?
попробуйте biopython, я просто пользуюст другими программами
А может есть что нибудь, не требующие устанавливать Питон, и нормально работающие на Windows 7? Может PyMol это умеет?
Точно, Pymol умеет — align rna1,rna2. Вроде так.
спасибо
Правильно я понимаю, что «RMSD основное цепи» (align rna1,rna2) посчитает соответствие только основой цепи (Backbone), а положение радикалов (sidechain) в эту оценку не войдет?
не уверен, но мне кажется backbone входит в учет RMSD, но его можно отключить
www.pymolwiki.org/index.php/Align
посмотрите еще вот сюда на всякий случай
pymolwiki.org/index.php/Cealign
А когда Вы говорили «Для меня подойдет RMSD основное цепи + совпадение топологии.» — имели введу с backbone или нет?
я считаю, что основной цепи достаточно (но это вроде как общепринятое).
И еще какой RMSD считается допустимым? Это как то зависит от длины последовательности?
не могу сказать за РНК, но для белков до 4 ангстрем, но все относительно, если петля куда-то ушла в сторону, и не с чем не взаимодействует, то сложно говорить о том, что выравнивание плохое.
4 ангстрем — это именно RMSD, т.е. как сумма по всем нуклеотидам?
да
Прокомментирую тут пока… добрался я померить RMSD для одной известной тРНК (71 нуклеотид)

Вот статья для которой авторы хвастаются, что для РНК длиной до 30 нуклеотидов (по сути одна спираль, а не 3 связанных как в моем случае) они получают RMSD до 4 Ангстрем
www.ncbi.nlm.nih.gov/pubmed/17726102

У меня для черновика получилось 7.2 А… причем был сюрприз, сложные петли образовались достаточно хорошо, а вот начальная А-петля отошла значительно…
это примерно для 630 из 740 атомов (остальные атомы он выкинул как далекие)
3. Ах, да еще просто уверен, что если совпадают все водородные связи в РНК, то получить нечто совершенно отличное от реальной структуры РНК — просто не возможно. Эта моя уверенность ничем не доказана, но не доказано и обратное. В этом вообще темное пятно в науке, хотя на мой взгляд не профессионала на это нужно отвечать в первую очередь — хорошо бы даже в школьной программе.
что значит совпадает?
идентичные основания образуют одинаковые водородные связи?
Нет, нет. Речь идет не о сравнении с образцом ( 2QUS ). Для первичной последовательности достаточно легко предсказываются места водородных связей. Используем их. Далее если правильно выравнить с образцом (ссылку дал выше), то можно получить и места межспиральных водородных связей.

Тогда если получается получить (сформировать) эти водородные связи в модели, то она будет лишь не существенно отличаться от реальной структуры РНК.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации