Получена траектория сворачивания вироидного рибозима или новости с фронтов при использовании ПО RNAInSpace

    Пару месяцев назад я рассказывал о приближенных результатах в задаче о сворачивании РНК. Напомню требуется свернуть вироидный рибозим NC_003540 организма Chrysanthemum chlorotic mottle viroid, третичная структура которого неизвестна.

    И вот оно свершилось — рибозим свернулся ! (В нем образованы все имеющиеся водородные связи)

    Смотрим его конечное состояние, а под катом еще его траекторию сворачивания, а также подводим итоги.





    Смотрим его траекторию сворачивания


    Disclaimer



    А биологию забудьте дома, а также физику, химию ...

    Подход с помощью которого я получил данную траекторию сворачивания будем называть кибернетико-геометрическим подходом. Он существенно по постановке задачи отличается от биологических подходов. В данном подходе считается, что проблематика сворачивания белков и РНК это задача не биологии, не физики, не химии, не любых их пересечений (напр., биофизика, биохимия). Это задача сугубо кибернетическая.

    Почему? — спросите Вы.

    Данный подход исходит из постулата: для того, чтобы белок или РНК принял правильную, существующую в реальности нативную структуру нужно всего лишь учитывать образование водородных связей, а также ещё некоторые геометрические взаимоположения между атомами нуклеотидов.

    Отказ от ответственности таким образом состоит в том, что данный подход не гарантирует идентичного соответствия модели и реального нативного состояния. Более того в данном подходе наличие соответствия вторично, примерно также как наличие естественного интеллекта для сферы искусственного интеллекта.

    А методы решения соответственно кибернетические, частично из области искусственного интеллекта.

    В данный момент, метод основан на общей постановки в рамках задачи теории игр, и применения ряд эвристик. Соединение ряда эвристик и нахождение точного метода сопряженно с решением проблемы названной мной «проблемой двух учителей», изложенная в Резюме проблемы «двух и более учителей» и субъективное мнение о ИИ-сообществе и в Понятие о структурной адаптации и введение в «чистое обобщение». Под определенным углом зрения эта проблема связанна с «проблемой инвариантного представления в искусственных нейронных сетях».

    Пробежимся по предыдущим статьям



    Теперь после некоторого опыта можно констатировать, где и в чем я и мои оппоненты прежде были не правы и неточны.

    1. От белков к РНК — это просто популярное введение в биологическую терминологию, её не много и этого достаточно для понимания обсуждаемого.

    2. Мат. критерии — это некоторые нюансы свойственные задаче сворачивания РНК. Требуется для более глубокого понимания и попыток саму что-то свернуть. Но уже здесь завязался диалог суть которого как раз указывает на направленность подхода. В статье говорится о том на каких характеристиках нужно основываться, чтобы задать функцию пригодности (а, что это такое мы жевали тут). Так вот биофизики любят исходить из физических параметров. Так вот это совершенно лишние — достаточно описать геометрические условия свойственные этой задаче. Иметь дело с физическими параметрами сильно накладно — неоправданно сложные расчеты, которые все равно не точны и не могут воссоздать реальную биологическую среду. Просчитывать физические условия в клетке все равно, что если бы в искусственном интеллекте мы рассчитывали все нервные импульсы мозга, и все равно получали бы грубую погрешность. Еще там дается оценка поворот по одному углу на 0.1 градуса может позволить повернутся по другому углу, это уточнено достаточно 0.2 градуса.

    3. Как уменьшить число поворотов цепи? — здесь как раз описываются/критикуются текущие подходы при решении задач о сворачивании. Показывается, что мало того, что мы имеем погрешности в расчете физических условий, так еще ищем что попало методом Монте-Карло, или в лучше случае методом отжига. Это все равно, что играть в шахматы случайно делая ходы. Там же описывается более современный подход от Rhiju Das and David Baker, но увы теперь можно сказать, что он избыточен и тяжел для вычислений.

    4. Как оценить ход сворачивания односпиральной РНК? — здесь выявленные нами геометрические характеристики комбинируются для создания функции пригодности.

    5. Ограничение оптимизирующих методов в играх с противником и без — наглядное пояснение почему ряд методов, которые используют случайность для поиска новых состояний — непригодны для этой задачи.

    6. Одна фундаментальная проблема — тут первые штрихи к описанию проблемы «обучения двух учителей» в данной задаче. А также там мы обсуждали возможность использования «инверсной кинематики» (которая используется для расчета суставов в робототехнике), но все это ужасно медленно. Соответственно разрабатываемый метод, может быть применен не только к проблеме сворачивания РНК, но и для улучшения решения проблем из области робототехники. Кстати, сворачивание сродни решению проблемы «парковки автомашины» в каждом отдельно взятом случае контакта двух нуклеотидов.

    7. Введение в сворачивание многоспиральных РНК — основы понимания, почему спираль свернуть легко, а две сложно. Тут основы правильной модели.

    8. RNAInSpace — программное обеспечение для полуавтоматического конструирования РНК в пространстве — не удачное демо

    9. История одного реинжиниринга или RNAInSpace v.1.3. Demo — удачное демо. Пробуем основы! У меня почти нет обратной связи :), помогайте…

    10. Биовычисления по сворачиванию. Снова простым языком о полученной модели сворачиванияописанная здесь модель сворачивания — ложна. Ну, не так чтобы совсем — но все таки. Это как раз было проверено, и оказалось, что вот он набор глупостей:

    Но существуют еще так называемые стэкинг взаимодействия… Так вот если РНК появляется постепенно, то до того как может образоваться первая водородная связь нужно чтобы появилось как минимум двадцать нуклеотидов.… И раньше я считал, что они просто вытянуты в цепь.… Стэкинг оказывается важен как создание начального положения


    Начальное положение должно быть хаотичным и вытянутым. Стэкинг важен лишь в определенных местах, где нет водородных связей. И вообще стэкинг — это просто дополнительные геометрические соотношения.

    В чем же фича?

    Есть три момента, почему тут мне удалось свернуть, а до этого не удавалось.

    1. Повысили скорость сворачивания отдельных спиралей всего до нескольких часов (против ранее дней). Следствие набора причин: отказались от подхода Rhiju Das, когда углы выбираются из базы, теперь только поиск в окрестности ± 5 градусов от текущего положения. Важно вначале пройтись при поиске с шагом 10 градусов, а потом 0.2 градуса. Использовавшийся ранее шаг 0.1 градус мелкий и излишен. Достаточно изменять 6 углов в главной цепи и один угол для боковой, т.е. исключено изменение конформации сахара.

    2. Использовались изменение углов вручную. Тут важно, что в ручную очень сложно делать «тонкие» движения — т.е. образовать водородные связи в ручную не реально. Но был один момент биологический — данный рибозим саморазрезается на две части. И именно это показала траектория сворачивания в один момент времени, при сворачивании необходимо «пересечь два конца», моделируя как бы разрезание. Также вручную вмешивались и по другой не биологической причине. У меня пока нет программы выхода из запрещенных состояний — когда образуются недопустимые ковалентные связи (проще говоря атомы сталкиваются — подходят на недопустимые расстояния). Поэтому выходим вручную. Но таких ручных вмешательств сравнительно мало 10 шт, на 20000 автоматических ходов. Правда еще нужно раз 100 управлять направлением автоматического поиска.

    3. На последних этапах важно, что для части цепи нужно разрешать образование запрещенных ковалентных связей. Это проблема моделирования — расчетная траектория движения не может быть с отсутствием упругих столкновений, а столкновения рассчитывать ужасно дорого. Поэтому пока сворачиваем одни части, столкновения в других можно игнорировать.

    Что дальше?



    Главное, что описанный подход (на скорую руку правда, т.к. хотелось побыстрее сообщить, да к тому же более детальные описания думаю утомили бы) — позволяет принципиально свернуть многоспиральные РНК. А это пусть малое — но достижение. Такой автоматики, которая проста на самом деле и пусть еще не до конца автоматизирована — еще нет ни у кого. Максимальное приближение это в научной-игре FoldIt, но там все куда сложнее для возможности свернуть.

    Далее думаю тестировать на тРНК — там уже три спирали в достаточно сложной комбинации.

    P.S. Извиняюсь за некоторую сумбурность…
    Share post

    Comments 123

      +14
      Можно в двух словах о том, что означает «свернуть вироидный рибозим»?
        +16
        Вообще что это за задача «свернуть РНК» и почему вы её решаете?
          +1
          Все структуры белка — вторичная, третичная, четвертичная — определяются первичной структурой, т.е. аминокислотной последовательностью. Т.е. зная эту самую последовательность, можно быть уверенным в том, как именно «свернется» эта молекула, то есть какую именно пространственную структуру образует. И задача по сворачиванию — это именно определение итоговой четвертичной структуры.
            +14
            А зачем это, т.е. для чего в итоге можно будет применить? Хорошо бы с примерами, так как для меня «свернуть вироидный рибозим» звучит как заклинание из какой то мифологии.
              +1
              Упс. Прошу прощения за неточность, в данном случае изучается все-таки не белок, а РНК — единственная компонента вироида.

              Работа рибозима — катализ расщепления других РНК или белков. Но катализ в молекулярной биологии, т.е. взаимодействие между катализатором и субстратом, определяется пространственными структурами. И, зная путь сворачивания рибозима, можно на этот катализ определенным способом на определенном этапе воздействовать.

              Этим мои скромные познания в биоинформатике, пожалуй, ограничиваются
                0
                А можно написать про практической применение в реальном мире для обычных людей?
                  +1
                  Вироид — патоген. Деактивировали вироид — считай, вылечили заболевание.
                    +13
                    Т.е. как я понял — есть некая структура, которая неизвестно как закручивается, а если знать как она закручивается и какой формы становиться, то можно найти вариант уничтожения этой загогулины. Грубо говоря написать антивирус, зная сигнатуру вируса.
                      +6
                      Спасибо! Из за вас я смог понять о чем статья!
      +2
      Больше интересно что это даст? для чего это все?
        +1
        Вот этот комментарий даёт хоть немного объяснения в чем вообще задача: habrahabr.ru/post/145917/#comment_4908800. Его нужно в начеле каждой статьи из этого цикла публиковать.
        Литература говорите, вы мне лучше покажите программу которая сворачивает РНК, причем только с вводом первичной последовательности и предполагаемых водородных связей. Зачем мне читать сказки на ночь, которые не приближают к результату не на грамм? Для общего развития, спасибо — лучше фантастику Лема почитаю.
        • UFO just landed and posted this here
            0
            К сожалению, на мембране давно ничего не публикуется. Какие-то проблемы у них.
              0
              Мембрана скурвилась.
                +5
                Свернулась же…
                  0
                  Криво свернулась, однако. Никакого вторичного катализа:(
              +21
              Вы бы действительно вступление написали, зачем это всё. А то читаешь статью, и чувствуешь себя дебилом.
                +5
                Думаю именно так себя чувствуют работники не айтишных профессий, когда программисты рассказывают ему об отличии абстрактного класса от интерфейса.
                  +1
                  А зачем они им это рассказывают?
                    0
                    «Рассказал другу профессиональный анекдот — полчаса объяснял терминологию».
                  +1
                  Был такой коммент на хабре — повторю его:
                  Ничего не понял, но плюсанул :)
                  +22
                  Вот что я имею в виду, когда говорю, что сфера потенциальных применений ИТ никак не должна ограничиваться социалками-шмоциалками и производными от них сервисами. И что имеет в виду Рэй Курцвейл, когда говорит, что биология на наших глазах превращается в информационную технологию.

                  Почему это важно? Грубо говоря, у нас есть программно-аппаратная система без исходников и с обилием legacy-кода, в единственном экземпляре, без бэкапов, работающая практически на честном слове — работоспособность и кое-какие базовые ее функции поддерживаются только лишь благодаря изначальному многократному резервированию. В целом для изучения теоретически доступны несколько миллиардов экземпляров подобных систем с разными кодами инициализации (за небольшим исключением), связанными в общее дерево, а точнее граф, форков и мерджей; плюс к тому же имеется возможность создавать новые (с возрастающей ресурсоемкостью), но все они при этом поражены очень неприятным древним багом — тайм-бомбой. (Когда-то этот баг был фичей для ускорения очистки отработанных статичных базовых компонентов, но по мере усложнения систем продолжал валить все без разбору вместе со всеми приватными пользовательскими данными и самими пользователями.) Да и прочих, менее распространенных багов хватает. А эволюция и девелопмент систем исходно были ограничены только этапом производства дочерних процессов (тем самым, который теперь отнимает все больше ресурсов, ибо новый экземпляр системы теперь и обучать надо больше, и администрировать поначалу, ибо вокруг куча малвари, при этом материнскую систему тоже желательно побыстрее возвращать в строй) — и теперь все это выливается в хроническое торможение развития. Reset и тем более shutdown никому не нужен, кроме особо упоротых ламеров, и каждый из нас таким образом напрямую заинтересован в поддержании работы доставшегося ему экземпляра, независимо от типа разъемов, цветовых схем и соотношений сторон, исходных и дополнительных локалей и прочих фич этого средоточия багов.

                  Данная же технология означает прорыв в компиляции целого класса базовых компонентов, что потенциально способно ускорить процесс отладки (которую теперь в большей мере можно перенести на внешние платформы, свободные от перечисленных выше ограничений) и разработки патчей. Разумеется, это пока еще далеко не полный разбор завалов унаследованного кода; но возможность моделирования процессов на внешних вычислительных мощностях — это именно то, что рано или поздно позволит нам эти завалы разобрать, убрать тайм-бомбу и другие баги, взять под полный контроль рандомную генерацию дочерних процессов, обеспечить апгрейд существующих экземпляров систем «на лету» без перезагрузки, а затем подойти к полноценному бэкапу, портированию на альтернативные типы носителей и в другие пространственные среды.
                    +8
                    Ну вот, так бы сразу =) а то какие то сворачивания, рибозимы и прочие вироидные штуки.
                      +6
                      Ну дык попробуй переведи это всё сразу на ИТшный язык (сразу предупреждаю: аналогия вольная и всего лишь приблизительно описывает для неспециалистов уровень сложности в отрасли, актуальные задачи и ситуацию с их решением).
                      +3
                      Доступными словами о сложном, спасибо.
                        +5
                        А теперь представьте некого любопытного «обывателя», который сначала прочитал сам пост, а затем простое его объяснение доступными словами :)
                          0
                          Еще интересней посмотреть на биолога :)
                            +1
                            Ага, для него это был перевод с китайского на японский.
                          0
                          Честно говоря, сразу не в курил…

                          Но похоже это то самое, что я описал как:

                          Так же можно говорить, о задачах псевдо-биологических. На самом деле, это будущие робототехники — наноработотехники — уже сейчас можно синтезировать искусственно РНК и белки. Но чтобы они работали они должны иметь определенную структуру. Для это надо просчитать из каких нуклеотидов/аминокислот нужно составить РНК/белок, чтобы он выполнял желаемую функцию. Тогда придумал механизм — и построили его путем синтезирования искусственной РНК/белков.
                            0
                            Душевно, ей-богу, это вам нужно писать статьи на такие темы ;-). Один из тех нечастых случаев, когда жалеешь, что плюсануть нельзя дважды. Реально в стиле Лема ;-).
                            0
                            Спасибо! Очень интересно. Надеюсь на развёрнутую статью где-нибудь в Nature ;)

                            PS Как хорошо что занимался этой областью и для меня все эти слова не пустой звук.
                              0
                              > Надеюсь на развёрнутую статью где-нибудь в Nature

                              Вы мне льстите :) Я не биолог поэтому вряд ли меня в Nature пропустят… но пару статей уже в «компьютерных журналах» написаны… правда пока решается вопрос о публикации второй — уже получены новые результаты ;)

                              Но написать, что-то более точное я планирую… вот думаю — будет ли интересно проследить более точно за этапами сворачивания. Здесь то дан только фильм с одного ракурса, на сам деле имеется 20000 шагов сворачивания, и на каждом отрезки важно то или иное и можно рассмотреть с разных ракурсов… т.е. нужно ли аннотирование траектории сворачивания? (или это не представляет интереса для местной аудитории?)
                                0
                                1. в Nature не только биологи пишут статьи.
                                2. ну на Scientific American точно пойдёт

                                3. я думаю что то делать более детально будет интересно только в практическом смысле для учёных, для технарей не стоит.
                                  +1
                                  прикольно, что у нас тоже кто-то фолдингом занимается, да ещё и результативно. респект!

                                  насчёт «траектории» мои 2 цента:

                                  1. её в обычном понимании нет. процесс вообще не имеет внятной середины. это скорее семейство траекторий.

                                  2. анотирование фаз свёртки — это по идее жутко важная задача: если вы опишите локальные конфигурации, через которые обязательно проходит фолдинг вашего белка, то вы можете предопределить, куда можно бы агрессивно прикрепиться мелким шустрым белкам с целью блокирования свёртки.

                                  а вообще, вы молодец.
                                    +1
                                    Действительно нужно правильно понимать суть «траектории».

                                    1. Действительно в природе не может быть последовательного сворачивания — оно идет параллельно сразу в нескольких местах. Вычислительно мы это принципиально не может промоделировать. Поэтому стоит чисто кибернетическая задача, в которой нужно реальную параллельную траекторию разложить на последовательные фазы.
                                    2. С другой стороны, конечно с большой точностью получить траекторию нельзя — она и в реальности меняется под действием хаотических колебаний. Но она постепенно стабилизируется водородными связями, т.е. проходит через определенные этапы сворачивания. Вот только с точностью до этих этапов и можно промоделировать.

                                    А вообще, спасибо.
                                      0
                                      почти подпишусь под обоими пунктами. Впрочем, воздерживаюсь лезть не в свой монастырь со своими уставами, но если позволите, то навяжусь ещё с 2 центами.
                                        0
                                        Конечно, пишите…
                                          0
                                          1. «кибернетически», in silico — все эти слова рано или поздно подточат вес ваших хороших результатов, если вы будете нажимать на эти козырные карты без остановки. Рано или поздно вам попадутся коллеги действительно высокого уровня, а они захотят внятных и адекватных моделей. И у вас скорее всего будет лишь один выход, если вы продолжите поднимать планку — стохастическое (вероятностное) моделирование свёртки белков. детерминированность старой классической физики + стохастика. ближайшие сотни лет не будет ничего более мощного.

                                          2. к деталям по стохастике: для каждого выбранного локального участка цепи белка есть вероятность той или иной трансформации при условиях соседних конфигураций цепи — это сеймейство законов распределения. да это множество жутко мощное, ну и что?

                                          3. не обязательно формально доказывать, что все пути будут обязательно вести к той самой конечной сборке, достаточно «на уровне Монте-Карло» эсперементально показать, что из 10 независимо выбранных путей, все чудесно сошлись к вашей сборке (конечной конфигурации), вероятность которой в общем множестве была, казалось бы, ничтожна.

                                          4. если правильно играть пунктами 2-4, то можно получить: а) модель свёртки, б) существование решения для свёртки выбранного вами белка, в) суждения о единственности свёртки, г) предоставить ваши же алгоритмы,… к которым будет уже совсем другое отношение.

                                            0
                                            опечатки править нельзя, ну, да и ладно :)
                                              0
                                              Этот комментарий почти о том же, и в принципе истина где-то рядом :)
                                        0
                                        И да, суть аннотирования — как раз в том, чтобы показать в каких местах траектория реальная, а где проблематика моделирования. Дело в том, что моделирование это принципиально такая вещь, что можно получить сходство с реальным объектом только в определенных параметрах, а из-за вычислений (а не реального поведения) необходимо допускать вещи, которые в реальности не бывают.

                                        Но все это надо очень тщательно писать… вот я и думаю, заниматься этим или лучше пойти свернуть тРНК…
                                    +5
                                    Итак, главный вопрос остался — зачем?

                                    Выше уже сделали несколько пояснений: «это программа которая сворачивает РНК, причем только с вводом первичной последовательности и предполагаемых водородных связей», «зная эту самую последовательность, можно быть уверенным в том, как именно «свернется» эта молекула, то есть какую именно пространственную структуру образует»,

                                    «есть некая структура, которая неизвестно как закручивается, а если знать как она закручивается и какой формы становиться, то можно ..»

                                    а можно на самом деле много — действительно можно создать лекарственные препараты, для уничтожения вирусов. Если это не вирус, то знание сворачивания позволяет понять чем именно занимается эта РНК или белок — т.е. узнать функцию конкретного белка/РНК в организме (а это не всегда известно).

                                    Так же можно говорить, о задачах псевдо-биологических. На самом деле, это будущие робототехники — наноработотехники — уже сейчас можно синтезировать искусственно РНК и белки. Но чтобы они работали они должны иметь определенную структуру. Для это надо просчитать из каких нуклеотидов/аминокислот нужно составить РНК/белок, чтобы он выполнял желаемую функцию. Тогда придумал механизм — и построили его путем синтезирования искусственной РНК/белков.

                                    Ну, а менее фантастично — мы же еще не знаем как происходила жизнь. Изучить самодостаточен ли т.н. РНК-мир? Изучить эволюцию и происхождение видов. Все это еще не решенные задачи.

                                    Но там каждый раз встречаешься с этой задачей — хочешь знать что делает белок/РНК — узнай как он свернулся.

                                    Еще можно почитать мое введение в проблематику Геномика бросает вызов искусственному интеллекту.

                                    Но что касается моих дальнейших изысканий, то недавно публиковал статьи Интересные результаты о эволюционной систематике прокариот или «многовидовое происхождение» и Использование UML для эксперимента по эволюционной систематике прокариот, теперь уже есть более обширные данные, скоро их обработаю и напишу статью. Но сравнивать тРНК нужно учитывая пространственную структуру — и так соединяться задача сворачивания и задачей эволюционной систематики… но это будущие.

                                      0
                                      wetware developer
                                      +3
                                      Всё, чувак, я твой фанат! Надеюсь кода-то у меня будет твой автограф…
                                        +2
                                        почему вы считаете, что Ваша модель сворачивает правильно? Для правильной трёхмерной структуры белка надо учитывать не только стерические факторы и комплиментарность водородных связей. Как насчёт термодинамики процесса с установлением конечной энергии системы? А то знаете, с математической точки зрения и коэффициенты в уравнениях можно понараставлять…
                                        PbS+2O3=PbSO4+O2
                                        PbS+4O3=PbSO4+4O2
                                        6PbS+10O3=6PbSO4+3O2
                                          +1
                                          Вот именно. Человек говорит: давайте нафиг выбросим физику и химию с биологией, чего-то там посчитаем, и получим результат. Да ещё, вроде как, из статьи видно, что как-то он интересно воспринимает методы Монте-Карло. Хм… Как бы, надо сначало пойти к биологам с результатом и спросить: ребята, а у меня верно свернулось? А потом уже говорить: Свершилось!
                                            0
                                            Это вопрос для данного конкретного случая решенный. В статье Биовычисления по сворачиванию. Снова простым языком о полученной модели сворачивания был дан «скелет» РНК, который я использую как базовый (2QUS). Он принципиально сходный с тем что получилось у меня для другого рибозима (в другом организме). Эти рибозимы имеют принципиально одинаковую структуру.

                                            Нуклеотиды связанные водородными связями просто не могут занять другое положение. А полный набор водородных связей предопределяет структуру всех остальных нуклеотидов, иначе он просто не сможет образоваться.
                                              +1
                                              Очень замечательно, что вы пишете статьи, но в научном мире (на часть которого Вы явно желаете претендовать), помимо ссылок на свои публикации принято ссылаться на публикации в рецензируемых научных изданиях, подтверждающих Ваши доводы.
                                                0
                                                Об этом будем говорить когда я буду писать очередную статью, и не тут в кулуарах с рецензентами :)
                                              0
                                              да, Вы правы.
                                              Однако, желание автора творить и изобретать изумляет (пусть и самонадеянно, но всё придёт с опытом).
                                              Единственное, чего хотелось бы пожелать — это не пренебрегать опытом других отраслей науки и быть скромнее.
                                                +1
                                                > «не пренебрегать опытом других отраслей науки»

                                                Не в коем случае я этого не делаю. Вы возможно не так поняли. Я всего лишь говорю, что методы популярные сейчас в биологии — не могут диктовать выбор методов для данной задачи при решении кибернетическим подходом. Биология заканчивается там где мы отбираем данные для эксперимента: секвенированную первичную последовательность, и предсказание водородных связей на основе расчета минимальной энергии. Далее черных кибернетический ящик. И на выходе полученная структура и траектория. Если полученная структура не совпадает с реальной — это не главный критерий, это лишь указывает, что что то мы не учли в смысле геометрических связей. Перевести физику на геометрию — это важный этап. Но если структуры сходятся (не в точности а принципиально), то наоборот, не биология может на нас влиять, а мы на биологию — делая достаточно осторожные выводы о фазах сворачивания.

                                                  0
                                                  Ну нельзя после биологии просто взять и перейти к компьютеру, да и биология тут сомнительна, скорее биохимия. Выбор тех или иных методов, как правило, диктуется их надёжностью и предсказуемостью поведения. Именно поэтому этими методами и пользуются. Хотите новый инструмент для работы — да пожалуйста, но надо делать на основе того, что проверено и реально работает. Не может наука прыгать через ступень и не терпит за своей спиной белых пятен. В формировании третичной структуры в реальных условиях помимо стерического фактора различных групп и водородных связей будет оказывать влияние pH среды (да, среда может быть неблагоприятной или клетка может быть больна), может происходить «защита» какой-либо группы, которая будет влиять на структуру той же РНК. Влияющих факторов может быть вагон и тележка.
                                                  Если бы всё было так просто, как Вы пишете, то в боинке никто бы не создавал проект распределённого вычисления третичной структуры белков. Вот если бы Вам удалось создать модель с учётом «полных» физики и химии процесса, то это бы было замечательно.
                                                    0
                                                    > если бы Вам удалось создать модель с учётом «полных» физики и химии процесса

                                                    В том то и дело, что это излишнее. Данный пример это демонстрирует. Будут и другие. И это как раз не прыганье, а именно начало как и требовалось с основ. Но сейчас все озаботились не идеализированными случаями, а сразу с «полной» физикой и химией процесса. И соответственно, ничего не выйдет. Как только «полную» физику и химию процесса перенесли на компьютер — все вы рассчитываете не физику и химию, а компьютерную модель, которая по определению отличается от реальной физики и химии. И похоже это все забывают. Строить компьютерные модели — это не тоже самое, что рассчитывать физику и химию процесса — ничего не получится. Все на самом деле достаточно просто и не связано с химией и физикой. Таким образом, тут правильнее даже применять не термин моделирование РНК, а конструирование РНК.

                                                    И действительно, влияющие факторы определяются не физикой/химией процесса — а точностью идеализированной модели. Захотим проследить что-то большие включим, но должна быть основа. И эта основа водородные связи — они есть может быть получена приближенная модель. А модели которые не образуют водородных связей, но учитывают «полную» физику и химию — это фикция — сродни «вечном двигателю».

                                                    Или Вы думаете, что можно получить несколько принципиальных разных структур, но у которых есть требуемые водородные связи? Вы ошибаетесь, чем сложнее РНК, тем все меньше вариантов. И уже у данного рибозима нет других вариантов структур, но со всеми имеющимися связями. В моей модели есть лишь малые неточности в положении отдельных нуклеотидов, но наличие образованных все водородных связей гарантирует правильность и совпадение с реальной структурой.

                                                    Ну, или иначе как в математике: доказывайте от обратного — получите еще хоть одну структуру данного рибозима со всеми водородными связями и имеющую другую структуру? Не получится, значит постулат моего кибернетическо-геометрического подхода верен. Получится, мне придется его уточнять. И вот так и только так я и пойду мелкими шашками. А то что сейчас делают биологи, физики и химики — это фикция — все равно, что получить атомную бомбу в каменном веке — вероятность около нуля. В то время как я разработал уже «теорию деления ядер».
                                                      0
                                                      «А то что сейчас делают биологи, физики и химики — это фикция — все равно, что получить атомную бомбу в каменном веке — вероятность около нуля. В то время как я разработал уже «теорию деления ядер».»

                                                      Вы думаете, Ваше предположение никому никогда не приходило в голову? Или никто никогда не пытался решить эту задачу таким способом?

                                                        0
                                                        Покажите где?
                                                          0
                                                          да хотя бы тут. pubs.acs.org.sci-hub.org/doi/abs/10.1021/bi9906118 или тут www.sciencemag.org.sci-hub.org/content/185/4149/435.short. Все знают, все понимают, но механизм куда сложнее.
                                                            0
                                                            Access Denied — это как то не «Все знают, все понимают»
                                                              0
                                                              о заработало… можете мне облегчить и дать цитату того, что вы считаете «Все знают, все понимают»?
                                                                0
                                                                нет, не могу. Вы претендуете на новизну, но при этом не провели литературный поиск? ВСе знают и все понимают — да банально в школе на уроках химии рассказывали, что возможность образования водородных связей в белках позволяет формировать третичную структуру, а затем и в универе этот вопрос распиливался неоднократно.
                                                                  –1
                                                                  Разговор не о чем.
                                                                0
                                                                Если раньше не сталкивались, посмотрите на sci-hub повнимательней — хороший сервис для анализа состояния вопроса. То что в этой публикации его нет — не страшно. Но делать его все равно придется.

                                                                Из общих впечатлений — напоминает взаимодействие it-метематики-геологии. Оно началось, видимо, пораньше. И наблюдаются сходные подходы и проблемы.
                                                                  0
                                                                  Еще. Из школы вспомнилось…
                                                                  Биосинтез. Полирибосома бежит по ДНК, к ней подтягиваются РНК с аминокислотами на хвосте, и рибосома проводит проверку соответствия кода РНК коду ДНК. Если подходит, то аминокислота добавляется к строящейся молекуле.
                                                                  Вы этот процесс моделируете?
                                                                    0
                                                                    Нет это другое.
                                                                0
                                                                «Все знают, все понимают» — и этого мало, где ПО которое позволяет получить третичную структуру на основании водородных связей? Пусть это и «просто и не точно», но где? И уж это будет точнее, того что вообще нет.
                                                                  0
                                                                  ищите, смотрите научную литературу, соответствующий софт и описание базисов, используемых при расчёте.
                                                                    0
                                                                    Опять совет ни о чем, выдающийся за показательно содержательный. Как Вы думаете, если ведущие специалисты (rosseta@home) не включили в свою игру FoldIt то, что «все знают, все понимают» — может это не так просто, как кажется?
                                                                  0
                                                                  В одной статье у которой у меня есть доступ — нет ни слова о компьютерном моделировании. О чем вы тогда?
                                                              0
                                                              У вас коротковата логическая цепочка «этот рибозим можно свернуть единственным образом, значит все существующие белки и РНК можно свернуть только одним образом».

                                                              Вообще не понятно, если программа суперавтоматически сворачивает что угодно, то почему бы не привести в пример свертку 1000 белков или хотя бы сотни. Это обычная практика в науке — воспроизведение известных результатов. Понятно что начинают с одного «тренировочного» примера, но заявление «она может всё» на основе этого не делают.
                                                                0
                                                                бесполезно. Я уже пытался это объяснить.
                                                                  0
                                                                  Заявлений «она может всё» никто не делал, читайте внимательнее, также речь не шла о суперавтоматике, наоборот речь о полуавтоматике.
                                                                    0
                                                                    Ваша полуавтоматика — это суперупрощённая модель из используемых ныне методов расчёта структуры белков, основанных на молекулярной динамике. Разница заключается в том, что Вы на самом деле кричите об изобретении колеса, когда все кругом уже лет так 50-60 ездят на автомобилях с ДВС.
                                                                    Разница в том, что современные методы учитывают огромное количество параметров, таких как полярность групп, парные взаимодействия (в которые, кстати, попадают и водородные связи), гибкость связей и пр. А дополняя всё это полуэмпирическим методам квантовой химии проводят оптимизацию геометрии и энергии молекулы. И да, это всё очень и очень ресуркоёмкие задачи, требующие длительного времени расчёта и оптимизации всех параметров. А когда структура рассчитана, то на её основании моделируется спектр ямр или рентгенограмма, которые сравниваются с таковыми для реальных образцов.
                                                                      –2
                                                                      Вы не понимаете о чем говорите, учитесь.
                                                                        0
                                                                        До магистра химии доучился. а Вы?
                                                                          –1
                                                                          Не люблю трепаться с пустословами, мнящими из себя специалистов. Поэтому повторю то, что писал еще в 3 статье на эту тему:

                                                                          Тем же кто желает тут похоливарить. Давайте так. Я такой любитель — которому погоны специалистов значут мало, а наука такое дело требует повторяемости (а не бизнес-скрытности, это же не бизнес, чтобы скрывать детали своих алгоритмов и не публиковать их код?), поэтому просто разговоры меня интересуют мало. Но меня очень интересует когда мне показывают, что я занимаюсь немного не тем, и что есть люди которые действительно чего-то добились. Вот задача над которой я мучаюсь. Решите и покажите, что это просто — буду очень благодарен.

                                                                          Я даю произвольную (реально существующую) первичную последовательность до 100 нуклеотидов. Указываю все водородные связи которые нужно образовать. Вы на выходе даете мне файл .pdb, в котором третичная структура из указанной первичной последовательности и где образованы все требуемые водородные связи. Ни каких других требований.



                                                                          А «мерится» идите в другое место…
                                                                            0
                                                                            «Померяться» вообще-то захотели Вы первым. Кричите о своей крутости, но при этом банально не хотите признавать опыт и наработки других людей. Я ж Вам написал ссылку на скай-хаб (можно скачать практически любую научную статью) — ищите, читайте, смотрите. На самом деле не всё так просто, как кажется. На хабре Вам никто ничего толком не скажет, а если Вы хотите испытать модель на «живучесть», напишите статью в Journal of Computational Science или Proteins и у Вас будет возможность побеседовать с профи, занимающихся такой же тематикой.

                                                                            И повторюсь ещё раз: ссылаться только на свои статьи — признак дурного тона. Будьте осторожны, а то помню одно время к нам на факультет приходил мужик и требовал признания его «периодической системы».
                                                                              0
                                                                              Мне не надо ничего искать, если Вы как специалист не знаете о таких системах, чтобы решить мою простенькую задачу — значит их нет.

                                                                              Поэтому моя фраза: А это пусть малое — но достижение. Такой автоматики, которая проста на самом деле и пусть еще не до конца автоматизирована — еще нет ни у кого. — далеко не эквивалент «кричите о своей крутости», если вы так воспринимаете мои слова — это сугубо ваша психологическая проблема.
                                                                                0
                                                                                Вы читали мою научную статью? Там ссылки только на мои статьи? Тогда о чем Вы?

                                                                                  +1
                                                                                  так с этого и надо было начинать, а не с 12 статей на одном ресурсе.
                                                        0
                                                        А тестировался ли этот метод на молекуле с известной структурой? какой процент совпадений?
                                                        Например, если на вход поместить недлинную нуклеотидную последовательность, то получим спираль на выходе?
                                                          0
                                                          Если для не длиной последовательности вы зададите расположение водородных связей — то конечно будет достаточно быстро получена спираль. Но надо учитывать, что вариаций спиралей может быть достаточно много. Тогда какой смысл их сравнивать с известной, не понятно тогда что-такое процент совпадений.

                                                          Когда речь уже о двух спиралях, свернуть отдельно две спирали не проблема, но между спиралями тоже есть водородные связи. Это существенно уменьшает число вариаций контакта этих спиралей и их формы. Это диктует окончательную структуру РНК. Но опять же как это сравнивать с известной?

                                                          В данном эксперименте такой цели не было — оценили на глаз, т.е. структура по сути принципиально такая же. Разница может быть только в мелких не так повернутых нуклеотидах, которые не имеют водородных связей.
                                                          Цель эксперимента была в другом — можно ли этим методом и как получить все заданные водородные связи. Т.е. в терминах теории игр: обеспечивает ли ход игры обязательное попадание из начального положения в конечное. Все текущие методы не озабочиваются этим вопросов, что существенно не правильно. Нельзя методом который не обеспечивает попадание из начального состояния в конечное получить что-то приближенное к реальности.

                                                          Но следующий эксперимент с тРНК специально будет для желающих совпадения — на известной структуре тРНК. Но вопрос с адекватной оценкой совпадений тоже остается, где гарантии, что известная структура не может колебаться в малых расстояниях — РНК то подвижна. И потом методы получения известной структуры тоже с ошибками — кристаллография и ЯМР — тоже имеет ошибки. Так как сравнивать?
                                                            0
                                                            суть физических методов, будь то ЯМР или РСА в том, что они могут взаимодополнять друг друга, и если по данным двух методов результаты идентичны, то их с большой долей вероятности можно считать правильными
                                                            Смысл вопроса в том, что если взять белок известной структуры и просто задать его вашей программе в виде -A-U-U-C-A-A-C-G-U-G-C-A-C- (последовательности аминокислотных остатков), то Ваша софтина его «свернёт» правильно?
                                                            (корректность структуры нужно определять не «на глаз»)
                                                              0
                                                              Ваша последовательность не имеет водородных связей , соответственно не свернется вообще. Дайте мне тогда реальную последовательность. И расскажите как правильно нужно определять корректность (т.е. ответьте на вопрос ниже).

                                                              Тогда посмотрим в чем отличия. Но на односпиральных последовательностях, вполне может быть другой угол наклона спирали, но для многоспиральных последовательностях это уже исправляется за счет необходимости спиралям контактировать между собой.

                                                              А вот если односпиральная РНК в моей модели будет отличаться (думаю только углом спирали) — то вот тогда и будет вопрос биологам — чем определяется именно вот такой угол наклона спирали. Это уже не моя епархия, и мне нужен ответ биолога. Но они однозначно не могут на это ответить.
                                                          +1
                                                          Следующий эксперимент будет на известной структуре тРНК.

                                                          Специалистам вопрос — как правильно сравнивать (т.е. как это сейчас принято) полученную структуру с тем что есть. Есть ли программы которые это делают (вида подали два pdb файла, и получили разницу)?
                                                            0
                                                            поищите тут.
                                                              0
                                                              снова ссылка потерялась… predictioncenter.org/

                                                              или попинайте биохимиков на forum.xumuk.ru/
                                                                0
                                                                Хотелось бы конкретнее, очень мне не хотелось бы писать этот алгоритм расчета самому (скажут еще, что не так написал ;) ) — речь идет о каком либо стандартном средстве.

                                                                Надо еще правда определится с показателем расчета, так например многие используют величину RMSD, но в то же время пишут:

                                                                величина RMSD не может служить достоверным показателем степени свернутости биологической молекулы. В данной работе авторы применительно к РНК предложили использовать величину «нативная характеристика» — NC, которая была определена как разница количества межатомных контактов, присутствующих в нативной конформации и количество контактов, не характерных для нативной конформации

                                                                Но если речь о такой «нативной характеристике» — то в данной модели 100% совпадение (т.к. какие могут быть еще «межатомные контакты» в РНК кроме водородных связей — непонятно)
                                                                  +1
                                                                  Важная вещь: если вы надеетесь найти в биологических или химических науках ФАКТЫ, то вы разочаруетесь — вы найдете лишь приближения и допущения, реальные для данных условий.
                                                                    0
                                                                    Согласен. Но хотелось бы хотя бы четко сформулированные приближения и допущения, реальные для данных условий, а не размытые по ряду статей.

                                                                    А то поразительная вещь — хотим получать точные модели, а входные данные которые мне нужны сформулировать математически не можем.
                                                                      –1
                                                                      В принципе я уже переболел этим (поиском точности и фактов) — теперь я к биологам, физикам и химикам отношусь так же как программист к пользователям, которые объясняет какой ему нужен GUI, а сам не знает.
                                                                        –1
                                                                        >теперь я к биологам, физикам и химикам отношусь так же как программист к пользователям

                                                                        а вы к нашей диаспоре и не относитесь. Вы для нас всего-лишь термодинамическая система биологического происхождения
                                                                  0
                                                                  В общем уточним вопрос: кто в курсе

                                                                  есть ли стандартная признанная в сообществе биологов программа расчета RMSD по двум .pdb файлам?
                                                                    0
                                                                    много различных моделей расчёта структуры белков бывает тут onlinelibrary.wiley.com/journal/10.1002/(ISSN)1096-987X

                                                                    посомтрите, может что-то будет относительно сравнения
                                                                      0
                                                                      там же все статьи платные, не годится :)
                                                                        0
                                                                        sci-hub.org никто не отменял ;)
                                                                          0
                                                                          тсссс…
                                                                  0
                                                                  Я опять буду злым и нудным ученым, знающим биологию, химию и физику.
                                                                  1. Поздравляю, будет интересно прочитать
                                                                  2. Можно чуть подробнее как вы использовали 2QUS?
                                                                  3. Как вы определили что вы правильно свернули?
                                                                    0
                                                                    1. Спасибо, но будьте помягче :) и ответьте на встречные вопросы, которые у меня есть для знающих биологию, химию и физику

                                                                    2. 2QUS — для определения межспиральных водородных связей, которые должны быть в моем рибозиме, а также для визуального определения структуры

                                                                    3. Визуально по форме совпадения с 2QUS. Да я знаю, что вы захотите большей точности, чем принципиальное совпадение. Этого мне не было нужно. Я это уже пояснял. Цель эксперимента в другом. Но теперь можно поиграть и по вашим правилам. Но ответьте мне тогда на мой вопрос: какой метод определения «правильности» вас (биологов) удовлетворит? Какие программы вы для этого сочтете убедительными? Какие допущения в расхождение относятся к незначительным?
                                                                      0
                                                                      Для меня подойдет RMSD основное цепи + совпадение топологии. О сравнение РНК вы сами упоминали ряд статей.
                                                                        0
                                                                        и еще: а вы делали выравнивание последовательностей этих двух РНК?
                                                                          0
                                                                          > вы делали выравнивание последовательностей этих двух РНК?

                                                                          Да, но вручную, т.к. автоматическое выравнивание тут не справляется (по вполне понятным мне причинам).
                                                                            0
                                                                            я это упомянул по простой причине, вы все же в какой-то мере использовали шаблон для построения модели, поэтому вопрос: какова идентичность между последовательностями?
                                                                              0
                                                                              Она совпадает в очень малой, но именно важной консервативной части — этого достаточно. Впрочем судите сами:

                                                                              Сравнение двух рибозимов
                                                                          0
                                                                          > совпадение топологии

                                                                          Как определяется? Визуально или есть методы?
                                                                            0
                                                                            > RMSD основное цепи

                                                                            Можете подсказать программы куда подаешь два .pdb и получаешь эту оценку?
                                                                              0
                                                                              попробуйте biopython, я просто пользуюст другими программами
                                                                                0
                                                                                А может есть что нибудь, не требующие устанавливать Питон, и нормально работающие на Windows 7? Может PyMol это умеет?
                                                                                  +1
                                                                                  Точно, Pymol умеет — align rna1,rna2. Вроде так.
                                                                                    0
                                                                                    спасибо
                                                                                      0
                                                                                      Правильно я понимаю, что «RMSD основное цепи» (align rna1,rna2) посчитает соответствие только основой цепи (Backbone), а положение радикалов (sidechain) в эту оценку не войдет?
                                                                                        +1
                                                                                        не уверен, но мне кажется backbone входит в учет RMSD, но его можно отключить
                                                                                        www.pymolwiki.org/index.php/Align
                                                                                          +1
                                                                                          посмотрите еще вот сюда на всякий случай
                                                                                          pymolwiki.org/index.php/Cealign
                                                                                            0
                                                                                            А когда Вы говорили «Для меня подойдет RMSD основное цепи + совпадение топологии.» — имели введу с backbone или нет?
                                                                                              +1
                                                                                              я считаю, что основной цепи достаточно (но это вроде как общепринятое).
                                                                                              0
                                                                                              И еще какой RMSD считается допустимым? Это как то зависит от длины последовательности?
                                                                                                +1
                                                                                                не могу сказать за РНК, но для белков до 4 ангстрем, но все относительно, если петля куда-то ушла в сторону, и не с чем не взаимодействует, то сложно говорить о том, что выравнивание плохое.
                                                                                                  0
                                                                                                  4 ангстрем — это именно RMSD, т.е. как сумма по всем нуклеотидам?
                                                                                                    +1
                                                                                                    да
                                                                                                    0
                                                                                                    Прокомментирую тут пока… добрался я померить RMSD для одной известной тРНК (71 нуклеотид)

                                                                                                    Вот статья для которой авторы хвастаются, что для РНК длиной до 30 нуклеотидов (по сути одна спираль, а не 3 связанных как в моем случае) они получают RMSD до 4 Ангстрем
                                                                                                    www.ncbi.nlm.nih.gov/pubmed/17726102

                                                                                                    У меня для черновика получилось 7.2 А… причем был сюрприз, сложные петли образовались достаточно хорошо, а вот начальная А-петля отошла значительно…
                                                                                                      0
                                                                                                      это примерно для 630 из 740 атомов (остальные атомы он выкинул как далекие)
                                                                                    –1
                                                                                    3. Ах, да еще просто уверен, что если совпадают все водородные связи в РНК, то получить нечто совершенно отличное от реальной структуры РНК — просто не возможно. Эта моя уверенность ничем не доказана, но не доказано и обратное. В этом вообще темное пятно в науке, хотя на мой взгляд не профессионала на это нужно отвечать в первую очередь — хорошо бы даже в школьной программе.
                                                                                      0
                                                                                      что значит совпадает?
                                                                                      идентичные основания образуют одинаковые водородные связи?
                                                                                        0
                                                                                        Нет, нет. Речь идет не о сравнении с образцом ( 2QUS ). Для первичной последовательности достаточно легко предсказываются места водородных связей. Используем их. Далее если правильно выравнить с образцом (ссылку дал выше), то можно получить и места межспиральных водородных связей.

                                                                                        Тогда если получается получить (сформировать) эти водородные связи в модели, то она будет лишь не существенно отличаться от реальной структуры РНК.

                                                                                Only users with full accounts can post comments. Log in, please.