Часть №5. Биовычисления по сворачиванию. Одна фундаментальная проблема

    В этой статье мы рассмотрим как свернуть одну спираль в РНК. Для понимания нужно прочитать все предыдущие части От белков к РНК, Мат. критерии, Как уменьшить число поворотов цепи?, Как оценить ход сворачивания односпиральной РНК?, Ограничение оптимизирующих методов в играх с противником и без. Если ранее у нас все шло как по маслу, то здесь мы столкнемся с серьезной проблемой. Может кто-то подскажет как её решить.



    Повторим рисунок вторичной структуры рибозима который мы будем сворачивать.



    Здесь уделим внимание спирали L1. В предыдущей части мы ввели целевую функцию для образования водородных связей между одной парой нуклеотидов (назовем её F(x-y), где x-y пара нуклеотидов). Здесь же нам надо образовать целых шесть: между нуклеотидами 14-22, 13-23, 12-24, 11-25, 10-26, 9-27. Когда мы их образуем цепь РНК свернется в спираль сама собой -> таково геометрическое расположение атомов, которые образуют водородные связи.

    Казалось бы мы можем взять и использовать такую целевую функцию:

    Fo = F(14-22) + F(13-23) + F(12-24) + F(11-25) + F(10-26) + F(9-27)

    Но получится так, что связи на конце спирали, т.е. между нуклеотидами 10-26, 9-27 будут образовываться быстрее. Почему? Ну в общем-то понятно, длина цепи для концов больше, возможностей состыковаться больше, вероятность быстрее найти нужные повороты больше.

    Но чем это мешает? Дело в том, как только образуется водородная связь, атомы подходят так близко, что им становится затем так сложно найти поворот, чтобы наоборот отдалится друг от друга — велика вероятность столкновения. И это не физика — это геометрия в тех ограничения о которых я писал ранее.

    Так вот, если почти образовались связи 10-26, 9-27, то при условии «не развалить эти связи», а наша целевая функция это предполагает, это почти сводит к нулю возможность образовать затем связи в начале цепи, т.е. между нуклеотидами 14-22, 13-23.

    Конечно это связано с расчетами, а не с природой. В природе все хорошо.

    Но как вращается цепь. В игре FoldIt — есть такая возможность — инструмент Rebuild (посмотрите ролик, станет понятнее о чем речь). Он закрепляет конец цепи, и начинает вращать нуклеотиды. При этом если скажем проворачиваем 18 нуклеотид, то все нуклеотиды до него 1-17 остаются неподвижными. Но после поворота 18 нуклеотида обязательно изменят свое положение все остальные дальше, т.е. 19-61. Причем чем они дальше от 18-го тем сильнее они поменяют расположение.

    Так вот, если мы образовали связь 9-27, и желаем образовать связь 14-22, то на это влияют повороты внутри петли 15, 16, 17, 18, 19, 20, 21… допустим поворот Х в 18 нуклеотиде сильно уменьшает целевую функцию F(14-22), но он одновременно разрывает связь 9-27, и целевая функция F(9-27) очень сильно возрастает. Понятно, что при общей целевой функции Fo мы такой поворот никогда не осуществим, а значит не сможем двигаться к намеченной цели.

    В игре FoldIt есть такая возможность заморозить нуклеотиды. И тогда инструмент Rebuild вращает цепь только не замороженных нуклеотидов (это и наблюдается в ролике выше). Например, он может заморозить нуклеотиды 9-27, т.е. там где мы образовали связь, и вращать внутри между точками 9 — 27, не сдвигая их. Как он это делает? Прошу подскажите.

    Я же вышел из этой проблемы изменением целевой функции Fo. Она видна на слайде



    Идея очень простая — регулировать коэффициентом сжатия какие пары водородных связей нужно образовать в начале, а какие позже. При коэффициенте =1, эта функция превращается просто в сумму как и в Fo.

    Это существенно улучшает сворачивание спирали. Но все равно могут быть зацикливания, особенно на малых расстояниях. Тогда приходится менять коэффициент сжатия, так или иначе разрывать связи и повторять процесс. Это уже делается в ручную, и автоматизировать невозможно.

    upd. Важное дополнение см. ниже в комментариях с 3 рисунками сворачиваемого рибозима.
    Ads
    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More

    Comments 48

      +1
      Когда учился в институте делал свою игру, там была такая штука вроде руки робота, которая тянулась за игроком. Как я понимаю здесь что-то подобное — выбираются два звена цепи и притягиваются друг к другу. У меня для этого использовалась инверсная кинематика, возможно вам пригодится.
        0
        Да, это очень похоже на руки робота. А алгоритмы этой инверсной кинематики есть какие-то готовые, где их посмотреть можно?
          0
          Обычно в физических движках такое реализуют. Там же могут быть и примеры. Еще у меня брат на флеше рисует, часто пользуется такой штукой для анимации, правда там модель попроще.
          0
          Да, и главное, чтобы закрепить эту «руку» в двух точках — а двигались бы только звенья внутри этих точек. Инверсная кинематика это позволяет?
            0
            Теоретически иерархию можно закрепить в любых точках, соответственно зафиксированные звенья не просчитываются алгоритмом. Алгоритм итеративный, постепенно приближается к целевому значению в принципе основной принцип описан по ссылке в моем комментарии выше.

            Пример можно во многих 3д редакторах посмотреть (например в блендере), обычно это один из алгоритмов движения костей. К сожалению свой код не нашел :(.
              0
              Жаль, что код не нашли. Тут вот в чем проблема — если в ходе итераций будут дергаться закрепленные концы, или изменяться длины звеньев и будут между звеньями не стыковки… то все это не годится. А как так провернуть с одной стороны с точки x, и чтобы произошло точное сглаживание до второй точки y — вот это я и не понимаю.
                0
                Основные не стыковки, как я понимаю, это самопересечения цепочки атомов?
                  0
                  Это то да. Но я о другом — в процессе итераций ведь могут шевелиться зазоры между звеньями — или не могут?
                    0
                    Расстояние между суставами всегда остается постоянным, при желании можно его сделать одном из степеней свободы, обычно оно фиксировано. Образно руки сами не растягиваются :).
                      0
                      Тогда за счет чего удерживаются закрепленные точки/суставы (пусть 9-е и 27-е звено)? Ведь это же не прямые расчеты, если повернули 18-е — как то нужно оставить недвижимыми и 9-е и 27-е. Как?
                        0
                        За счет углов поворота, т.н. степеней свободы. Если их недостаточно для достижения цели — она не будет достигнута. Что-то вроде этого:

                        image

                        Туда просто невозможно дотянуться в рамках данной модели.
                        0
                        Ведь разница между прямой и инверсной — только в том какой конец будет двигаться, но двигаться то он будет в любом случае.
                          0
                          Грубо говоря — да.
                  0
                  Тут похоже нужна какая то комбинация прямой и инверсной.

                  Скажем поворачиваем 18-е звено. Закреплены 9-е и 27-е звено. Цель у нас приблизить звенья 14-е и 22-е. Тогда на участке 18-27 осуществляется прямая кинематика… но чтобы 27-е звено не сдвинулась, где то например, с 23-го звена нужно осуществлять обратную кинематику.

                  Но тут не ясно с какого звена нужно осуществлять обратную. И похоже не гарантий, что решение вообще будет найдено. Алгоритм думаю несколько сложный… поэтому может оказаться не пригодным по скорости. Вот надо бы чтобы специалисты оценили бы возможности этого.

                  Ну и может есть что-то попроще?
                    +1
                    Проще, для дуги можно угол распределить по всем звеньям, получим загогулину в нужную точку :).

                    Вообще если за ранее известны узлы между которыми могут образоваться водородные связи, например 14-22 на вашем изображении. Очевидно, что они соединяются цепочкой 15-16-...-20-21, свернув ее можно их соединить. При этом остальную часть в принципе можно не считать пусть висит как есть.

                    После того как первые два узла соединены весь сегменты 14-15-...-21-22 фиксируем и пробуем соединить узлы 13-23, так как сегмент уже фиксирован, будет гораздо проще это сделать.

                    Дальше можно поступить аналогично с кусками 12-24, 11-25 и т.д. пока все не свернется. Не исключено что я каких-то еще ограничений не понимаю.
                      0
                      Ага, я практически так и делаю. Проблема в том, что если вы фиксирует петлю 15, 16, 17, 18, 19, 20, 21, и образовали связи 14-22, и даже 13-23, то при образовании следующих с 12-24, окажется что образовать ее нельзя. Т.к. петля немного не такая. И так 1000 раз на дню.

                      Поэтому я вот и думаю нельзя ли как то наоборот при уже закрепленных более дальних связях подкорректировать петлю так, чтобы связи не распались после это корректировки.
                        0
                        Даже при закрепленных узлах 13-23, у нас остаются как минимум 2 (на двумерной картинке) степени свободы в узлах 13 и 23, за счет которых мы можем подобрать необходимое расстояние для связи 12-24.

                        Скорее всего я что-то не понимаю, можете объяснить по этой картинке как петля может быть не такой?
                          0
                          Ну там все сложнее же, каждый узел это нуклеотид — он состоит из около 30 атомов, которые неким образом связаны. Вращаться можно только по 6 торсионным углам (я писал в прошлых статьях). поэтому степеней то там хватает с одной стороны — их много больше 2-х. Но этого не достаточно, чтобы образовалась водородная связь. Например, предыдущая связь зафиксировалась так, что не позволяет дотянуться атомам друг до друга, что нужно для образования следующей связи. И это еще ничего. Но далее может оказаться, по стеку дальше, что и еще предыдущая связь x1 не позволяет занять текущей связи x2 стать в такое положение чтобы образовалась следующая связь x3 (хотя эти две x1 и x2 образуются). И еще дальше там уже петля и пока она не примет нужную форму не смогут образоваться все водородные связи.
                            +1
                            Кажется понял, попытался представить как это выглядит — не получилось. Можно использовать целевую функцию с несколькими атомами вроде (13-23) + (12-24), опять же как бы я решал задачу с рукой робота, будь там множество степеней свободы.

                            В описанном случае действительно если закрепленная петля не позволяет дотянуться до атома, скорее всего означает то что ее нельзя закреплять. Возможно «мягко» закрепить, то есть она будет двигаться но не так активно как незакрепленная часть.

                            Хотя опять же допускаю возможность такой комбинации поворотов, что без полного переворота всей петли будет невозможно дотянуться до некоторого атома. При переборе углов очевидно оптимальное расположение будет найдено, итеративно скорее всего — нет. Можно придумывать различные точки отката, скорее всего это не то что нужно. Выстроить сразу правильную петлю не думаю что получится, разве что методом Монте-Карло из различных начальных положений сворачивать (опять же нет гарантии правильности решения).

                            Лирическое отступление: мне кажется в природе в любом случае они сворачиваются из изначальной структуры под действием некоторых сил, стремясь образовать водородные связи и каким-то образом расположиться в пространстве. Мне все же кажется — это больше итеративный подход, нежели перебор всех углов с отсечением.
                              0
                              Проблему Вы поняли. Будем думать как решать. Со спиралью то я справляюсь за пару дней… но те же проблемы, только в большем масштабе при соединении двух спиралей L1+L2 (но это я позже напишу статейку еще)
                                0
                                Кстати, в первой части — есть рисунок спирали 3d — там все видно.
                                  0
                                  «Возможно «мягко» закрепить, то есть она будет двигаться но не так активно как незакрепленная часть.»

                                  Кстати, именно это и обеспечивает указанная в статье функция пригодности (на слайде)
                    0
                    Похоже я использую то, что называется прямой кинематикой… только вот никаких сил и т.п. там нет, сплошные повороты по углам… вот и хотелось бы не вводить никаких виртуальных сил, и решать задачу только в терминах поворотов по углам.
                      +1
                      Образно силы — это те же целевые функции, которые формируют водородные связи. Просто по ссылке это в физических терминах описано.
                    0
                    >Тогда приходится менять коэффициент сжатия, так или иначе разрывать связи и повторять процесс. Это уже делается в ручную, и автоматизировать невозможно.

                    Т.е. ваш метод поиска не работает? Ну значит имеет смысл применять более сильные методы которые выходят из локальных минимумов.
                      0
                      Таких методов еще не существует :)
                        0
                        И если серьезно. Дело совершенно не в методах. Все методы, которые якобы выходят из локальных минимумов — на самом деле выходят в произвольном направлении. В статье Ограничение оптимизирующих методов в играх с противником и без я показал, что энергетическая поверхность существенно меняется после каждого хода, т.е. в нашем случае после каждого фиксирования поворота. Поэтому только кажется, что выскакиваешь из минимума. Но на самом деле, с 99% вероятностью попадаешь просто в другой минимум, который для прошлого состояния может быть даже худшим чем был. И крутишься постоянно возле средних значений без шанса пойти против законов вероятности. Я цепь РНК имеет такой свойство, сворачиваться на каждом шагу не статистически по вероятности, а фиксируя свои связи так, чтобы следующий шаг мал наименее статистически вероятен.

                        Это все проверенно, а не просто мои рассуждения. А не понимание этого — и ведет к тому, что задача не решается по сей день.

                        Вместо погони за более сильными методами, нужно уточнять целевую функцию, стремясь к тому, чтобы в ней не будет локальных минимумов. В противном случае ни один метод в условиях когда много локальный методов не работает — это все равно что полный перебор (про полный перебор при мноджестве лок. минимумов — это не только мои слова, об этом говорят и другие специалисты, только они не занимаются биовычислениями).

                        Вот это я и сделал в 4 части. Здесь ситуация усложнилась, я снова уточнил целевую функцию. Да, есть некоторые проблемки — но это существенно лучше чем все альтернативное.

                        Важно при этом понимать, что целевая функция меняется, так же как и цели в шахматах — вначале там надо сделать одно, потом другое, и только потом гоняться за королем. Так и здесь. А погоня за супер пупер методом — не дает решения, т.к. нельзя решить задачу в которой цели постоянно меняются а действовать все равно однообразно.
                          0
                          И нет, мой метод работает. Дело только в том, что не все шаги можно автоматизировать — это разные вещи. Но это путь к тому, чтобы ЦЕЛЕНАПРАВЛЕННО понимать по каким законам сворачивается РНК, или точнее по каким вычислительным законам ее надо конструировать.
                            0
                            Попробую проиллюстрировать сказанное. Вот над чем сейчас работаю. Видите три нуклеотида, два с одной стороны а третий должен соединиться с ними обеими. С одной стороны соединился, теперь проворачивается ко второму. Но посмотрите какое напряжение у все цепи — это идет против всех законов статистической вероятности. По вероятности легче соединится как раз наоборот (т.е. тот что уже образовал водородные связи, наоборот с тем где пока нет), и даже с другой стороны этой спирали.

                              0
                              В большем масштабе

                              0
                              Вы тестировали ваше решение на реальной задаче, или просто разбираете теорию на данный момент?
                                0
                                А это по вашему не реальная задача? Я же сворачиваю вполне реальный рибозим :)
                                  0
                                  Или вы думаете, это я рассуждаю без экспериментов in silico?
                                    0
                                    Да, и кстати, все что я пишу — это не классическая теория. Это все мои соображения как нужно решать эту задачу. А соображения сформировались под действием экспериментов in silico, а не я сел и придумал :)
                                      0
                                      По поводу того, что это не классическая теория я понял. Просто я пытаюсь найти этот «рибозим» в PDB и не нахожу.
                                        +1
                                        Он еще не изучен. Есть только первичная последовательность. Это вироидный рибозим NC_003540

                                        см. в NCBI
                                          0
                                          Не подумай-те что это какой-то суровый поклеп, мне действительно интересно то, что выделаете, но на мой взгляд изучать фолдинг РНК для неизвестной структуры не имеет большого смысла, т.к. результат не с чем сравнить. Если бы работы базировались на реальной структуре то было бы значительно больше практической пользы, если таковую вы закладываете.

                                          891 структура РНК в PDB
                                          www.rcsb.org/pdb/results/results.do?outformat=&qrid=C08D4559&tabtoshow=Current
                                            0
                                            Это сделано намерено. Рибозимы имеют одинаковую базовую структуру, точнее то из-за чего их выделяют в один класс. Для сравнения я использую другой реально имеющийся рибозим 2QUS. Мне потом важно увидеть в чем отличия, а в чем похожесть.
                                              0
                                              Теперь понятно, вы взяли периодические структуры, и вироид имеет тоже консерваативную структуру.
                                                0
                                                Да, только эта консервативная структура очень маленькая, базируется возле кольца (между спиралями L1, L2, и спиралью на концах). Ну и есть у меня еще одна надежда, понять почему он саморазрезается, но не биологически, а так сказать с геометрическо-кибернетической точки зрения.
                                              0
                                              Ну, и потом мы можем по разному понимать «практическую пользу» :) В чем она по вашему?
                                                0
                                                Практическая польза с моей точки зрения — моделирование рибозом и РНК с неизвестной 3D структурой.
                                                  0
                                                  Ну вот видите я этим и занимаюсь :)
                                                    +1
                                                    Но те не менее, мне не важен такой практический результат. Мне важно получить некоторые законы по которым нужно сворачивать вообще любые РНК. Пусть они будут не до конца правильными, но хотелось бы чтобы они целенаправленно, а не стохастическим поиском, давали результат.
                                              0
                                              Организм Chrysanthemum chlorotic mottle viroid
                                                +1
                                                Статья про него www.ncbi.nlm.nih.gov/pubmed/9326597
                                            0
                                            И еще картинка. Тут замечательное состояние образованы обе спирали, и все межспиральные водородные связи (подробнее буду рассказывать в следующих статьях). Потратил я на это более 3 месяцев. Это к тому какой глубокий может быть поиск в глубину. И по функции пригодности просто замечательные результаты. Видим в кружке как хорошо стыковались межспиральные водородные связи два нуклеотида одной спираль с одним другого (44-15-20).

                                            Но один минус :) — так в природе рибозим не сворачивается. Я уже думал можно перейти к заключительной части закрутить концы рибозима в спираль (начиная со связей 7-55). Но они в таком положении не могут достать друг до друга 7 и 55 стали столь далеко, что не достают друг до друга, чтобы образовать связь. Начал искать в чем же проблема? А оказалось, что связь 44-15-20 образовалась с другой стороны. И любой метод дал бы то же самое. И почему? Да, потому что наконец оказалось, что взаимодействий ТОЛЬКО водородных связей мало — надо учитывать еще и другие взаимоотношения. Т.е. по сути я ответил на поставленный вопрос «как пойдет ход сворачивания, если РНК будет стремиться только к образованию водородных связей?». Ответ ниже.

                                            И это же означает, что та безобразная еще не свернутая спираль на рисунках выше — более близка к природному состоянию, чем так которая получилась из не достаточно точной целевой функции. Теперь я надеюсь понятно почему я усложняю и эксперементирую с методами, а пытаюсь понять каким законам подчиняется сворачивание, через вывод закона в целевой функции. Да во много это ручной труд, а не автоматизированный. Но это приближает нас к пониманию того как сворачивается РНК. А не просто к получению среднее статистического результата.

                                              0
                                              Да, забыл сказать, стрелкой показано, куда нужно переместить участок главной цепи. Т.е. спираль нужно перевернуть, и образовать межспиральные связи с другой стороны. Но из этого состояния — этого уже никогда не случится.

                                              Only users with full accounts can post comments. Log in, please.