tac5 янв 2013 в 08:06

Дарвиновская эволюция бактерий — полная картина

8 мин

18K

Алгоритмы *

+13

Комментарии 47

akira 5 янв 2013 в 08:54

Эм, мне кажется, что порог вхождения немного завышен, я и половины слов не знаю :(

stg34 5 янв 2013 в 08:57

Есть два типа научных работ: один тип работ ставит целью донести до научной общественности полезную мысль, а второй тип работ ставит целью показать какой автор умный. :)

tac 5 янв 2013 в 09:12

ну, не знаю… мне наоборот, кажется, что любой специалист скажет мне, что я описываю «базарным языком». Если это не просто общие впечатление, скажите что не ясно. Я готов пояснять.

akira 5 янв 2013 в 09:17

секвенирование, геном, структура РНК, гены тРНК, штамм, таксономия, геномное сравнение, таксон

и мне пока хватит :)

tac 5 янв 2013 в 09:27

викификация

секвенирование, геном, структура РНК, гены тРНК, штамм, таксономия, геномное сравнение, таксон

не думал, что так много… но надо читать

NickLion 5 янв 2013 в 12:20

Честно, это базовые понятия из биологии, цитологии и генетики. Естественно, для понимания данного текста нужно обладать базисом. А иначе, это как компьютеры объяснять на уровне «коробочка», «мозги», и т.д. Для вводной статьи я бы согласился с тезисом, но данная статья ставит более серьёзные вопросы.

tac 6 янв 2013 в 02:58

Могу посоветовать почитать начиная с моей первой статьи на эту тему, там несколько проще Интересные результаты о эволюционной систематике прокариот или «многовидовое происхождение»

НЛО прилетело и опубликовало эту надпись здесь

NickLion 7 янв 2013 в 12:46

Но тут ведь нет мозголомных терминов, и контингент хабра не пятилетние дети. Ну, может ссылки на википедию по тексту расставить не помешало бы для тех, кто не очень знаком с биологией.

olegafx 5 янв 2013 в 09:37

Придется пройти парочку курсов на Coursera перед прочтением данной статьи

Wott 5 янв 2013 в 09:55

Имхо у вас есть одна проблема — вы схожесть генома приравниваете к наличию общих предков, но при случайных мутациях возможна схожесть генома и без общих предков. Потом отношения на дереве наследования — мутации у предка могут вернуться обратно и это может передвинуть вид в дереве выше. В целом я писал раньше — надо делать исследования на нескольких генах и складывать, возможно с весами, что бы снизить верятность таких «случайных ошибок»

tac 5 янв 2013 в 10:05

1. Теперь исследование сделано на многих генах, совпадения от 1 до 60
2. ген тРНК — это последовательность 70 нуклеотидов. Попробуйте сделать случайную мутацию, а потом посчитать вероятность, что следующая случайная мутация восстановит тРНК в первичное состояние. Я не считал, но очевидно, что она будет крайне мала.

tac 5 янв 2013 в 10:10

(собственно, числа на связях графа «многовидового происхождения» показывают усредненную оценку штаммов в роде по совпадению числа генов минимум-максимум)

tac 5 янв 2013 в 10:17

+я уже не говорю о том, что 3,4 и т.д. мутация будет лишь понижать вероятность возврата в первичное состояние. Кроме числа генов, есть еще усреднение штаммов по роду, т.е. выводы сделаны на основании совпадения данных разных штаммов в роду. Секвенирование этих штаммов сделано разными исследователями. Таким образом, если есть 2-5 штамов для одного рода, и 2-5 родов для другого — прикиньте какова вероятность, что все эти штаммы мутировали одновременно и одинаково?

Monnoroch 5 янв 2013 в 10:19

Вероятность вернуть сразу же действительно крайне мала. Но вернуться может в цикле длиной 2,3,4 и так далее до сколько там поколений существ было за все время существование планеты. А таких возможных циклов очень много.

tac 5 янв 2013 в 10:35

Я понял, этот аргумент. Как то делал работу на втором курсе, где как раз показывал, что можно при случайной генерации чисел восстановить первоначально число за определенное число попыток. Длина цикла должно быть, скажем для 70 нуклеотидов: много больше 4^70 (если не путаю)… это надо сравнить со скоростью мутаций. Но кросс- анализ при совпадении тРНК в нескольких штаммах разных родов уменьшает эту вероятность.

Конечно, нужно увеличивать число генов и анализируемых штаммов. Но это вопрос просто еще более представительной выборки, в то время как сделанная тут использует всю доступную публично информацию по тРНК. Можно это усилить другими генами. Но это дело будущего. А пока я не вижу по объему исследований больших, чем данное (хотя как писал в самом начале, их просто, возможно открыто не публикуют).

Monnoroch 5 янв 2013 в 10:40

Смотрите, представьте себе плоскость из ткани. И тут на нее положили бублик. Получилась вмятость в виде бублика. Вот представьте такую штуку (только многомерную) в качестве плотности распределения вероятности для «оставления следа в истории для мутации». Вот вам экстремум не точечный, а по кривой. И вдоль этой кривой все возможные геномы одинаково хорошо приспособлены, а потому если особь мутирует из этой кривой, то погибает и не оставляет того самого следа, соответственно, остаются и оставляют только те, кто мутирует вдоль этой кривой.
Я к тому, что циклы, хоть и имеют сами по себе малую плотность среди всех возможных мутаций, могут быть более вероятны, чем случайно выбранная цепь мутаций.
Вообще, все, что я тут говорю совершенно умозрительно, я просто пытаюсь представить, как оно могло бы быть, следуя KISS, так что я не претендую на истину, просто выдвигаю гипотезы.

tac 5 янв 2013 в 10:46

К сожалению, я не владею математикой настолько, чтобы достаточно точно оценить вероятности этих возможностей. А это надо делать не «на глаз». Но эта оценка ничего не изменит, кроме того, что мы в определенной мере должны будем согласится, что результаты могут быть не совсем точными. Для любого другого метода, который будет исходить из другого — будет только хуже.

Monnoroch 5 янв 2013 в 10:50

Понимаю. Просто вообще мое изначальное положение таково, что «раскрутить» эволюцию невозможно, при том, из за большого периода, не просто невозможно точно раскрутить, а даже приближенные результаты могут иметь только очень общий характер, соответственно, врятли оценка получится лучше в плане точности, чем классическая, не учитывающая гены. То есть она может получиться другой, но лучше ли? Я бы сказал, что очень сомнительно. А если даже и получится лучше, то доказать это не выйдет.

tac 5 янв 2013 в 11:10

Лучше она потому, что исходит из таких генов — тРНК, которые не мутировали (с поправкой выше, можно сказать выглядят сейчас так, что не мутировали). В то время как классически оценивается то, что мутирует и достаточно сильно. Там ошибка очевидно более велика. Но даже если кто-то заявит, что это не так — давайте сверим? Но я нигде не видел такого дерева, построенного супер-пупер методами, чтобы можно было сверить и отсюда мой пафос вначале.

Кроме того, надо учитывать, что в классическом варианте мы имеем дело с одним геном, по которому просто не возможно судить о направлении эволюции, а лишь о близости видов. Это разные вещи.

Далее совпадение нескольких генов значит много больше, так как за этим стоит не просто совпадение первичных последовательностей, а пространственное строение молекул, и соответственно идентичность выполнения функций.

Случайность мутирования — это теоретическое предположение, т.к. сложность этого процесса столь велика, что похожа на случайность. Хоть в отдельных случаях известно, что мутации направленные.

Поэтому если мы говорим, что некоторые организмы вернулись через несколько циклов снова к тому же состоянию — то это процесс не случайный. Это означает, что организм вначале перешел к таким условиям обитания, при которых начали мутировать его гены, с целью адаптировать свои функции, а потом произошло обратное восстановление причем один в один. Это все равно, что войти в одну воду дважды.

Но даже если так, то почему мы не можем считать предком набор тех генов, которые послужили основой для таких возможных цикличных локальных отклонений. Мы тут ошибемся не на много, мы лишь будем иметь несколько идеализированную картину без возможных шумовых локальных дрейфов.

tac 5 янв 2013 в 11:22

«чем классическая, не учитывающая гены»

мы тут разное назвали классическим. То, что вы тут называете классическим, я бы уже назвал ортодоксальным…

Здесь вообще показано, что организмы внешнее имеющие близкую морфологию могут быть на столько быть далеки эволюционно по строению генов, что их нельзя считать близкими.

Monnoroch 5 янв 2013 в 11:30

Да, все верно, но если у двух видов схожие гены, то тоже еще не факт, что они реально близки по родству. Но если действительно сравниваются немутирующие гены, то в общем и целом действительно с одной стороны можно достаточно точно определить родство. Другое дело, что если ген не мутировал, то ценность определенного родства для теории эволюции мне непонятна. Ну была миллиард лет назад общая бактерия-предок, ну и что с того, если через тысячу-другую поколений бактерий они разными путями пошли? Не важнее ли в таком случае именно морфология? Сложная наука :)

tac 5 янв 2013 в 11:45

Я тут как раз читаю Докинза «Расширенный фенотип»… оказывается споры того времени как я ходил «под стол» актуальны и по сей день… Докинз как раз показывает связь ген-вид-поведение-адаптация… рекомендую.

tac 5 янв 2013 в 11:50

Если на бытовом уровне — это спор о том, важно ли знать процесс производства и комплектацию железа компьютеров, или достаточно понимать как работают и выглядят компьютеры. Важно все… но со времен Аристотеля мы хотели знать причину — а причина «в железе» ;)

Wott 5 янв 2013 в 10:44

Мутации в цепочке может быть и случайные, а вот их наследование — нет — какие-то последовательности будут собираться, а какие-то будут сбоить. И тут надо смотреть количество изменений между отдельными аллелями, то бишь редакторскую дистанцию — близко расположенные будут переходить одна в другую и обратно регулярно, а чем больше количество элементарных изменений в кодирующей цепочке тем меньше вероятность мутации гена.

Monnoroch верно заметил — у нас слишком большое время и события даже очень маловероятные могут реализоваться. Так что надо принять за факт что они были и пытаться их учесть.

Monnoroch 5 янв 2013 в 10:15

Вообще, как неспециалист в биологии, но математик, могу сказать, что если мутации случайны, то у них есть, конечно, некоторое распределение, но тем не менее произойти могло все, что угодно, в том числе и N циклов в результате которых геном вернулся на круги своя. И любая динамика мутаций вида только с некоторой вероятностью показывает отношения его с другими видами. Проще говоря, за миллионы лет могло так случиться, что у двух видов похожий геном сложился из двух совершенно разных, при том, если вспомнить картину нормального распределения (его я взял из центральной предельной теоремы, предполагая равномерное распределение всяческих факторов, влияющих на ход мутаций), то вероятность нехило накапливается во времени, и чем дальше, тем ближе к единице. Реальные коэффициэнты я даже близко не представляю, но взяв пару сотен миллионов лет врятли я ошибусь, если скажу, что вышеописанные коллизии очень вероятны.

tac 5 янв 2013 в 10:24

мы как-то прикидывали, что последовательность из 10-20 нуклеотидов (4-буквенный алфавит) уже не случайна. Т.е. по последовательности ggggauugaaaaucccc уже можно сделать вывод о том, к какому гену она относится. А тут мы имеем совпадение 70 — 4200 нуклеотидов. И это мало согласуется с вашей оценкой.

Monnoroch 5 янв 2013 в 10:28

Что значит «уже не случайна»? Не очень понимаю, как это. То есть, я исхожу из модели изначально случайных значений + случайных же мутаций. Принцип «выживает сильнейший» накладывает ограничение на мутации в виде некого вида распределения, с экстремумами, в которые скатываются виды геномов. Либо модель в корне не верна, либо «не случайна» в каком-то неклассическом смысле у вас.

Monnoroch 5 янв 2013 в 10:35

И потом, «по последовательности *** уже можно сделать вывод о том, к какому гену она относится» не говорит о ее даже относительной неслучайности, а только о конечности множества существующих генов. Если бы по последовательности можно бы было восстановить исходную последовательность и все мутации, над ней произошедшие, то другой разговор. Это же как расшифровка строки символов по сути. Хотя может я чего-то не понимаю.

gro 5 янв 2013 в 10:33

Извините, голова сейчас не варит не смог осилить.
Скажите, пожалуйста, статья о том, что все учёные козлы, пилят гранты и скрывают от нас ПРАВДУ?
Или всё-таки мне стоит почитать это уже на свежую голову?

tac 5 янв 2013 в 10:36

думаю, надо почитать :)

trb 5 янв 2013 в 12:43

Кажется это что-то интересное, но я ничего не понял :( А вы не могли бы в конце статьи писать короткое резюме «для тупых», где простыми словами будет рассказано, о чем эта статья, и как и к каким выводам вы пришли в результате своего исследования? Главное — очень лаконично и очень доступно :) Спасибо

tac 5 янв 2013 в 13:04

Резюме простое: смотрим картинку в высоком разрешении, ну и я как бы намекаю профессионалам, что строить именного такого рода деревья важно и нужно, в отличии от того, чем они занимаются в этом отношении.

Картинка показывает, какие наборы тРНК нужны для наличия (создания) того или иного рода организмов. Зная это можно судить о том, как шла эволюция и в каком направлении.

А знать направление эволюции — означает, понимать как усложнялись белки (картина мутаций которых не позволяет понять направление их эволюции непосредственно). И таким образом, уже можно воссоздать картину усложнения (преобразования) организмов.

По хорошему, нужно как-то перейти дальше к эукариотам, но тут у меня затруднения…

В целом конечно, это шаги к генной инженерии — но так далеко мы не замахиваемся…

trb 5 янв 2013 в 14:26

Теперь понятнее, спасибо.

ryo_oh_ki 5 янв 2013 в 13:18

Как математическое упражнение — интересно. Но важно понимать за что конкретно отвечают каждые цепочки, это позволит исключить ненужные или невозможные сочетания генов в функциональном плане. К сожалению на данном этапе развития генетики это невозможно. Т.е. у нас есть листинг с «бинарным» кодом программы, но нет значимых представлений о том, что именно делает и как каждый конкретный участок, да и принцип работы «ЦП» до сих пор практически загадка.

gro 5 янв 2013 в 15:29

Опыт подсказывает мне, что чем более безаппеляционен и воинственен тон, чем больше в тексте «ниспроверганий» авторитетов, тем большая этот текст чепуха.
Хотя в данном случае доказать этого не могу.

tac 6 янв 2013 в 02:34

У вас опыт видимо не достаточен, почитайте споры Фрейд-Юнг, Кант-Шопенгауэр, Бор-Эйнштейн, Докинз-Гулд — и поймете, что это обычное дело.

gro 6 янв 2013 в 08:06

Шопенгауэров мы не читали и в гимнасиях не обучались.
Но вот Докинз уж точно никогда напрямую не пишет, что все дураки, а он один тут в белом. Он к этому мягко подводит. А потом ещё двадцать страниц испишет, что он не это имел ввиду.

tac 6 янв 2013 в 12:52

Ну, так и я не написал нигде — про «дураков в белом» :) — откуда это у вас такое впечатление?

gro 6 янв 2013 в 15:15

Ну, например, отсюда:

они занимаются этим профессионально, а результатов то нет… гранты не все использованы

и отсюда:

его можно обсуждать серьезно только тогда, когда у профессионалов будет хоть что-то сравнимое и столь же прозрачное

tac 6 янв 2013 в 16:50

Это просто констатация фактов :)… очень хотелось бы, чтобы было по другому…

tac 6 янв 2013 в 17:22

Нет, конечно кое-что есть… вот смотрите новейшие A phylogeny-driven genomic encyclopaedia of Bacteria and Archaea, December 2009. Посмотрите число авторов — после 20 я уже считать устал… объем выборки в 5 раз меньше. Прозрачности 0 целых 0 десятых… воспроизвести результаты невозможно… ну и как с этим сравнивать?

tac 6 янв 2013 в 17:42

Что же, касается Докинза, я вам цитату дам: "… Трудно найти более изящный образец рассуждений об эволюции, хотя уже почти слышишь дружное тявканье: «Нефальсифицируемо! Тавтологично! Сказки Киплинга!» ". Так бы и осталось бы — кто понял то понял, но редактор все же посчитал нужным сделать сноску «Американский эволюционист Стивен Гульд, а в след за ним и другие авторы, называли „сказками Киплинга“ нефальсифицируемые эволюционные гипотезы».

Более чем напрямую и адресно — написать сложно, и при этом совершенно ясно, что он имел введу.

Поэтому автор вынужден писать так, чтобы читатель понимал, чего стоит «тявканье критиков»… а если критикам по существу нет возможности говорить, то лучше и не говорить.

FreeMind2000 5 янв 2013 в 22:46

Сама затея очень интересная, автору — респект!
Это как розетский камень, расшифровкой которого занимался энтузиаст, решивший узнать первый язык человечества и прочитать то, о чем хотел поведать сам Бог…
video.yandex.ru/users/batex2010/view/1/

tac
Если не секрет, Вы какой софт используете для сортировки и построения дерева?
Я сам программист, если есть интересные задачи, могу помочь с реализацией. Да и вообще алгоритмы расшифровки моя стихия (со временем правда пока туговато).

Я так понял, Вы создали БД тРНК из доступных публичных источников, и цель — создать алгоритм, который сможет с большой вероятностью достоверности рассортировать тРНК по дереву поколений. В итоге мы получим хронологию эволюции бактерий и сможем увидеть как усложнялась структура организмов. Точнее, Вы уже в принципе это сделали, необходима так сказать проверка/оценка результата.

По хорошему, конечно, просто смотреть на дерево из списка букв и цифр не интересно. Вот если к каждой тРНК привязать ф-цию за которую она отвечает и доп. инфо о взаимодействии с другими тРНК, а потом визуализировать их работу и по сути построить на основе кода сам организм (хотя бы грубо в виде шариков/кубиков), вот это было самое то :)
Жаль, что такой полной информации в открытом доступе наверно не существует

tac 6 янв 2013 в 02:24

Все алгоритмы я пишу сам на C#. Граф отображаю с помощью yEd Graph Editor.

Вашу идею я понял, но должен несколько поправить: функция тРНК известна — переносить ту или иную аминокислоты к рибосоме. Строить тРНК надо конечно не в виде шариков/кубиков — это не интересно биологам, но тРНК обладает 3-х мерной структурой. У меня есть другой проект, которые более красив в смысле визуализации (см. Получена траектория сворачивания вироидного рибозима или новости с фронтов при использовании ПО RNAInSpace), но там все на порядок сложнее.

Но что можно было бы сделать здесь если бы были заинтересованные единомышленники. Наиболее консервативным и основным для жизни организма является процесс Биосинтеза белка. Рибосома которая в этом участвует состоит из ряда РНК и белков. Также как я проследил эволюцию тРНК можно проследить эволюцию частей (белков, РНК) рибосомы. И тогда мы могли бы судить о том как шла эволюция рибосомы в целом и по сути это можно визуализировать. Для бактерий вся нужная информация есть.

Да, такие исследования уже были — Тайна происхождения рибосом разгадана? (это легковесный обзор), но они не достаточно подробны в смысле эволюционного изменения… можно сделать много лучше… но тут как раз нужны люди… так что может поговорить и о чем-то договорится, чтобы реализовать…

FreeMind2000 6 янв 2013 в 20:08

Под «визуализировать их работу и по сути построить на основе кода сам организм» я как раз имел в виду, то что вы оказывается уже тоже делали
«Получена траектория сворачивания вироидного рибозима или новости с фронтов при использовании ПО RNAInSpace». Это конечно не сам организм и даже не клетка, но по полученной структуре уже можно судить о ф-циях и свойствах, что уже дает практическую выгоду.

В статье (кстати, очень интересной) о происхождении рибосом улыбнулся фразе «Согласно общепризнанной в настоящее время теории «РНК-мира...», лет 10 назад когда я на досуге изучал строение клетки «РНК-мир» еще не был общепризнанным, но теория мне тогда казалась самой правдоподобной. На мой взгляд, канадцы вполне убедительно показали, как из составных пазлов собирается РНК, их моделирование искусственной эволюции это подтвердило… Что тут можно добавить… Самим построить хронологию/эволюцию частей рибосомы… ну, да же не знаю.

Насколько я понял, прочитав несколько ваших статей, одна из глобальных целей — это найти минимальные/достаточные условия для создания самореплицирующихся объектов и тем самым провести грань между живым/не живым. Я в свое время, тоже задавался этим вопросом. Тогда это свелось к его переформулировке: разумный/не разумный? В самом деле, нижняя грань между разумным/не разумным объектом пролегает там же где и грань между живым/не живым – в наличии ф-ции «желания» самосохранения. Дальнейшая эволюция этой ф-ции приводит к появлению все более и более сложных форм продления срока своего существования (копирование, размножение, адаптация…). В итоге, я пришел к выводу, что любой объект, которому выпала честь начать свое существование в нашей вселенной, начиная от элементарных частиц и до скопления галактик (сама вселенная) – можно считать живым и разумным :) (конечно на своем уровне рассмотрения)

У нас много общих интересов, но как всегда мало свободного времени… которое хочется тратить на то, за что потом не будет стыдно перед вечностью. Было бы интересно объединить усилия над задачей, решение которой, принесет конкретный результат и пользу. Надо подумать…

tac 6 янв 2013 в 20:27

ну, как надумаете пишите… кстати, я бы не отказался также просто от эксплуатации чужого процессорного времени :) (есть обработка, которая занимает много времени)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий