Pull to refresh

Comments 18

Я в данной теме не спец, позвольте уточняющий вопрос. Копирование ДНК с помощью упомянутой полимеразы — это то, что называют «Полимеразной цепной реакцией»? Или этот термин применяется для обозначения какого-то другого процесса?
Описанный метод (MDA) как раз не относится к полимеразным цепным реакциям (ПЦР). При ПЦР копируется один конкретный участок ДНК. Какой именно — определяется экспериментатором, проводящим ПЦР. При MDA происходит хаотичное копирование случайных участков ДНК.
Это тот самый ПЦР, которым делают анализы на инфекции в медицине?
сборка человеческого генома может помочь определить наличие в организме раковых клеток еще на ранних этапах

это каким образом?
Вот пример использования другой технологии секвенирования единичной клетки (MALBAC) для диагностики циркулирующих в крови раковых клеток: bernstein.harvard.edu/research/MALBAC.html
Да, именно так. Люди, которые проводили эти исследования, сейчас являются нашими непосредственными партнерами.

Спасибо за ссылку.
Всегда было бы интересно узнать, каким образом рибосома синтезирует белки по РНК. Теперь меня заинтересовали полимеразы. Можно ли ожидать какой-нибудь статьи, направленной именно на полимеразы?
Полимеразы и то, что с ними связано, относятся скорее к молекулярной биологии и биотехнологиям. Я занимаюсь биоинформатикой (даже больше информатикой), поэтому, к сожалению, не смогу написать про них подробную статью, во всяком случае сейчас.
Могли бы вы куда нибудь выложить сырые данные, из которых необходимо восстановить геном? Желательно с примером восстановленного генома. Хочу попробовать с чистого листа решить эту задачу как программист с большим опытом работы по нагруженным алгоритмам, структурам данных и много поточному программированию.
Публичных данных и собранных геномов очень много.
Исходные данные https://www.ncbi.nlm.nih.gov/sra/
Геномы https://www.ncbi.nlm.nih.gov/genome/

Можно скачать примеры с сайта нашей лаборатории
Например, вот
http://spades.bioinf.spbau.ru/data/
http://spades.bioinf.spbau.ru/spades_test_datasets/

Тестовые (урезанные) данные
http://spades.bioinf.spbau.ru/~helsinki_course/data/

Сразу предупрежу что времени может занять много. Возможно, есть смысл почитать какие-то статьи на эту тему.
Спасибо, а инфа по формату файлов есть какая нибудь?

Я размышлял по поводу данных, полученных в результате MDA, возникли некоторые вопросы.
1. Прочитанные кусочки имеют случайную длину и случайную позицию чтения? Или же есть некоторый шаг и кратность?
2. И действительно ли чтение хаотичное, или же все же есть некая закономерность? Грубо говоря, сначала читается геном по младшим адресам потом по старшим. Хотя это наверно не важно, в файл эти данные все равно должны попадать хаотично.
Ага
https://en.wikipedia.org/wiki/FASTA_format
https://en.wikipedia.org/wiki/FASTQ_format
Нужно еще разобраться с реверс-комплиментарностью, с парными ридами итд. В общем, биологические аспекты есть. Тут, может быть лучше найти какой-нибудь он-лайн курс или методичку.
Можете посмотреть слайды к моему курсу тут http://bioinformaticsinstitute.ru/courses/ngs/09-2015-12-2015

1. Длина фиксированная, позиция при полногеномном секвенировании случайная всегда.
2. Да, действительно. Нет, младших и старших адресов нету :) Можете почитать про процесс секвернирования подробней
https://en.wikipedia.org/wiki/Shotgun_sequencing
https://en.wikipedia.org/wiki/DNA_sequencing#Next-generation_methods
Тогда такой вопрос в продолжение к первому. Вопрос о покрытии чтения. Можно ли надеется, что чтение было выполнено на каждой позиции кратно 1(или 2) хотя бы 1 раз?

Я так понимаю наиболее интересен процесс полногеномного секвенирования?
Нет, нельзя. В MDA покртыие генома обычно от 50% до 98%, при обычном секвенировании в среднем выше, до 100%, но гарантии что весь геном покрыт нету.

Сборка интересна как правило именно для полногеномного секвенирования. Другие методы используются для других целей.
Ого, если покрытие не дает 100%. Тогда к MDA прибегают несколько раз?
Не всегда, иногда нет цели собрать геном целиком. Интерес могу представлять отдельные гены или группы генов.
Sign up to leave a comment.