Pull to refresh
39
0
Андрей Пржибельский @andrewprzh

User

Снова о биоинформатике: сборка бактериальных геномов

Не всегда, иногда нет цели собрать геном целиком. Интерес могу представлять отдельные гены или группы генов.

Снова о биоинформатике: сборка бактериальных геномов

Нет, нельзя. В MDA покртыие генома обычно от 50% до 98%, при обычном секвенировании в среднем выше, до 100%, но гарантии что весь геном покрыт нету.

Сборка интересна как правило именно для полногеномного секвенирования. Другие методы используются для других целей.

Снова о биоинформатике: сборка бактериальных геномов

Ага
https://en.wikipedia.org/wiki/FASTA_format
https://en.wikipedia.org/wiki/FASTQ_format
Нужно еще разобраться с реверс-комплиментарностью, с парными ридами итд. В общем, биологические аспекты есть. Тут, может быть лучше найти какой-нибудь он-лайн курс или методичку.
Можете посмотреть слайды к моему курсу тут http://bioinformaticsinstitute.ru/courses/ngs/09-2015-12-2015

1. Длина фиксированная, позиция при полногеномном секвенировании случайная всегда.
2. Да, действительно. Нет, младших и старших адресов нету :) Можете почитать про процесс секвернирования подробней
https://en.wikipedia.org/wiki/Shotgun_sequencing
https://en.wikipedia.org/wiki/DNA_sequencing#Next-generation_methods

Снова о биоинформатике: сборка бактериальных геномов

Публичных данных и собранных геномов очень много.
Исходные данные https://www.ncbi.nlm.nih.gov/sra/
Геномы https://www.ncbi.nlm.nih.gov/genome/

Можно скачать примеры с сайта нашей лаборатории
Например, вот
http://spades.bioinf.spbau.ru/data/
http://spades.bioinf.spbau.ru/spades_test_datasets/

Тестовые (урезанные) данные
http://spades.bioinf.spbau.ru/~helsinki_course/data/

Сразу предупрежу что времени может занять много. Возможно, есть смысл почитать какие-то статьи на эту тему.

Биоинформатика: взгляд изнутри

Перечитывал комментарии, заметил ваш. Тогда не увидел, так как он не отвечает на мой. Лучше поздно, чем никогда :)

Я просто закончил бакалавриат, поступил в СПбАУ и забрал документы из деканата. Научным руководителем был Трифонов П.В. и диплом я писал на тему помехоустойчивых кодов.

Снова о биоинформатике: сборка бактериальных геномов

Полимеразы и то, что с ними связано, относятся скорее к молекулярной биологии и биотехнологиям. Я занимаюсь биоинформатикой (даже больше информатикой), поэтому, к сожалению, не смогу написать про них подробную статью, во всяком случае сейчас.

Снова о биоинформатике: сборка бактериальных геномов

Да, именно так. Люди, которые проводили эти исследования, сейчас являются нашими непосредственными партнерами.

Спасибо за ссылку.

Снова о биоинформатике: сборка бактериальных геномов

Вот пример использования другой технологии секвенирования единичной клетки (MALBAC) для диагностики циркулирующих в крови раковых клеток: bernstein.harvard.edu/research/MALBAC.html

Снова о биоинформатике: сборка бактериальных геномов

Описанный метод (MDA) как раз не относится к полимеразным цепным реакциям (ПЦР). При ПЦР копируется один конкретный участок ДНК. Какой именно — определяется экспериментатором, проводящим ПЦР. При MDA происходит хаотичное копирование случайных участков ДНК.

Биоинформатика: взгляд изнутри

Наконец-то руки дошли
habrahabr.ru/post/186492/

Биоинформатика: взгляд изнутри

Честно говоря, AI я никогда не занимался, и есть ли исследования в этой области, сказать не готов. Но что точно могу сказать, это что лабораторная мышь очень непростое существо. Мышь не только млекопитающее, но и плацентарное, а значит одно из самых высокоразвитых существ. Подозреваю, что мозг мыши устроен невероятно сложно.

К слову, геном мыши отличается от генома человека всего лишь 139 перестановками (если не путаю).

Биоинформатика: взгляд изнутри

Конец бакалавриата, как мне кажется, самое лучшее время для смены обстановки. Еще есть время поучиться, но при этом Вы уже лучше понимаете чем бы Вы хотели заняться и можете попробовать перейти в другой ВУЗ. Сделать сознательный выбор или, например, переехать в другой город после бакалавриата несколько проще, чем сразу после окончания школы.

Варианты тут такие. Во-первых, Вы можете подать на стажировку на сайте лаборатории (http://bioinf.spbau.ru/int). Также, Вы можете попробовать поступить в вышеупомянутую магистратуру СПбАУ (http://mit.spbau.ru/admission2012#bioinf). В обоих случаях надо просто подать электронную заявку.

Биоинформатика: взгляд изнутри

Формально заканчивается, но это только формально :) Заявление в принципе можно подать и позже.

Биоинформатика: взгляд изнутри

Да, засиделся на месте :)

Я думаю, это самое «био» частично заключается в сотрудничестве с биологическими лабораториями, которые поставляют данные и являются конечными пользователями. Ну и, конечно, для решения каждой отдельной задачи уровень знания биологии нужен разный — где-то больше, где-то меньше. Сборка генома это лишь один конкретный пример.

Спасибо. Надеюсь, напишу о других примерах позже.

Биоинформатика: взгляд изнутри

Я разрабатывал и реализовывал алгоритмы для одного из этапов сборки генома. Если быть точным — алгоритмы для разрешения повторов (возможно, об этом я расскажу позже). Созданный модуль теперь входит в наш ассемблер, а я с недавнего времени вернулся к исследованиям в этой области.

Что касается перспектив. Ну самое банальное — есть возможность остаться в лаборатории полноценным сотрудником. Если же взять стажировку отдельно, то это очень хороший способ познакомиться с биоинформатикой лично, пообщаться с опытными в этой области людьми, посетить интересные семинары, ну и, конечно, попробовать себя в чем-то новом. Даже если в Ваших дальнейших планах биоинформатики нету, то, как мне кажется, поработать над различного рода алгоритмическими задачами и что-нибудь исследовать может быть полезным для любого программиста.

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity