Pull to refresh

Comments 43

А чем именно Вы занимались на стажировке?
Что можно конкретно сделать используя полученный вами опыт?
Я разрабатывал и реализовывал алгоритмы для одного из этапов сборки генома. Если быть точным — алгоритмы для разрешения повторов (возможно, об этом я расскажу позже). Созданный модуль теперь входит в наш ассемблер, а я с недавнего времени вернулся к исследованиям в этой области.

Что касается перспектив. Ну самое банальное — есть возможность остаться в лаборатории полноценным сотрудником. Если же взять стажировку отдельно, то это очень хороший способ познакомиться с биоинформатикой лично, пообщаться с опытными в этой области людьми, посетить интересные семинары, ну и, конечно, попробовать себя в чем-то новом. Даже если в Ваших дальнейших планах биоинформатики нету, то, как мне кажется, поработать над различного рода алгоритмическими задачами и что-нибудь исследовать может быть полезным для любого программиста.
Как интересно вы свичнулись с Карповской кафедры ажно в другой университет ;)

Но вообще, биоинформатика это конечно круто. За ней будущее. Хотя в моем видении, всеже само «био» должно там присутсвовать больше.

А статья как раз в точку, то что я сам хотел узнать. Спасибо. Буду рад каким-нибудь еще примерам из работы.
UFO just landed and posted this here
UFO just landed and posted this here
Это сложно несколько объяснить, но попробую…

Проблема, имхо, как и в бизнесе с computer science. Есть, скажем бухгалтеры или банкиры, трейдеры и т.п. Они живут в своем мире, в своем домене знаний и парадигм. Их учили и они учились этому всю свою жизнь. И есть программисты или другие технические люди, призванные сделать работу людей бизнеса более эффективной. Но они не обладают тем доменом знаний, соответственно все это держится только на том, что кто-то смоделировал задачу, перенеся ее в абстракции и сделав ее пригодной для поиска решения программистами. Это может быть как человек из бизнеса, или девелопер, прошаренный в вопросах бизнеса.

С биоинформатикой, как мне кажется, тут ситуация еще сложнее. Биология, генетика и медицина — это вообще еще до конца непонятная вещь. Поэтому текущие задачи — это все лишь видение людей, которые описали ее так, как они ее понимают. И моделировать такие задачи сложнее, чем понятный бухгалтерский домен. И модель сама по себе может получится неадекватной.

Поэтому, если человек, занимающийся биоинформатикой будет как хорошим алгоритмистом, так и биологом, то эффективность поиска решений, исходя из знаний что вообще почему и откуда берется, может быть несомненно выше, и даже решена возможно другими подходами, нежели решается сейчас.
UFO just landed and posted this here
Не совсем понял вопрос.

Вот сборка генома — это типичное абстрагирование и перенос формулировки задачи в область известных алгоритмических проблем. Т.е. биосоставляющей там уже нет. Чтобы возможно было так абстрагироваться, нужно иметь знания в биологии, чтобы быть уверенным что модель адекватна, что мы выкинули то, что действительно не имеет значения для задачи, и после этого мы уже имеем возможность подбирать решение.

Т.е. вот это
Для биологов геном – это молекулы ДНК – длинные цепочки, состоящие из четырех нуклеотидов, организованные в хромосомы, свёрнутые в ядре клетки. Мы же видим геном как строку, состоящую опять же из четырех символов (A, C, G, T).

может быть неадекватным, хотя по прошествии многих лет это уже маловероятно, но подозреваю есть другие проблемы.

Так вот человек, работающий с биоинформатикой и обладающий знаниями и в биологии и в информатике, может быть более эффективен на ниве поиска абстракций для последующего подбора решений.

Я так это вижу. Надеюсь ответил.

UFO just landed and posted this here
Зачастую работа биоинформатика как раз и состоит в формулировке абстракций и задач, адекватно отражающих биологическую реальность, но в то же время поддающихся элегантному решению с точки зрения информатики / математики / статистики. Так, например, было и с задачей сборки геномов, и с rearrangement distance (расстояние по крупномасштабным мутациям в геноме — «перестройкам»). Последнюю, когда переформулировали ближе к биологии (заменили беззнаковые перестановки на знаковые), оказалось возможно решить полиномиально. Тогда как изначальная задача была NP-сложна (sorting unsigned permutations by reversals).

И мы, конечно, что-то знаем и про биологию, которая лежит за буквами A, C, G и T, и про биотехнологии, позволяющие их секвенировать, — это позволяет не улетать в небо абстракций, а решать прикладные и полезные биологам задачи. С другой стороны, знать досконально все биологические процессы и быть одновременно первоклассным информатиком очень сложно — необходимо выбирать золотую середину и находить свою нишу.
А не поясните в двух словах, чем отличаются беззнаковые и знаковые перестановки?
Знаковые перестановки учитывают цепь ДНК, в которой находится ген (блок).

Например, знаковая:
1 2 -3 4 -5 -6 7

Беззнаковая:
1 2 3 4 5 6 7
А что эти цифры обозначают? Цепи ДНК, как тут сказано, из ACGT состоят — а как с этими буквами данные цифры соотносятся?
Это общие подстроки у геномов. Например, пронумерованные гены.
Ок. А что тогда значит минус у такой подстроки?
Что она находится в отрицательной цепи ДНК.
Издеватетесь, что-ли? Что такое «отрицательная»?
У ДНК две цепи спирали — положительная и отрицательная. Отрицательная цепь комплементарна положительной.

www.biostars.org/p/45810/:

The positive strand of DNA is the one whose sequence contains the instructions for building a protein. The negative strand merely contains the complementary sequence, according to the base-pairing rules (A pairs with T, C pairs with G); the negative strand is not normally transcribed into RNA nor translated into protein.

When you have a chromosomal DNA reference sequence, all the numerous sequence features like genes can be on both strand. The reference orientation is entirely arbitrary.

When the strand is indicated as minus, you extract the sequence between the start and end locations and take reverse complement of that to get the correct feature sequence.
Во, комплементарная — это понятно. Спасибо

P.S.: Так бы сразу и сказали — «отрицательной часто называют цепочку нуклеотидов, комплементарную имеющейся» ;)
Да, засиделся на месте :)

Я думаю, это самое «био» частично заключается в сотрудничестве с биологическими лабораториями, которые поставляют данные и являются конечными пользователями. Ну и, конечно, для решения каждой отдельной задачи уровень знания биологии нужен разный — где-то больше, где-то меньше. Сборка генома это лишь один конкретный пример.

Спасибо. Надеюсь, напишу о других примерах позже.
разве с карповской кафедры вообще можно свичнуться?) я думал это невозможно)
кто был вашим научником там, если не секрет?)
Вы промахнулись, похоже, комментарием. Я никуда не свитчился, а так ее и окончил, это топикстартер сделал.
Перечитывал комментарии, заметил ваш. Тогда не увидел, так как он не отвечает на мой. Лучше поздно, чем никогда :)

Я просто закончил бакалавриат, поступил в СПбАУ и забрал документы из деканата. Научным руководителем был Трифонов П.В. и диплом я писал на тему помехоустойчивых кодов.
единственный разумный выбор!
Как раз сегодня закончился приём заявок на стажировку на лето 2012 :-) Или не закончился?
Формально заканчивается, но это только формально :) Заявление в принципе можно подать и позже.
Очень интересная тема, спасибо за пост! Хотелось бы подробнее про то, чем занимается лаборатория, про сборщики, и все остальное. В общем — пишите еще :)
Магистратура по специальности «Алгоритмическая биоинформатика» при лаборатории сейчас проводит набор, к слову.
Каждый раз когда читаю такие статьи, хочется биться головой об стол) В хорошем смысле)
В моем вузе с исследованиями все очень тухло, а так хочется применить и расширить свои знания)
Можете подробней рассказать о стажировке и как туда попасть в этом году(сейчас пишу диплом бакалавра по специальности «Вычислительная техника»).
Конец бакалавриата, как мне кажется, самое лучшее время для смены обстановки. Еще есть время поучиться, но при этом Вы уже лучше понимаете чем бы Вы хотели заняться и можете попробовать перейти в другой ВУЗ. Сделать сознательный выбор или, например, переехать в другой город после бакалавриата несколько проще, чем сразу после окончания школы.

Варианты тут такие. Во-первых, Вы можете подать на стажировку на сайте лаборатории (http://bioinf.spbau.ru/int). Также, Вы можете попробовать поступить в вышеупомянутую магистратуру СПбАУ (http://mit.spbau.ru/admission2012#bioinf). В обоих случаях надо просто подать электронную заявку.
А как вам идея скрестить AI и биоинформатику? Например, смоделировать мозг какого-нибудь относительно простого существа (например, лабораторной мыши) в виде множества нейронов, передающих сигналы друг другу?

Идея может и бредовая, но почему-то мне кажется интересной )
Честно говоря, AI я никогда не занимался, и есть ли исследования в этой области, сказать не готов. Но что точно могу сказать, это что лабораторная мышь очень непростое существо. Мышь не только млекопитающее, но и плацентарное, а значит одно из самых высокоразвитых существ. Подозреваю, что мозг мыши устроен невероятно сложно.

К слову, геном мыши отличается от генома человека всего лишь 139 перестановками (если не путаю).
Интересно, какие есть примеры биоинформатических (не биотехнологических) стартапов, т. е. разработки программных продуктов для обработки геномных и др. данных с перспективой продажи крупной компании или превращения в таковую? Например, dnanexus.com/ — чисто ИТшный, облачный стартап, заточенный под анализ больших объемов ATCG-кода.
Спасибо. Последний пример стоит отметить отдельно — это не чисто биоинформационный стартап, но потенциально — аналог Google в этой сфере, т. е. генератор дочерних биоинформационных проектов.
Как раз чисто биоинформатический — всю биологическую часть они аутсорсят в лаборатории www.ngi.com, а сами занимаются только анализом данных (и строят социальную сеть на геномах). Кстати, финансирует их как раз Google Ventures.
В Новосибирске похожими вещами занимаются:
UGENE
Вообще-то в совренной биоинформатике много биологии и очень мало самой информатики. Вот, например, вопрос: «Почему у людей насчитывается по 23 пары хромосом?» Почему, скажем, не 24 или 32, как у других приматов. Почему цифра 23, являющаяся нонсенсом для окружающей нас природы, отличается от фундаментальных законов и принципов Мироздания, которое подчиняется ряду: 1; 2; 4; 8; 16; 32 и так далее.
Кто украл у нас одну пару, или пять, или даже 9 пар хромосом? Инопланетяне? Аннунаки с планеты Небиру?
Как так получилось, что хромосом, отвечающих за «телепатию», не оказалось у людей, но есть у других животных? Кто лишил нас этого и навязал нам речевой аппарат вместо прямого общения?
Жаль, следующих статей до сих пор нет…
Sign up to leave a comment.