Pull to refresh
40
0
Andrey Kartashov @Portah

User

Send message
Просто по мне код становится не читабельным и не связным, как тогда понять выйгрыш или пройгрыш в чем-то.

Например, конструктор класса Chain содержит параметр MolCount поидее общее количество молекул, но сами молекулы только в RNA появляются если верить комментарию.

Вы не обижайтесь плюсик я вам поставил, но помимо плюсика должна быть ещё и ясность.
Я не нашел, а где класс Angles используется. Т.е. мне показалось, что его специально совершенствовали, но для чего. Углы принадлежат Атомам, Атомы скорее всего Молекулам… Молекулы РНК, а что такое Цепочка тогда? Можно увидеть как-то все куски кода?
Я рад что есть человек которому хочется разобраться, и готов поделиться, но сейчас я на отдыхе, и не уверен в адекватности ответа.

Давайте, я попробую, написать ещё одну статью, на предмет, protein of interest, и тогда может станет более видимым, кусок моей работы, ибо в биоинформатике, просто огромное поле для деятельности, от куска ДНК до то как человек чихнул. Я работаю над небольшим куском и надеюсь это тоже интересно, и готов расписать что да как я пнимаю.

То что я описываю, это маленький кусочек от binding proteins до последовательности в секвенаторе, но все очень запутано, надо как-то систематизировать, надеюсь ваши вопросы мне в этом поиогут.
Я извиняюсь, я свалил в Майами отдыхать, и вот случайно проверив почту увидел сообщение. Постараюсь ответить более рационально, чем мое состояние на отдыхе :).

Я пытаюсь выдавать информацию, как сам её узнаю, во время работы. Т.е. то что вы видите, а имеено 5-6 статей это те вещи с которыми я столкнулся. Так же я не заметил, никакой информации именно на русском, т.е. даже русские пишут статьи на английском, это смущает.

Я сначала пытался разделить вопросы математики и биологии. Моя жена проверяет все мои статьи, я пытаюсь их сделать доступными на русском, но я плохо учился и она совсем не в моей специальности, и ей я объясняю тоже. В итоге некоторые статьи дют связь между биологией и математикой и информатикой, а некоторые нет.

В данном вопросе мне показалось логичным продолжение тематики секвенирования, и анализа той секвенированной информации.

Чем больше будет вопросов о том, что не понятно, тем больше у меня тем для разъяснения. Я нашел интересные картинки о регуляции процессов в организме, между клетками. И в итоге английское protein of interest, надеюсь, после написания пары статей должно стать понятным: расположением белка на ДНК.

Согласен, что, то количество информации которое я выдаю, мне так кажется, не может быть выражено в одной статье. Я стараюсь свои мысли сгруппировать, но я в этом кручусь, а вы смотрите со стороны, задвайте вопросы я с радостью отвечу либо в статье либо в комментариях.

Данный вопрос, это то как есть, если четко сократить все данные то: анализ секвенированных данных при помощи ChIP-seqю
    Нашел хороший пример, в котором наглядно видно, как меняются преобразованные в ручную данные.

    В данном примере рисунок 3 показывает не сдвинутые риды, просуммированные в окне в 20bp. На рисунке 1 они сдвинуты влево и вправо на 75, просуммированы в окне 20bp и сумма абсолютных величин отложена по оси “Y”. Для рисунка 2 выполнены теже действия, что и для рисунка 1 только окно не 20bp, а 200bp. И пики получившиеся на рисунке 1 объясняются местом где находились модифицированные нуклеосомы.

 

 

Отличный продукт, поставил себе почти сразу как купил HTC Pananche (MyTouch 4g). Родная HTC прошивка съедала батарейку меньше чем за день, в CM можно играться с настройками и рекорд был 10% батарейки за день, правда это с 100%. До конца так и не разряжал, привычка осталась раз в сутки заряжаться.

Они потом в форуме у себя, как-то вскользь упомянули, что им предложение хостера не очень понравилось, типа много ограничений на использование арендуемого оборудования. Поэтому я очень рад что они дособирали денег.

К моему сотовому уже первые беты CM9 на xda лежат http://forum.xda-developers.com/showpost.php?p=20131928&postcount=1. И это через 2 месяца после заявления google об открытии исходников, от HTC думаю можно и не ждать.
Ну серьезные материалы сами собой не появятся, их надо публиковать. Потом, что считать серьезными?

Каждый увлеченный своей тематикой может определить насколько серьезен или важен пост. Мне мои посты нарвятся, и то что есть группа людей, которым они могут быть полезны — отлично. А вот на сколько они серьезны, можно определить только по комментариям. Мне кажется, что кнопочки они более эмоцианальны что-ли, а что-то написанное это уже взвешенное.
Извиняюсь, уточнил у химиков, я был не прав. Как мне обяснили фиксация, как раз закрепляет белок на ДНК. А что происходит с материалами клетки которые Вы описали, я не очень понял. Толи из-за того, что методы для ДНК и поэтому этот материал всеравно вымоется, просто позже, толи из-за осаждения поскольку выберется только то что надо. Их участие игнорируется.

И перечитав второй вопрос ещё раз, понял, что и напутал. Это не определение какой белок получится в результате, транскрипции. А это определение какой белок, например, учавствует в процессе транскрипции. Или, например, а какой функционал, у этого белка, в каком либо процессе, связанным с ДНК.

А ваш вопрос более похож на РНК секвенирование. Тогда секвенируются участки — результат транскрипции, как Вы и описали, после сплайсинга и… других преобразований.
Ну я постарался рассмотреть все варианты. Я если честно надеюсь ответил именно на поставленный вопрос. А то как-то все гадал, какая именно конкретика нужна.
Проходил собеседование в амазон, было аж 3 телефонных интервью. Вопросы очень похожи на указанные автором. И рекомендации правильные. В амазон конечно не спрашивали про продукцию гугл, но про идеи развития амазон, конечно да.
Еще одна статья, рассказывает о влиянии хистонных модификаций на регуляцию процессов в клетке.

Cell. 2007 May 18;129(4):823-37.
High-resolution profiling of histone methylations in the human genome.
Barski A, Cuddapah S, Cui K, Roh TY, Schones DE, Wang Z, Wei G, Chepelev I, Zhao K.
www.ncbi.nlm.nih.gov/pubmed/17512414
По поводу второй части вопроса, да выправы, их вымывают при фиксации, т.е. оставляют только хромосомы.
Постараюсь ответить на все по порядку. Но мне кажется, что возникла путаница.

Если первый вопрос к тому, что я ошибся, написав хистоны вместо гистонов, то да, ошибся – поправил. Спасибо, за понимание, я эти термины узнал вначале на английском.

Если вопрос, что при секвенирование ДНК пытаются осадить, только гистоны, то нет, не только. Осаждают те участки, которые интересуют. Если интересует участок вокруг всех гистонов, т.е. нуклеосом, то скорее всего ДНК порежут при помощи DNase и отфильтруют по размеру, длина фрагментов интересующего участка примерно 150 оснований.

Наверное, акценты поставлены не правильно, нас интересует не участок ДНК и поэтому мы ищем белок на нем. А нас интересует где закреплен белок и мы находим участок.

Ученых интересуют не просто гистон, а его модификация, пусть будет H3K4Me3, считается, что модификации играют важную роль. Поэтому и ищется антитело к модификации H3K4Me3, но это не означает, что если этот же гистон ещё дополнительно модифицирован, то он не прицепится к антителу. К антителу присоединятся все гистоны с интересующей модификацией – H3KeMe3.

Как точно происходит, химический процесс, что в каком порядке смешивают, я не знаю. Я анализирую данные.

Интересный обзор по теме:
J Cell Biochem. 2009 May 1;107(1):11-8.
Genomic location analysis by ChIP-Seq.
Barski A, Zhao K.
Да в общем-то все вместе. Технологии развиваются, изменяется информация изменяется её кол-во. Сначала простые алгоритмы, типа просто построения bedgrapha, далее сложнее, потом когда осознали какой алгоритм к чему, написали программу все это совмещающую. Например, CisGenome, SiSSRs, PeakSeq, MACS, F-Seq. Их много каждая для чего-то своего, но данных то много, и один ученый может работать с многим количеством этих данных.
Или такая очерёдность, сначало считалось что транскрипция идет только «по верхней спирали и слева направо», теперь знают, что и по верхней слева направо и по нижней справа налево. Поэтому раньше не сильно заморачивались чтобы сохранить ориентацию, а тут видел статью, где расписано, каким методом это сделать наиболее четко и аккуратно.
Сами приборы изменяются. В общем завораживающе.
Я начал писать статьи в разделе habrahabr.ru/blogs/bioinformatics/, в последней статье понял, что многие алгоритмы описаны на хабре, но с ходу я не знаю подходящий он или нет.

Хочу просить помощи. В этой статье habrahabr.ru/blogs/bioinformatics/137453/ приведены графики, частично похожие на приведеные здесь. Можно ли представленный тут алгоритм, или может существует другой, повернуть так, чтобы он правильно идентефицировал тип графика? Типа острые пики, пологие пики, «забор»?
На хабре один из разделов — Алгоритмы, мне кажется может выступать связующим звеном. Я оттуда переодически заношу в букмарки статьи, вот одна из них: habrahabr.ru/blogs/algorithm/135281/. Я знаю, что такой подход используется в биоинформатике.

Если те кто пишет в тот раздел разобрались с вопросом, о котором пишут. То, например, здесь первая задача это классифицировать, каким путем получены данные. И смотря на те графики, человек работающий со глаживанием, или распознованием, легко скажет: «Дык это легко сделать, спомощью такого-то метода. Мол когда с ним работал, отлично все идентифицировал».

Но как, подтянуть народ от туда сюда, или как их синтегрировать. Я не знаю. Только если там в комментариях наспамить, но это наверное не камильфо.
Судя по тенденции развития, наверное года через 2 точно можно удалить. Ибо будет не актуально. Сейчас свежие статьи максимум на статьи 2009го года ссылаются, более ранние статьи уже не о том.

Мне по работе в journal club выступать надо, правда на английском, но мне не трудно и на русском рассказать, чем и занимаюсь. Надеюсь благодоря поиску (гугл, яндексу) подтянутся люди, которые занимаются этим. Я очень рад, что появилась статья от dunordavind.

Проблема в том, что в россии это не так распространено как во всем остальном мире. Пара слов из статей, и они первые в поисках. Другая проблема, что их может никто и не ищет на русском.
Ну мы сначала, взяли все, что получили из машинки, скормили кластеринг и в хитмэп — получили кашу Стали думать, что да как, стали смотреть вокруг старт сайтов только — каша. Загнали все в геном браузер и глазками, поняли, что смотрим немного не там. Появилась едея… в общем сейчас будем смотреть с помощью ZINBA глазками. Если что прорисуется — будет замечательно.
А теперь правильный ответ, пришлось подтянуть мат часть.

Имеем N окон, для каждого из которого проверям нулевую гипотезу (множественное тестирование). Тогда в расчет принимается Bonferoni correction, и в нашем случае получается следующее: мы готовы мириться с тем, что хотя бы один фрагмент будет считаться обогащенным ошибочно с вероятностью 1%. Значит для каждого окна потребуем, чтобы p value было меньше чем 0.01/N. Т.е. p value должно быть меньше 0.01/4565206.228 примерно равно 2.19E-9, я написал 1E-15 что ещё меньше.

С биологической точки зреня это p value слишком строга, так как вероятность внесения ошибки на биологической стороне существенно больше.
Так же если посмотреть, на сами данные то этому значению p value будет соответствовать примерно 8-11 ридов, на окно в 500. Интересно, что можно получить из этих данных?

Information

Rating
Does not participate
Location
Kentucky, США
Date of birth
Registered
Activity