All streams
Search
Write a publication
Pull to refresh
40
0
Andrey Kartashov @Portah

User

Send message
Надо смотреть на данные, я же не сказал, что все обязанны придерживатся. Если вас устроивает ошибка в 1% так и берите 0.01. Мы хотели посмотреть на больше количество вариантов.

Потом это один из подходов. Вот скоро будет вводная часть в ZINBA, тогда будет рассуждать а чтоже там такое.
Пока нет в библиотеке контроля не понятно, что с ней делать. Это один из методов как пощупать результат.
Параметр p value, характеризует: с каким процентом ошибки мы согласны мириться. Обычно, все довольны результатом с p value < 0.05 (5%), так что наша оцнка будет считаться очень хорошей.
Ну не так уж и страшен черт, как его малюют. Тут, вопрос только в том, насколько применим Пуассон в таком контексте. Т.е. этот метод оправдан, даст ли он искомый результат? Но судя по статьям, и то, что его используют, многие думают, что оправдан. Хотя я уже читал, что биноминальное распределение более точно описывает. А так чего сложного-то вычислить lambda, подсчитать k по известным данным, да подставить их в формулу.
Я поэтому и попытался извильнутся «вывод из строя». Метилирование может попадать на части ДНК, которые относят к активным и к репрессивным. Если метилируется репрессивный участок, то экспрессия может расти.
    Отличный обзор! Сам думал, как подойти к вопросу эпигинетики (epigenetic). Надеюсь, появятся комментарии с вопросами. Я лично всегда рад вопросам, надеюсь и автор тоже. По мне только со стороны видно, понятна тематика или нет.

    Вспоминается анекдот про экзамен по матану: «Мат. анализ он большой что-нибудь да не знает. Три ставлю и отпускаю». Так и тут, огромное количество информации, которое переварить любому человеку, подготовленному или нет, думаю сложно. Пока читал, появились вопросы.

    Я правильно понимаю, что этим способом можно померить, только уровень метиляции, т.е. один два три, а дальше много. Без привязки к месту метилирования, или биологи стараются «подсветить» конкретные участки. Как я помню, метилирование ДНК работает как, вывод из строя участка ДНК(silence). Т.е. если на участке ДНК присутствует метиляция, и этот участок в обычном состоянии активно экспрессировался, то он более не экспрессируется?

    Выбор шкалы значений. Можно добавить пару слов на русском. К чему привязана шкала, т.е. что такое Бета и М?
Похоже из комментариев набралось на ещё одну статью, «Некоторые здачи биоинформатики и способы их решения».
С ДНК техника работы другая, там надо придумать какой регион интересует, придумать антитело, с помощью которого этот регион отделить от клеточной массы. Оцифровать только этот регион, посмотреть, где он оказался на геноме, и высказать какую-то теорию. Например, белок “zinc finger” имеет определённый сайт связывания с ДНК (последовательность нуклеотидов на ДНК). Известно, что он является одним из transcription factors (фактором, влияющим на процесс транскрипции). Есть антитело к этому транскрипционному фактору, которое позволяет отделять, клеточный материал и кусочки с которым этот фактор связывается. Таки образом, после всех операций, мы получим риды которые на геноме находятся близко к этому сайту связывания. И на графе получим пик в том месте.
Наверное, это можно сравнить с grep через | в Linux, один фильтр, второй. Результат в сиквенатор, затем поиск в геноме, затем геном браузер.
Там огромный цикл, как это происходит. С ДНК копируются кусочки, и например скопированный кусочек в результате преобразований, превратился в белок, который занимается копированием. Чем больше таких кусочков, тем больше белков, тем больше копирований, тем больше экспрессия.
Это совсем простое объяснение и частное, меня за него любой учитель биологии убъет и размажет по стенке :)
Рассмотрим пример. Есть злокачественные опухоли. Есть предположение, что нарушается механизм контроля экспрессии. Информация о том, что экспрессировать и в каких количествах тоже расположена на ДНК. Мы находим экспрессию генов в здоровом организме и сравниваем с экспрессией генов в больном, находим разницу. И те гены, которые over expressed в больном организме, находим в геном браузере, и смотрим точные участки по пикам, визуально.

При известной аннотации иногда можно увидеть, что за что отвечает и сделать выводы.
Я же не биолог. Ко мне подходит биолог и говорит я тут прогнал експерементов, вот те файлы сделайте bedgraph, а потом он сам сидит смотрит на эти пики в genome browser и делает выводы. Я конечно любознательный и задавал вопросы и что-то понял. Попробую в следующем посте объяснить.
Буду стараться. Я этими оборотами стараюсь скрыть или увильнуть от вещей, которые не до конца понял или и мне объясняли на конкретном примере. С оговорками, что в частности это так, но может быть при определённых условиях по другому.
    Согласен, с исходной задачей проблема, но на статью, в которой сам себе не буду задавать вопросов, а точно ли оно так, пока не потяну.
    Если сформулировать сумбурно и слегка на пальцах. В общем-то как и мне объясняли, человеку далекому от биологии.
    В лабораториях есть клетки, вот тут уже куча вопросов какие они соматические или нет, чьи и т.д. и т.п. Основное это то, что клетки чем-то интересуют ученых, например, это клетки опухоли, рака, язвы а может кровяные, а может, а может просто кукурузы. И второе свойство этих клеток они содержат ДНК. Далее ученые пытаются понять, чем их эти клетки интересуют, предположим expression (думаю на русском так же экспрессия). Бегло об экспрессии, это мера количества копирований не больших участков ДНК. Т.е. например, есть участок ДНК, некоторый ген, который в некоторых клетках производится десятками за какое-то время, а в некоторых производится тысячами. И вот, ученые пытаются связать, в каких клетках и как, производится эта экспрессия для регулирования биологических процессов. Это одна из задач которую выполняет RNA-seq. Химики обрабатывают клетки, отделяют ДНК и остальные продукты клетки от копированных кусочков – РНК. Далее, какой бы большой не была клетка, или как много бы их не было, скопированных кусочков очень мало, нет не мало, а именно очень очень мало. И чтобы их приумножить, для измерения делают процедуру называемую PCR. Потом на специальный слайд и в машинку, типа Illumina. Результатом является FASTA/FASTQ файл, который попадает к программисту.
    Далее действия описанные в первой статье, потом во второй.
    А теперь слегка анализа. Последний рисунок, с пиками на RNA-seq линии очень, как бы сказать классический (на нем все красиво видно). Мы наблюдаем пики на тех позициях, где расположены эксоны. И величина пика, в относительных величинах говорит об экспрессии. В более менее абсолютных величинах можно сказать, если добавить контроль, т.е. некоторое количество РНК, которое мы сами померяли и при добавлении знали их было 10, 20, или 100.
Нет не кручусь, но посмотрю более детально. Я пока не дорос до ученого, статьями бы обзавестись в научных журналах. Да и не лениться.
Хотя, поспешил, вроде и само понятие Клада есть. Так что может и не переводить или Клада написать.
Извиняюсь. Тут не в биологии дело. Я сам программист по образованию. Мне просто показалось, что в выпадающем списке именно «классы». Исправляю.

oxforddictionaries.com/definition/clade?q=clade
en.wikipedia.org/wiki/Clade

Хотя по систематике вроде подходит «Царства».
ru.wikipedia.org/wiki/Биологическая_систематика
Отлично, перекинул топики туда. Спасибо!
До редактировал вторую статью и опубликовал, мне просто кажется она мало имеет отношения к Биотехнологиям. Ближе к программированию, администрированию. И я не расскрываю вопросов, а что значат эти пики, это поидее к биологам. А как определить значимость этих пиков это к математикам. Мне не нравится что блог закрытый. И я не могу поделится линком с миром.
Да я прочитал. Понимаю просто добавить блог чтоб было, это не правильно. И похоже тема не особа популярна. Может если мне хватит терпения и сил написать те топики, которые я хочу, кто-то всетаки присоединится и будет пополнять. Ибо естественно мне самому для себя писать не особо интересно.
Я ни в коем случае не претендую, на «писать буду только я». Я хочу наполнить этот блог тем что знаю, тем что узнаю в процессе, и вопросами на которые не могу ответить. Дело в том, что эта тематика, это не то что — точно известно или «однозначный ответ на вопрос такой то». Я надеюсь, что к этому топику подтянутся, люди которые, могут заметить, как алгоритм использованный в bzip2 применить в поиске ридов в геноме. Не хочу повторяться, я это упомянул в первой своей обзорной статье. Но те кто это видят это и двигают. Я только начал свой путь пол года, это мало. Я могу только поделиться тем, что видел и читал. Могу поделится своими наработками. Не могу делится тем что не мое и не опубликовано. Мне лично, наверное как, человеку недавно этим занимающимся, очень обидно, что поиск в гугл «не работает» не находя никаких статей и тем по теме биоинформатика сейчас.

Могу продолжать вечно, все сайты с аннотациями геномов человека, мышки, дрожжей, разных растений и т.д. находятся не в россии. Я знаю людей, которые просто смотря на эти данные делали открытия, без экспирементов. А в россии это не доступно. Как в СССР не было гинетики, так с этим достоянием мы и остались.
Согласен, но в моем случае, я локально установил базу. А под API наверное подразумевается, возможность обращаться к родным ресурсам.

Information

Rating
Does not participate
Location
Kentucky, США
Date of birth
Registered
Activity