Как стать автором
Обновить

Комментарии 20

Интересно, хотя если очень хочется перевести «clade» можно использовать «эволюционная линия», к примеру. Не следует вводить людей в заблуждение, даже если они далеки от биологии
Извиняюсь. Тут не в биологии дело. Я сам программист по образованию. Мне просто показалось, что в выпадающем списке именно «классы». Исправляю.

oxforddictionaries.com/definition/clade?q=clade
en.wikipedia.org/wiki/Clade

Хотя по систематике вроде подходит «Царства».
ru.wikipedia.org/wiki/Биологическая_систематика
Хотя, поспешил, вроде и само понятие Клада есть. Так что может и не переводить или Клада написать.
Как то исходная задача непонятно поставлена, можно какую-то вводную прописать, что можно со всеми этими файлами делать и как применять? А то тема сама интересна, но ощущение, как будто заглянул в лабораторию на другом этаже к сумасшедшим ученым, которым до тебя дела нет.
    Согласен, с исходной задачей проблема, но на статью, в которой сам себе не буду задавать вопросов, а точно ли оно так, пока не потяну.
    Если сформулировать сумбурно и слегка на пальцах. В общем-то как и мне объясняли, человеку далекому от биологии.
    В лабораториях есть клетки, вот тут уже куча вопросов какие они соматические или нет, чьи и т.д. и т.п. Основное это то, что клетки чем-то интересуют ученых, например, это клетки опухоли, рака, язвы а может кровяные, а может, а может просто кукурузы. И второе свойство этих клеток они содержат ДНК. Далее ученые пытаются понять, чем их эти клетки интересуют, предположим expression (думаю на русском так же экспрессия). Бегло об экспрессии, это мера количества копирований не больших участков ДНК. Т.е. например, есть участок ДНК, некоторый ген, который в некоторых клетках производится десятками за какое-то время, а в некоторых производится тысячами. И вот, ученые пытаются связать, в каких клетках и как, производится эта экспрессия для регулирования биологических процессов. Это одна из задач которую выполняет RNA-seq. Химики обрабатывают клетки, отделяют ДНК и остальные продукты клетки от копированных кусочков – РНК. Далее, какой бы большой не была клетка, или как много бы их не было, скопированных кусочков очень мало, нет не мало, а именно очень очень мало. И чтобы их приумножить, для измерения делают процедуру называемую PCR. Потом на специальный слайд и в машинку, типа Illumina. Результатом является FASTA/FASTQ файл, который попадает к программисту.
    Далее действия описанные в первой статье, потом во второй.
    А теперь слегка анализа. Последний рисунок, с пиками на RNA-seq линии очень, как бы сказать классический (на нем все красиво видно). Мы наблюдаем пики на тех позициях, где расположены эксоны. И величина пика, в относительных величинах говорит об экспрессии. В более менее абсолютных величинах можно сказать, если добавить контроль, т.е. некоторое количество РНК, которое мы сами померяли и при добавлении знали их было 10, 20, или 100.
НЛО прилетело и опубликовало эту надпись здесь
Буду стараться. Я этими оборотами стараюсь скрыть или увильнуть от вещей, которые не до конца понял или и мне объясняли на конкретном примере. С оговорками, что в частности это так, но может быть при определённых условиях по другому.
НЛО прилетело и опубликовало эту надпись здесь
Я же не биолог. Ко мне подходит биолог и говорит я тут прогнал експерементов, вот те файлы сделайте bedgraph, а потом он сам сидит смотрит на эти пики в genome browser и делает выводы. Я конечно любознательный и задавал вопросы и что-то понял. Попробую в следующем посте объяснить.
НЛО прилетело и опубликовало эту надпись здесь
Рассмотрим пример. Есть злокачественные опухоли. Есть предположение, что нарушается механизм контроля экспрессии. Информация о том, что экспрессировать и в каких количествах тоже расположена на ДНК. Мы находим экспрессию генов в здоровом организме и сравниваем с экспрессией генов в больном, находим разницу. И те гены, которые over expressed в больном организме, находим в геном браузере, и смотрим точные участки по пикам, визуально.

При известной аннотации иногда можно увидеть, что за что отвечает и сделать выводы.
НЛО прилетело и опубликовало эту надпись здесь
Там огромный цикл, как это происходит. С ДНК копируются кусочки, и например скопированный кусочек в результате преобразований, превратился в белок, который занимается копированием. Чем больше таких кусочков, тем больше белков, тем больше копирований, тем больше экспрессия.
Это совсем простое объяснение и частное, меня за него любой учитель биологии убъет и размажет по стенке :)
НЛО прилетело и опубликовало эту надпись здесь
С ДНК техника работы другая, там надо придумать какой регион интересует, придумать антитело, с помощью которого этот регион отделить от клеточной массы. Оцифровать только этот регион, посмотреть, где он оказался на геноме, и высказать какую-то теорию. Например, белок “zinc finger” имеет определённый сайт связывания с ДНК (последовательность нуклеотидов на ДНК). Известно, что он является одним из transcription factors (фактором, влияющим на процесс транскрипции). Есть антитело к этому транскрипционному фактору, которое позволяет отделять, клеточный материал и кусочки с которым этот фактор связывается. Таки образом, после всех операций, мы получим риды которые на геноме находятся близко к этому сайту связывания. И на графе получим пик в том месте.
Наверное, это можно сравнить с grep через | в Linux, один фильтр, второй. Результат в сиквенатор, затем поиск в геноме, затем геном браузер.
раздел biostar на хабре?
НЛО прилетело и опубликовало эту надпись здесь
появилось свободное время, пора и мне написать на проф.тематику
Похоже из комментариев набралось на ещё одну статью, «Некоторые здачи биоинформатики и способы их решения».
НЛО прилетело и опубликовало эту надпись здесь
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории