Comments 71
Low-pass Whole Genome Sequencing (0.4x coverage)
Уровень покрытия генома 0.4x против 30x у Атласа. Это даже полным геномом назвать нельзя — так «похватали поверхам» кусочки из которых даже одну полную копию генома не собрать, не говоря уже о количестве ошибок которое будет в таких данных — без избыточности считывания их не исправить программно.
В общем ни о чем совершенно — сгодится только как аналог теста на микрочипах, которое тоже отдельные кусочки выхватывет. На чипах их правда намного меньше (обычно до 1 млн. позиций), но зато этот 1 млн. в «наиболее интересных» местах, а не случайно как тут и с меньшим количеством ошибок. У всех людей геном совпадает на 99.5% и содержит одну и туже информацию. Чипы собирают данные только в меняющихся участках составляющих доли %.
А вот на дантелабс за 300 евро (в данный момент 160 но это скидка на время) вроде идет полноценное сканирование с 30х покрытием. Но это без анализа считанных данных, только сырые данные — их анализ заказывается отдельно за отдельную плату. И полный пакет анализа целых 500 евро стоит. Единственно что хорошо — можно выбрать только интересующие наборы отдельно и по отдельности они недорогие.
Как мы писали в статье — наш тест самый дешевый на российском рынке. А разница цен с международными компаниями связана со стоимостью секвенирования на территории России. Мы не можем советовать, где лучше делать полногеномный анализ. Каждый покупатель решает этот вопрос сам. Кому-то подходят услуги, которые предлагают Dante, кому-то — нет.
Можете прокомментировать:
Как понимаю полный набор исходных сырых данных для одного полногемного теста с хорошим покрытием (>=30x) порядка 200 ГБ занимает?
Даже в несжатом виде это не такой уж запредельный объем, чтобы его нельзя было через интернет выкачать.
Тем более если использовать сжатие, FASTQ очень «расточительный» формат, в бинарном(а не текстовом) виде тоже самое можно раз 5 компактнее записать. Ну или простой архиватор тоже 3-4 кратное сжатие должен давать. Так что 200 ГБ превратятся в 50-70 ГБ.
Зачем же тогда жесткие диски?
Этот тест кардинально отличается в техническом плане и тут целый набор файлов со своими форматами и на порядки большего объема, включая полную копию генома и то как он «реконструировался». Не ясно отдают ли они его или тоже только результат анализа в виде тех же SNP после сравнения вашего ген. кода с «эталонным человеком».
В статье написано вот, что часть генетического кода из теломер невозможно прочитать, это уже значит, что точного клона не вырастить?
В несчитываемых тут участках по текущим научным представлениям ничего полезного нет, это «технические» участки хоромосом, нужные для обеспечения сохранности остального (значимого) генетического материала. Например теломеры постепенно «обрезаются» при каждом делении клетки и служат своего рода «защитными колпачками» — не дают отрезать участки с важным ген. кодом.
На практике — таких длинных и сложных цепочек нуклеотидов как человеческая ДНК сейчас синтезировать пока не умеют даже близко и не ясно когда это будет возможно. А то что умеют (ДНК уровня вирусов или максимум бактерий) стоит очень больших денег, на порядки дороже процесса считывания/оцифровки.
Вообще, чем больше изучаешь механизмы эволюции видов и внутреннюю организацию клеток, тем больше осознание, что будь это программа, качество которой нужно оценить, ничего кроме «г… код» в голову бы не пришло. Тут тебе и смешение зон ответственности, и смешение данных и кода, куча грязных хаков, неоправданных усложнений и заброшенных частей. Алгоритмы работают плохо. Ну вот что стоило сделать абсолютно надёжный механизм контроля целостности ДНК? Нет, ничего подобного, постоянно возникают ошибки, ведущие к гибели и страданиям несчастных особей. Потому что до самих особей эволюции нет ни малейшего дела — это расходный материал. Особенно, если особь вышла из репродуктивного возраста. Для эволюции главное — видовое приспособление.
Поэтому в т.ч. даже однояйцевые близнецы имеющие идентичный генетический код чуть-чуть отличаются друг от друга уже с момента рождения, не говоря уже о дальнейшем развитии и росте когда факторы внешней среды для них могут начать существенно отличаться.
Насколько знаю никто не доказал/не показал именно наследование эпигенетики за рамками воздействия среды в широком плане. В широком — это включая родителей как факторов этой среды (диета, привычки, образ и место жизни, гормональный фон и т.д.) влияющих на то как имеющий генетический код будет «исполняться» превращаясь в живой организм.
P.S.
Насчет «говнокода» полностью согласен. Чем больше изучаешь и понимаешь механизмы, тем больше именно такое впечатление. Причем это не только к генетике относится, но во многом к биологическому функционированию сложных организмов как человек в целом — системы обмена веществ, регуляции и обратных связей, систем иммунитета и прочих.
Почти везде костыли на костылях и костылями погоняют и общая картина и «вот со всем этим дерьмом мы сейчас попытаемся взлететь».
По сравнению с тем что «наваяла»нам природа в процессе эволюции пресловутый «индусский код» это просто образец аккуратности, строгости и логичности.
Тут хорошо описано: learn.genetics.utah.edu/content/epigenetics/inheritance
что стоило сделать абсолютно надёжный механизм контроля целостности ДНК?
Тогда не было бы случайных мутаций, и популяция "застыла" бы — изменчивость стала бы невозможной, происходил бы только обмен участками существующего кода, появление нового не происходило бы.
Да, эволюция — бессердечная су скотина, у неё нет других механизмов отбора, кроме как смерть плохо приспособленных.
Кстати, с развитием методов редактирования генома, человек выходит на скользкую тропинку борьбы с эволюцией, мутациями. К чему это приведёт, пока никто не знает, но явно очень сильно изменит человечество. Скорее всего, станет распространено планирование будущего ребёнка в аналоге магазина приложений или как создание героев в играх. Цвет глаз такой, рост такой, защита от таких-то болезней. Наиболее удачные конфигурации будут идти под лицензиями, но что-то будет и открытым. Фактически, клонирование на аналитическом уровне будет происходить. С существующими темпами лет через 15-30 вполне можно ожидать.
Да, действительно, но это ведь касается мутаций в половых клетках (гаметах) или при их формировании (мейоз).
Вы правы, но помните, что текущая система образовалась как результат случайного отбора, поэтому в ней грабли едут на велосипедах и костылями погоняют. "Это не есть хорошая работа. Если это лучшее, на что способен Бог, то я не впечатлён. Таким результатам не место в резюме наисовершеннейшего существа. Такой дряни можно ожидать от временного офисного работника с дурным характером." © Джордж Карлин Предложенный Вами вариант на порядки лучше — но образоваться в результате эволюции он не мог, потому что в нём сначала должна была возникнуть "система починки", а потом кто-то должен был вмешаться и сказать "пусть она будет работать везде, но не в этих клетках".
(Знаю, что повторяюсь, но поясню мою изначальную мысль: как правильно говорит Сьюзен Блекмор, "если имеют место изменчивость, отбор и наследование, то эволюция не может не возникнуть". Ваша оригинальная идея была — выбить отсюда первый столп: изменчивость.)
Если бы такой механизм был у простейших, то людей вообще бы сейчас не было, одни амебы.
Я заинтересован в услугах, подобных вашим. Однако приобретенная параноидальность заставляет меня спросить: как я могу быть уверен, что вы исследовали именно мой геном? Ну, допустим, какие-то ключевые точки генома относятся ко мне, но ведь остальные данные вполне могут быть случайными, не моими — вполне логично снижать производственные расходы таким образом. Проверить полученные данные, как обычный потребитель, я не могу. К тому же, вы в статье указываете на то, что между результатами разных лабораторий могут быть серьезные отличия ввиду использования разных чипов/реактивов/методов анализа. А ведь вопрос серьезный: выявление каких-либо генетически детерминированных особенностей может повлечь за собой недешевую смену образа жизни. Или, скажем, привести к формированию невроза, если в силу каких-то причин я не смогу поменять образ жизни. А если результаты анализа будут фальшивы, то последующие расходы бессмысленны.
Как мне понять, что полученные данные валидны? Какую ответственность вы, как юр. лицо, несёте за предоставляемую информацию?
2. По запросу пользователя мы выдаем FASTQ файлы — сырые данные с секвенатора. Вы можете сами провести весь необходимый анализ и сравнить полученные результаты с предоставляемыми нами.
3. Вы можете сдать несколько ДНК тестов (как на чипах, так и с использованием NGS) в разных компаниях/лабораториях и сравнить полученные сырые данные на конкордантность. В статье мы не рекомендовали сверять результаты после интерпретации.
4. За много лет работы в России, Европе и Канаде мы не сталкивались с претензиями пользователей по поводу рандомности полученных ими данных.
5. Да, как юридическое лицо мы несем ответственность за результаты, предоставляемых данных.
Самое надежное, хоть и не самое дешевое если есть сомнения: просто провести тест еще в одном месте у другой компании, только уже в режиме только сырых данных, без интерпретации и анализа (что намного дешевле). И просто сравнить, если обе компании проводили тест добросовестно исходные данные должны совпадать с очень высокой точностью.
Ценник действительно хороший, если это с учетом интепретации. Расскажите подробнее, на чем будете секвенировать, Illumina, Pacbio? Интерпретацию сами будете делать? Или пока не понимаете объемов работы? Будете ли продвигать свои данные в сторону медицинских или останетесь популяризаторами генетики?
Где будете хранить данные по полногеномному?
Интерпретация делается всегда нами и доступна в личном кабинете. Клиническая интерпретация от Лаборатории клинической биоинформатики, с которой работают многие генетики России, будет также доступна каждому пользователю гентеста. ДНК-микрочипы по-прежнему остаются в списке продуктов компании.
Секвенируем на BGI DNBSEQ-G400. Все данные российских пользователей хранятся в деперсонализированном виде на территории России, как того требует ФЗ №152 «О персональных данных».
У нас этот вопрос пока не столь под надзором, но скорее всего быстро придет к этому.
Вы хорошие ребята и вас любят, жалко будет, если вместо вас придет какой-нибудь «сберкоген».
В связи с этим и был вопрос. Двигаетесь ли вы в сторону сертификации исследований, как медицинского продукта. Я не в курсе, ЛКБ имеет медицинский сертификат на деятельность?
Что касается хранения — полный геном это реальная бигдата, к тому же наверняка, потребует медицинской сертификации в будущем, если будет являться частью медицинской услуги. В этом был вопрос.
Сама по себе сертификация как медицинского продукта в России не дает никакой гарантии того, что, например, результаты предсказания рисков являются правдивыми. Что действительно важно для интерпретации генетических данных по здоровью — валидировать алгоритмы расчета рисков. Атлас проводил это на 350 000 европейцах из датасета UK Biobank, для которых известны генотипы, образ жизни и диагнозы. Многие риски предсказываются достаточно точно для скринингового теста, хотя по некоторым заболеваниям мы увидели, что нужно улучшать модель предсказания риска. Этим команда Атласа и занимается в настоящий момент. Обновление для всех пользователей гентеста и будущих пользователей Полного генома выйдет в конце декабря или начале января.
Результаты Полного генома вряд ли можно считать поводом для паранойи, скорее это повод либо успокоиться, либо занять активную позицию по управлению рисками заболеваний, либо взвешено подойти к планированию семьи.
Вероятно закупили секвенатор из серии HiSeq 1500/2500
Длину одно рида можно посмотреть увеличив скриншоты из программы в статье выше — по 100 пар оснований.
Почему не точен? Ну вообще все существующие методы чтения генома не дают 100% точности и все включают нарезку ДНК на небольшие отрывки и последующую «сборку» из них исходной последовательности уже при цифровой обработке считанных данных.
Но при точности чтения «сырых» данных такими секвенаторами >99% и среднем покрытии генома ридами >30 раз ошибок в восстановленной последовательности должно быть очень мало — почти все ошибки исходного считывания будут исправлены при сравнении многократно прочитанных копий одного и того же участка уже в программной обработке на компьютере.
А теперь вопрос — насколько это предложение будет конкурентноспособно с аналогичным от https://www.fullgenomes.com/
Речь не только про интерпретацию (она не всем нужна и ее всегда можно дозаказать при наличии BAM), а ещё и секвенирование отдельно.
Конечно, круто, что в России есть лаборатория практически мирового уровня. Но экономическую подоплеку никто не отменял. И сделать цены доступными можно только при массовости продукта
По ссылке заявлена стоимость полногемного сканирования при глубине(качестве) прочтения 30х как у Атласа — 1150$ или 75.5 тыс. руб по текущему курсу. Как понимаю это без анализа вообще, только «сырые данные».
А такое же 30х сканирование с развернутым анализом данных — 1800$ (113 т.р.)
Ну а по меркам рынка РФ это вообще хорошо. Они и так подвинут местный рынок неплохо своим предложением. Около 2 лет назад таким вопросом интересовался и аналогичные услуги полногеномного сканирования + анализа у нас стоили начиная от 250-300к, на этом фоне выйти с предложением в 95к вполне адекватно.
Глядишь через пару лет и совсем доступные цены будут.
Сильно дешевым такие тесты все-равно пока не могут быть, массовость не особо поможет, т.к. есть большие расходы.
стоимость необходимого оборудования — порядка несколько сотен тыс. $ за комплект + расходники на каждый тест
длительность одного теста — несколько дней по времени
+ весьма ресурсоемкие обработка и хранение данных на мощных компах после считывания: на каждый проведенный тест получаем больше 100 ГБ сырых данных, которые нужно хранить и обсчитывать при анализе
+ работа нескольких задействованных в процессе человек разных профессий
СОгласен, от интерпретации никуда не деться, это сейчас самое главное «бутылочное горло»… и в будущем видимо это и будет основной составляющей цены.
Если заявлено полное сканирование всего генома, ну кроме небольших трудночитаемых участков типа упомянутых теломер и центромер, то это должно быть порядка 3 миллиардов пар оснований (bp). 3.3 млрд. всего в ДНК минус нечитаемые по данной технологии отрезки.
Что за 590 млн позиций тогда?
Прошу прощение, за нубство. 3.3 млрд — это с экзомом или без?
И 590 млн — я так понимаю — речь идёт о тех, для которых есть понимание за что они отвечают.
В процессе анализа Полного генома читается >95% ДНК (исключение — центромеры, теломеры и некоторые другие сложные участки ДНК с множеством повторов). В худшем случае — на минимально допустимом среднем покрытии в 30Х — мы дадим результат о ~590 млн вариаций.
Это в формате VCF. Также при первом запросе мы дадим данные и в самом сыром формате FASTQ — все прочтения напрямую с секвенатора, — и в формате SAM, где эти прочтения выровнены нами на GRCh38
Да, вспоминается история, что ДНК банана и человека на 99% совпадают )
А по запросу клиента даете загрузить исходные FASTQ и SAM?
В Геномед это стоит 99 тыс. руб. (без интерпретации данных):
price.genomed.ru/?testid=856
В Генетико — столько же, но с интерпретаций (только для клинических целей):
genetico.ru/prices?id=57
Атлас со стоимостью генома 94,5 тыс. руб. заметно вырвался в лидеры. Особенно если стоимость интерпретации и часовой консультации входят в эту сумму.
Что такое Полный геном и зачем он нужен