Комментарии 21
А откуда вообще взялась идея хранить информацию на носителе, который как раз и знаменит тем, что записанная на нем информация меняется от малейшего чиха?
Где это она меняется от малейшего чиха? При хранении не меняется вообще, в отличие от магнитных или твердотельных носителей.
Где это она меняется от малейшего чиха?
В живых организмах. Словил случайно пролетающий мимо нейтрон, полежал на солнышке, подышал воздухом рядом с заводом - где-то повредилась ДНК. Ничего не делал - все равно молекулы ДНК в клетках постоянно повреждаются сами по себе.
Клетка не заточена под супернадежность. В принципе, если синженерить клетки заточенные под ввод-вывод данных, то многие проблемы описанные в статье решаются. Останется только необходимость кормить этот накопитель.
Не храните НК на солнышке рядом с заводом. Храните их в холодильнике в герметичной таре. И ничего с ними не случится. Сами по себе молекулы ДНК не повреждаются - их повреждают внешние факторы - вирусы, мутагены и т.д. Ничего этого в хранилище ex vivo не будет. А случайный нейтрон даже если одну из миллиона макромолекул НК повредит, амплификация всё равно всех рассудит, т.к. это лавинный процесс.
Энергитический барьер для формирования тимин-тиминового дуплекса большой, о всё равно на 4 порядка ниже, чем в самом маленьком транзисторе.
Следовательно "удачно" пролетающий нейтрон легко может сформировать такой дуплекс. Или тепловое движение молекулы может нечаяно дать достаточно энергии. А значит, молекула (любая молекула, не только ДНК) повреждается сама. Со временем. Статистически.
В клетке надёжность системы хранения генетической информации обеспечивается не столько устойчивостью самой молекулы, сколько эффективностью системы репарации - специальной клеточной системы. состоящей из сотни белков, способных узнать повреждение, доступиться до повреждённого участка, собрать там систему исправления, и исправить, чтасто используя специальные "тэги" на ДНК - метилирование.
И, как вы уже написали, "ничего этого в хранилище ex vivo не будет".
Что говорит, что придётся использовать оверсэмплинг.
Вы думаете на ленте, на жестких дисках и в твердотельной NAND/NOR флеш нет этой же самой проблемы ? Методы избыточного кодирования (коды Рида-Соломона, Хэмминга) легко решают её уже на протяжении 60 лет.
Если мы согласны читать/писать медленно, то блины жестких дисков уже сейчас могут уменьшить занимаемый обьем на порядок. Ленты, похоже, то же. 0.2 мКм магнитный слой, 6 мКм основа.
А как с размагничиванием, оно не усугубляется при такой плотности записи?
Ну там есть всякие технологии прогрева доменов перед намагничиванием - лазер, микроволны.
Я имею ввиду при хранении.
Мне казалось, этой проблемы нет уже очень давно...
учитавая что "ДНК человека и капусты одинаковы на 50%, а человека и банана — почти на 60%" - то довольно неплохо сохраняется на протяжении длительных сроков (когда там у человека с бананом дорожки разошлись ?)
Если не разбираться в проблеме, то статья выглядит вполне достойно. Если разбираться, то косяков слишком много. Первый раз вижу, чтобы информацию предлагали хранить на РНК. Она слишком нестабильна. Да и синтезировать ДНК намного проще. Так же, как и секвенировать. Скорость нанопорового секвенирования сейчас составляет не 10, а 400...450 нуклеотидов в секунду. MinION - это не метод секвенирования, а первый нанопоровый секвенатор, разработанный компанией Oxford Nanopore Technologies. В общем, учите матчасть:
Чемерис Алексей Викторович. Небиологическое применение ДНК (youtube.com)
London Calling 2024 update from Clive Brown (youtube.com)
https://habr.com/ru/articles/455156/
А что вы понимаете под нестабильностью РНК в контексте её хранения ex vivo, в холодильнике и в герметичной таре (можно даже в защитной атмосфере, она копейки стоит)? Она самопроизвольно разлагается? Каков механизм её разложения? А ещё можете, хотя бы в общих чертах, описать сложность химического синтеза РНК в сравнении с ДНК? На какой стадии цикла синтеза они возникают и в чем выражаются? Но мне-то без разницы, можно и на ДНК хранить, я для самых невнимателньных это прям словами написал.
По скорости нанопорового секвенирования я могу и ошибаться, секвенированием я никогда не занимался. Но 400-450 - это скорость чтения одной НК, какие временные пропуски будут между цепями при чтении смеси олигоНК, и насколько это понизит скорость чтения?
В теме не разбираюсь совсем. Спасибо за лекбез. Запомнил, что один нуклеотид это два бита с возможностью расширения до ~4.4 бита. Большего мне пока не требуется.
Хранение данных на ДНК/РНК: возможности и перспективы