ДНК, алмазы или атомы с неспаренными электронами?
Фрагмент фейнмановской лекции «Там внизу много места». Блоки информации состоят из атомов хлора на медной пластинке. Принцип кодирования описан ниже. Изображение: TU Delft
Современные магнитные накопители обладают фундаментальным ограничением на предел плотности записи. Оно соответствует минимальному размеру магнитного домена. При этом ни магнитные, ни оптические накопители не способны сохранить информацию хотя бы несколько десятков лет, а это — секунды в человеческой истории. Это фундаментальная проблема, которая заставляет инженеров искать решение.
Поэтому сейчас человечество экспериментирует с несколькими новыми способами хранения информации — более надёжными, чем существующие. И с большей плотностью записи.
ДНК
Гены, подобно алмазам, вечны, но в несколько ином плане, чем алмазы. Отдельный кристалл алмаза постоянно сохраняет неизменную атомную структуру. Молекула ДНК не обладает таким постоянством. Жизнь каждой отдельной физической молекулы ДНК довольно коротка, составляя, возможно, несколько месяцев, и безусловно не больше, чем продолжительность жизни человека. Но молекула ДНК может теоретически продолжать существование в виде копий самой себя в течение 100 млн. лет. Кроме того, подобно древним репликаторам в первичном бульоне, копии какого-то одного гена могут распространиться по всему миру. Разница лишь в том, что все современные варианты аккуратно упакованы в тела машин выживания. Всем этим я хочу подчеркнуть потенциальное квази-бессмертие гена в форме копий как его определяющее свойство. — Ричард Докинз, «Эгоистичный ген»
Впервые идею о хранении цифровой информации в молекуле ДНК затронул в 1959 году американский физик Ричард Фейнман в своей лекции под названием «Внизу полным-полно места: приглашение в новый мир физики».
По самой своей природе молекула ДНК является идеальным носителем информации, максимально плотным и надёжным. Одна крошечная молекула хранит мегабайты информации для развития целого организма на десятилетия вперёд, экспрессии определённых белков в определённом возрасте и так далее. При этом сами гены существуют сотни миллионов лет в виде своих копий.
Плотность информации в ДНК поражает воображение. Журнал Nature оценивает, что все данные мира возможно записать в ДНК-хранилище весом до одного килограмма.
Неудивительно, что у учёных появилась идея записывать цифровую информацию непосредственно в ДНК. В минувшие годы неоднократно проводились успешные эксперименты с записью бинарных данных в пары оснований ДНК. В 2010 году биологи из Гонконга сумели внедрить в клетку бактерии E.coli синтетическую ДНК, а в 2012 году учёные из Гарварда записали 643 килобайта данных в ДНК, поставив новый рекорд по количеству записанной информации.
К настоящему моменту синтез молекул ДНК начинается в промышленном масштабе. В апреле 2019 года исследователи Microsoft продемонстрировали первую полностью автоматизированную систему хранения данных в искусственно созданной ДНК с возможностью считывания. То есть такое оборудование уже реально можно использовать в дата-центрах.
Первая в мире полностью автоматизированная система хранения данных в ДНК, источник
Для кодирования информации в ДНК используется четверичная система счисления, по количеству нуклеотидов (0 = A, 1 = T, 2 = C, 3 = G). После программного перекодирования двоичных данных система использует стандартное оборудование для подачи необходимых жидкостей и реагентов в синтезатор, который собирает изготовленные фрагменты ДНК и помещает их в ёмкость для хранения. Когда необходимо извлечь информацию, в систему добавляются другие химические вещества для правильной подготовки ДНК и через микрофлюидные насосы жидкости проталкиваются в те части системы, которые считывают последовательности молекул ДНК и преобразуют их обратно в двоичный код. Система работает полностью автоматически. Нет никаких учёных в белых халатах, никакой лаборатории и тому подобных аксессуаров из экспериментов прошлого.
По словам исследователей из Microsoft, автоматизация — ключевая часть головоломки, чтобы организовать хранение данных в коммерческом масштабе и сделать его дешевле. Сейчас учёные дорабатывают отдельные модули этой автоматической системы, интегрируют в неё опенсорсное программное обеспечение и оборудование типа Puddle и PurpleDrop, чтобы запись информации в ДНК стала реально общедоступным стандартом.
Ещё предстоит решить главную проблему — низкую скорость записи информации (то есть синтеза ДНК).
Кроме синтеза искусственных ДНК, есть вариант записи цифровых данных в естественные ДНК. В каком-то смысле это даже более простой процесс, потому что недостатка в накопителях нет, их полно вокруг. Например, запись производят с помощью фермента пирококка (Pyrococcus furiosus) PfAgo, который механически разрывает цепочки ДНК в специфических местах. В данном случае единица — наличие разрыва, а ноль — его отсутствие в возможном месте разрыва. Подробнее см. статью "DNA punch cards for storing data on native DNA sequences via enzymatic nicking" в журнале Nature Communications (8 апреля 2020 года).
Атомы
Одна из альтернатив ДНК по плотности и долговечности хранения информации — наноструктуры.
Например, в 2016 году инженеры из Университета Дельфта создали пластинку из меди, на поверхности которой выстроена решётка атомов хлора. Меняя расположение «дырок» в решётке, авторы кодируют биты.
Метод кодирования информации
На одном квадратном сантиметре поверхности подобного материала помещается до 10 терабайт.
Фрагмент фейнмановской лекции «Там внизу много места», записанный на атомном уровне. Изображение: TU Delft
В 2017 году международная группа физиков добилась стабильной записи и хранения информации на протяжении нескольких часов в одиночных атомах гольмия. В данном случае носителем информации являются неспаренные электроны гольмия, то есть это тоже в каком-то смысле разновидность магнитной памяти.
Так или иначе, но информационная плотность 1 бит = 1 атом позволяет хранить на квадратном сантиметре материала порядка 10 петабайт данных (в случае монокристалла железа). Разумеется, объём информации зависит от того, какой конкретно материал используется и сколько у него атомов на сантиметр.
Алмазы
Один из экзотических накопителей информации — алмаз. Например, в 2016 году физики из Городского колледжа Нью-Йорка предложили в качестве бита памяти использовать дефект в трёхмерной решётке алмаза, так называемый NV-центр. Учёные продемонстрировали способ записи, многократной перезаписи и считывания информации, которая надёжно хранится в алмазе сколько угодно долгое время (но только в полной темноте).
Подробнее см. работу "Long-term data storage in diamond" в журнале Science Advances за 26 октября 2016 года.
Голографическая память (награждается посмертно)
Объёмная оптическая память и голографическая память — другие потенциальные технологии повышенной ёмкости данных. Хотя по сути они мало отличаются от многослойных дисков DVD: принцип записи примерно такой же.
В объёмной оптической памяти чтение и запись файлов достигается фокусировкой лазера в объёме носителя (например, того же алмаза, как в примере выше). В голографической памяти данные передаются не побитово, а целыми блоками до гигабайта. В существующих экспериментах носителем выступает ниобат лития (LiNbO3), теоретическая плотность данных составляет 1 TБ на кубический сантиметр, практически ожидаемая плотность — 10 ГБ/см³.
Перспективы голографической памяти были поставлены под сомнение в 2010 году, когда пионер в этой области InPhase Technologies объявил о банкротстве после девяти лет работы и $100 млн полученных инвестиций. Первый продукт компания выпустила в 2007 году: 300-гигабайтные голографические диски Tapestry HDS-300R по цене $135 выглядели отлично, но привод для их записи продавался за… $15 000. Всё кончилось банкротством.
Диск и привод Tapestry HDS-300R
С тех пор термин «голографическая память» в индустрии стал не совсем приличным, примерно как «нейронные сети» в конце 90-х. Немногочисленные исследователи нейросетей старались использовать другие термины, чтобы не раздражать коллег. Технология сильно дискредитировала себя за десятилетия бесплодных исследований с 1950-х.
Неизвестно, какие накопители будет использовать человечество в будущем. Шансы остаются в том числе у магнитных. Там можно кардинально повысить плотность информации, если оперировать не двумя магнитными состояниями (заряд есть/нет), а бóльшим количеством состояний. Например, шестью состояниями, в каждом из которых намагниченность отдельных фрагментов ячейки сонаправлена с намагниченностью одного из трёх вытянутых эллипсов, см. "Towards a six-state magnetic memory element", Appl. Phys. Lett. 108, 182401 (2016).
Есть и другие интересные идеи. Например, информацию можно хранить в нейросетях по аналогии с долговременной памятью в мозге. Или использовать копии настоящего мозга, как в фантастическом рассказе «Лена». Такие копии пригодны не только для хранения информации, но и для выполнения умственной работы.
Правда, последние исследования показали, что в человеческом мозге информация хранится с сильной контекстной компрессией. В результате даже самые яркие воспоминания неизбежно изменяются со временем. Это хорошо для психики, но плохо подходит для долговременного хранения цифровых данных.
Маклауд предоставляет облачные серверы с быстрым и надёжным дисковым хранилищем на основе дисков NVMe. Зарегистрируйтесь по вышеуказанной ссылке и получите 10% скидку на первый месяц аренды сервера любой конфигурации!