Шекспир в ДНК

Биотехнологи изобрели новый способ хранения данных Анонс: Ученые научились сохранять информацию на ДНК. В отдаленном будущем цифровые носители данных нам станут ни к чему: любая информация будет всегда при себе. Осталось только удешевить процесс производства искусственной ДНК

Шекспир в ДНК

Человечество не устает изобретать все новые и новые способы хранения информации. Когда-то ее высекали на камне и выдавливали на глиняных табличках, потом хранили исключительно на бумаге, затем - на магнитных лентах, позже - на жестких дисках, сейчас все чаще используют флэш-накопители и "облака" на удаленных серверах. В будущем, вероятно, носителями всей необходимой людям информации станут их собственные организмы. Так, по крайней мере, считает исследовательская группа Европейского института биоинформатики из Великобритании, которая совместно с Европейской лабораторией молекулярной биологии из Германии и американской компанией Agilent Technologies записала в искусственную ДНК 5,2 мегабита информации. Статья об эксперименте появилась в авторитетном журнале Nature.

Библиотека в молекуле

Для записи использовали сложную технологию троичного кодирования данных при помощи алгоритма Хаффмана. В отличие от традиционной двоичной системы, этот способ позволяет хранить информацию с большей плотностью, а также избежать многих ошибок при будущем извлечении ее. Ученым удалось в одной молекуле ДНК сохранить пять различных файлов. Это полное собрание сонетов Шекспира (формат ASCII), статья первооткрывателей структуры ДНК Джеймса Уотсона и Френсиса Крика "Молекулярная структура нуклеиновых кислот" (PDF), цветное фото здания EBI (JPEG), 26-секундный фрагмент речи Мартина Лютера Кинга "У меня есть мечта" (mp3) и файл с алгоритмом Хаффмана.

В качестве устройства для хранения информации использовались короткие одноцепочные ДНК, олигонуклеотиды. Очень важно, что на них удалось записать пять файлов совершенно разных форматов. Для их сохранения было использовано 153 335 синтезированных коротких цепочек ДНК по 117 нуклеотидов каждая. 1 нуклеотид способен хранить один бит информации.

Процесс записи происходил примерно так. Сначала двоичный код, при помощи которого хранится информация на всех современных компьютерах, был преобразован в троичный. Алгоритм Хаффмана позволяет хранить и обрабатывать последовательность из пяти троичных чисел, называемых тритами (0,1,2). Полученная последовательность тритов позже конвертировалась в код из трех нуклеотидов. Agilent Technologies впоследствии на специальном оборудовании синтезировала искусственную ДНК, которая и стала хранилищем пяти файлов.

На выходе получилась щепотка органики в герметично запаянной пробирке, которая представляет собой массив синтезированных ДНК. В Германии из этого массива извлекли записанную на него информацию, причем со стопроцентной точностью.

Полвека, а то и меньше

Справедливости ради стоит отметить, что никакой революции в этом нет. Эксперименты по записи информации в ДНК проводятся с конца 1980-х годов. А полгода назад группа ученых из Гарварда провела схожий эксперимент, в ходе которого им удалось записать в одну молекулу ДНК примерно тот же объем информации. Те же 5,2 мегабита информации включали в себя книгу, Java-код и изображения. Другое дело - повторные эксперименты демонстрируют, что в сущности ничего сложного в организации нового способа хранения данных - с технической точки зрения - нет. Ученые говорят, что в будущем этот способ записи и извлечения информации станет намного дешевле, а лет так через пятьдесят сможет конкурировать с привычными для нас электронными технологиями хранения данных.

ДНК-память в будущем может стать новым стандартом хранения и считывания данных. В сравнении с традиционными электронно-оптическими запоминающими устройствами эта технология имеет целый ряд преимуществ. Во-первых, таким способом достигается огромная плотность записи. Ученые говорят, что при "идеальных" условиях в одном грамме одноцепочной ДНК можно хранить 455 эксабайт данных. Во-вторых, такая память является энергонезависимой: для того, чтобы она сохранялась, не нужно питать ее электричеством. Наконец, в-третьих, ДНК деградирует куда медленнее традиционных флэш-накопителей (которым электричество тоже не нужно): в природной среде молекулы могут хранить данные десятки тысяч лет. А в искусственной консервации - и того дольше.

Учитывая, как быстро перспективные технологии становятся частью потребительского мира, можно предположить, что уже через десяток-другой лет при должном финансировании молекулы ДНК станут такой же привычной материей для хранения данных, как сегодняшние электронные накопители.

Статьи по теме:
Международный бизнес

Интернет больших вещей

Освоение IoT в промышленности позволит компаниям совершить рывок в производительности

Спецвыпуск

Бремя управлять деньгами

Замедление экономики разводит все дальше банки и реальный сектор

Бизнес и финансы

Номер с дворецким

Карта столичных гостиниц пополнилась новым объектом

Тема недели

От чуда на Хангане — к чуду на Ишиме

Как корейский опыт повышения производительности может пригодиться Казахстану?