当前位置:看中流奇闻 > 未解之谜 > 手机访问:m.zhongliu365.com
来源:www.zhongliu365.com时间:2012-09-07奇闻指数:编辑:admin手机版
从二进制到碱基对编码
DNA是生物数据库,它的主要功能就是存储包含各种指令的生物信息。DNA有G(鸟嘌呤)、T(胸腺嘧啶)、A(腺嘌呤)、C(胞嘧啶)四种碱基,共同构成了相互缠绕的双链阶梯状的螺旋结构。通过这四种碱基不同顺序的编码,存储了生物所有的遗传信息。
现代计算机技术奠基者之一冯·诺依曼曾在 1948 年提出“自动复制机器”的设想:一个能够自我繁殖的系统,不仅能够构建某个组成元素,结构和自己一致的下一代,也能够把对自身的描述传递给下一代,如此往复。后来随着生物遗传的奥妙被发现,人们意识到,DNA 双螺旋结构正是冯·诺依曼描述的自动复制机器。
DNA里的四种碱基,两两互补成对。一个最短的DNA分子也有 4000个碱基对,可能的排列方式就有44000种。碱基对排列顺序千变万化,从而能够存储大量的遗传信息。
向活体DNA里写入数据,有诸多困难,细胞会死亡、分裂、变异,数据内容就会发生改变。
在本文开头提到的那项实验中,科学家们没有采用活细胞的基因组,而是采用了人工合成的DNA片段。他们用很多短的DNA序列而非长DNA序列来编码数据,这类似于硬盘写入的原理,在硬盘中,数据是被写入称为扇区的小硬盘块,这样能够降低写入和读取数据的困难和成本。科学家们将这种片段用喷墨打印机嵌入到微阵列芯片表面。接着,他们把计划写入 DNA的书里包含的信息:图片、文字、程序转化为HTML格式的文件,并将这些文件编译为由 0和1组成的电脑能够读懂的2进制数据。然后,他们将2进制数据转为四种碱基,把0转为A或 C,把1转成G或者T,并建立DNA链来维系这些编码的顺序和位置。每一个DNA片段还包含一个数字“条码”,记录它在原始文件中的位置,每个片段被合成多个拷贝以便有助于校正错误。编码完成后,这些芯片会在4摄氏度下保持三个月。
测序就是读取数据的过程:启用DNA测序装置,将所有DNA片断中的编码按照标记顺序排列,再还原成 2 进制格式的数据。每个 DNA 片断的每一个拷贝被测序高达3000次以便校对。利用这种方式,他们将5.27兆数据中的错误降低到只有12个。这种尺寸微小的存储设备,存储密度远远高于DVD、硬盘等介质,效果也毫不逊色。
推荐文章:北纬30 中国未解之谜 海洋动物 广西柳州食人鱼
1、【活了256岁的人?】 李庆远 (1677-1933),寿享256年,是清末...
去看看>>长久以来,就有所谓的海眼传说,海眼顾名思义就是海的眼睛,...
去看看>>地球现已存在于苍茫国际46亿年之久,而人类在地球这片奥秘的...
去看看>>美国幽灵洞木乃伊 1940年,考古学家西德尼和乔治惠勒夫妇在美...
去看看>>比年来热播的影戏《神话》让秦始皇陵秘密带上了爱恨情仇。秦...
去看看>>世界十大未解之谜第一谜:鬼魂之谜 这世界上到底有没有鬼?自...
去看看>>大千世界无奇不有,世界上存在着许多科学无法解释的现象,我...
去看看>>赤潮之谜赤潮是河口、海洋或淡水水藻在水域中快速堆积,从而...
去看看>>