奖项:二等奖
作者:胡家志
无论是谁,第一次接触电脑的时候,心中一定有不小的震撼。方寸之间的视窗世界,可以完美呈现出一千多万种颜色(24真彩色显示屏);而文字、音乐、影像,这些在平常世界里借助不同外在物质载体存在的东西,在这里更加精彩纷呈,电脑看起来似乎是无所不能的。不过电脑回归到最基本的语言层次,是很简单的,只有“0”和“1”两个代码,纯粹一个非此即彼的二元世界。
和电脑一样,DNA也是由二元世界构成。构成DNA的主要组分是两对碱基,一对是腺嘌呤(A)和胸腺嘧啶(T),它们俩用两个氢键连接彼此;另外一对是鸟嘌呤(G)和胞嘧啶(C),这俩感情比较好,之间用三个氢键连接起来。不过,相比电脑的二元世界,DNA要更复杂一些,如果把电脑比作二元一次方程的话,那么DNA就是一个不折不扣二元二次方程。因为DNA是由两条链配对形成的,所以,同样是A=T,A在一条链和A在另外一条链上的意义却是不一样的。因此,电脑借助二元世界可以呈现一千多万种颜色,DNA便理所当然的可以编码千万亿种颜色,数不胜数,于是便造就了这个充满了各种美丽生物的世界。当然,DNA的本领远远不是编码颜色这么简单,容我慢慢讲述。
虽然DNA的全部家当只有四个碱基,但是别小看它们,如果把一个人细胞的DNA一个个碱基排列起来的话,能有2米多长,比一般的人还要高出一头;如果把一个人的所有细胞的DNA一个个碱基连起来的话,足够从地球到太阳往返旅行至少十次。幸好,它们生性并不那么蛮横耿直,只是柔软的躲在细胞核(或核区)里。一般情况下,DNA在细胞核(或者核区)里,每200对碱基跟组蛋白结合形成核小体,以一种乱麻状松散的染色质存在;到了细胞分裂期,DNA就会以多重螺旋的状态层层缠绕在一起,从而高度浓缩形成只有1.4微米的染色体。这个时候在普通的光学显微镜下观察,就能看见染色体呈哑铃状,好像DNA在锻炼身体一样。
当然,DNA不是在锻炼身体,它在传递遗传信息。它负责储存一个细胞从大小、形状到功能、定位等绝大多数的信息,然后把这些信息完整的传递给下一代。除了绝少数生命体之外,DNA对细胞来说,就好像是无价的传家宝一样。因为DNA分子的巨大,它实际蕴含的信息量非常巨大,但是其中只有极小一部分信息是有效的,以人为例,其中只有不到1%的信息是有效的。这包含有效信息的部分,一般被称为基因。因为DNA和基因的重要性,英国有个叫道金斯的生物学家,曾经为基因写了一本书,叫作《自私的基因》。在这本书里面,道金斯把基因描述成自私的独裁主义者,说生物的一切行为其实都是基因来驱动的,基因只有一个目的,生存并繁衍下去,所以就控制生物体不断的为自己的生存创造最好的条件。当然,事实上没有那么简单。
基因其实不是令人讨厌的独裁者,它只是一小段DNA,在DNA长长的双链上像糖葫芦一样一条线排列,彼此之间会保持一定的距离。在原核生物中,基因是连续不间断的,但是到了高等的真核细胞中,基因就是不连续的了,每个基因都是由很多个被内含子隔开的外显子组成,就像红白间隔的彩棒一样,只有红色的部分有用,而两种红色之间,又被白色所隔开。基因偶尔也喜欢热闹,有时候很多个功能相似或互补的基因会凑在一起,形成一个小群体来一起发挥功能,一个都不能少,缺了谁,其它的基因就罢工。
细胞为了只读取对自己有用的信息,派mRNA从基因上来兑取有效信息,而mRNA在正确读取信息之后,会在核糖体、tRNA等的协助之下,把这些信息加工成蛋白质。这形形色色的蛋白质就被分配到细胞的各个部位,有时候甚至被派出细胞执行各种功能,从而构成了我们多姿多彩的美好世界。
为了配合细胞的分裂,在高度浓缩成染色体之前,DNA需要把自己精确而完整的复制一次,从而让新生的两个细胞里面也具有完全相同的DNA。可以毫不夸张的说,DNA的复制是生命活动中最精确和最重要的。为了完成精确和完整的目的,DNA采取了半保留的复制方式。在复制开始之前,一些具有起始复制功能的蛋白会一个拉一个的结合到DNA的特定位点上,然后这些蛋白质赶走构成核小体的组蛋白,打开双链,利用一段只有大约20个碱基长度的RNA作为引子开始复制。DNA两条链的复制并不完全一样,一条链的复制比较顺利,像走在高速路上的汽车一样,可以一路走很远,而另一条链比较麻烦,走的是乡间小道,所以走一段路就得换车。换车复制的这个现象被日本一个叫冈崎的科学家发现,因而每次换车时合成的几百个碱基的片段,就被称为冈崎片段。
DNA的复制最困难的部位是在末尾,就是所谓的端粒。端粒就像DNA的帽子,保护DNA不被细胞内大量存在的DNA酶所降解。但是因为最末端复制缺少有效的模板,所以每复制一次,端粒就会缩短一些。端粒的长短与生物的寿命及癌症的发生之间有一定的关系,这就决定了端粒复制的重要性。为了防止端粒的无止尽缩短,端粒酶出现了,它专门拉长端粒酶,从而为DNA保留一顶实用的帽子。发现端粒酶的人,因为给人带来了长寿乃至不死的梦想,理所当然的获得了2009年诺贝尔奖。
尽管DNA很努力的维持每次复制的准确性,但是DNA聚合酶偶尔也会打个盹,大概每108到1010个碱基就会出现一次配对的错误。幸好DNA发展了另外一套保护体系,一旦出现问题,就有蛋白质冲出来喊停,然后一边让DNA聚合酶停车,一边叫修理工赶紧把错误纠正过来。修理工会根据具体情况具体分析,大多时候小补一下就可以了,严重的时候才会动手术,把DNA双链打断,重新组合安排。待到错误被修正,叫停的蛋白就会放行,让DNA聚合酶继续行驶下去。这套体系,被叫作检验点(checkpoint)。
当然,百密必有一疏,有些错误,最后还是顺利的逃过一劫。因为DNA上的绝大多数序列对细胞是没有重要作用的,所以如果错误发生在这些地方,对细胞的生长不会产生影响。有时候即便这些错误发生在有意义的地方,生产出来的蛋白质功能也不会发生大的改变。但是量变产生质变,如果错误积累的多了,就可能对细胞的生长产生重要的改变,要么这个细胞被淘汰了,要么就是这个细胞更加强壮了(这个就是所谓的进化),或者,这个细胞变邪恶了,可以不受限制的扩增,从而变成可怕的癌症或者其它疾病。
为了了解DNA的特点,科学家们发明了一系列新的技术,其中测序技术对了解DNA起到的作用是最大的,也是进步最快的。最初的测序是在一块长长的胶上进行的,只能完成几十到一两百的DNA片段的测定,而且还必须运用同位素。在测序技术发展到了可以自动化的时候,科学家们野心勃勃的完成了包括人类在内的几百种物种的基因组的测定。现在,测序技术已经发展到了第五代,测序的容量已经快到达了一次测定一个人的细胞的所有DNA序列的地步,不过成本还比较高。相信在不远的将来,就可以将一个人的基因组序列测定的费用控制到一千美元以内,这样每个人都可以测定自己的序列,从而达到预防重大疾病的目的。
但是,了解DNA序列还只是第一步。在复制、转录乃至细胞周期的每一步,都有众多的蛋白来协助和调控DNA的行为,这些蛋白质和DNA的相互作用,可能更加重要。另外,DNA的位置和结构,有时候也对细胞的生存状态产生重要的影响。而我们对这些方面的了解还很少,要想彻底了解DNA,要走的路还长着呢。