了不起的基因
上QQ阅读APP看书,第一时间看更新

Chapter 1
基因,这么讲我就懂了

提到基因,我们自然会想到核酸、DNA等概念,其实这三者的物质基础十分相近,就像水、水蒸气和冰的关系,它们本质上都是由同样的要素构成,只是在不同学科或领域的叫法不同。

什么是基因?

DNA属于核酸的一种,核酸可以分为脱氧核糖核酸和核糖核酸。DNA是脱氧核糖核酸(Deoxyribonucleic Acid)的英文缩写,携带着遗传信息。而RNA是核糖核酸(Ribonucleic Acid)的英文缩写,在体内主要引导蛋白质的合成。A、T、C、G四种碱基构成DNA螺旋结构,符合右手螺旋法则。这种螺旋结构在我们生活中也十分常见,比如旋转楼梯。这样的结构保证了能量最低、长久且持续的稳定性。而RNA则是单链结构,缺乏稳定性,例如RNA病毒,相对更容易发生变异。

我们每个人的基因组大小约3Gb,即意味着由30亿个碱基对构成,用扑克牌来比喻比较好理解。A、T、C、G四种碱基对应扑克牌的四种花色,且A只能匹配T,C只能匹配G,这四种花色两两配对形成30亿个碱基对,这30亿对碱基在我们的生殖细胞(精子或卵子)里被分成了23摞,每一摞就相当于一条染色体,这些染色体就是遗传信息的载体。正常人体细胞的染色体共有23对,46条,一半来自父亲,一半来自母亲;其中有22对常染色体,1对性染色体,性染色体是XY即为男性,XX即为女性。

人类染色体核型分析

人类的遗传物质从染色体层面上讲,可以叫作染色体组,“组”的意思就是所有染色体在一起。但如今的研究能力使得科学家们更多地从基因层面上进行分析,称其为“基因组”,即把所有的基因一起研究,因而这个研究的分辨率和精细度就大大提升了。这些染色体、基因都是由DNA构成的,基因就代表其中一段有意义的序列,此外还有一些调控序列,调控序列是控制基因表达的DNA片段。

结构决定功能。碱基配对、DNA双螺旋结构这些精妙的结构都来自亿万年的生命演化。而碱基在关键位置细微的不同就会出现基因突变,进而导致表现出的性状发生变化。每个人在出生时,就好比是抓了一手扑克牌,但请注意我们要按照生命的规则出牌,并不是随便怎么出都是有意义的,比如“10、J、Q、K、A”这是一连串的顺子,都出完就打赢了。但是如果发生了基因突变,手里的牌变成了“9、10、Q、K、A”,这就不是顺子了,很可能就会造成出生缺陷、恶性肿瘤,或者罹患各种传染疾病、感染疾病。

因此,整体来讲,基因即“基本的因素”,构成了我们生命活动最基本的语言,代表了我们生命密码的物质基础,携带着我们生命世世代代得以保留的信息。

一个人大约有40万亿~60万亿个细胞,除生殖细胞外,每个细胞携带的基因组都是相同的。那么问题来了,既然同一个人的每个细胞中都有遗传物质,为什么有些组成手、有些组成腿、有些组成内脏了?

这是因为,即使每个细胞携带所有相同的遗传信息,单个细胞在同一时空内也只会表达其中一部分基因。DNA提供的是一种可能性——在转化成RNA、蛋白质、代谢物的过程中差异很大——在转化过程中,逐步分化出不同的细胞,进而构建成不同的组织、器官、系统和人体,这就是从一个受精卵变成一个婴儿(大约万亿个细胞)的过程。此外,想想同卵双胞胎,他们的基因是几乎一致的,但随着年龄的增长,差异会越来越大。所以不能说,有好基因就一定能表达出好基因的性状,每个人都是基因和环境相互作用所决定的。

基因的发现

我们常说“21世纪是生命科学的世纪”,而最近20年生命科学的快速发展也需要我们回望这一路走来的艰辛——和所有的科学发现一样,基因的发现是一个漫长而曲折的过程。

首先我们要知道,当今人类已知的真理是“有限真理”或“有效真理”——科学的不断进步与发现随时可能颠覆我们的认知。正如1953年詹姆斯·杜威·沃森(James Dewey Watson)和弗朗西斯·哈利·康普顿·克里克(Francis Harry Compton Crick)发表DNA分子结构之前,再聪明的人也不知道DNA结构是什么,只有在文章发表之后,人们才逐渐了解DNA双螺旋结构,生命科学研究才进入到分子层面。

科学史上有太多这样的故事,因为一年的时间或一个人的发现,就解决了一个大问题,并将人类认知向前推进了一大步。

我们可以从两本著作说起,一本是1543年出版的《人体结构》,一本是1859年出版的《物种起源》。

让我们将目光放到欧洲。罗马时期的名医克劳迪亚斯·盖伦(Claudius Galenus)从动物和植物入手解剖,极大推动了解剖学的发展。那时,人体解剖被列为禁忌,整整封印了1200多年。而在黑死病之后,严苛的教条瓦解,文艺复兴让艺术与科学氛围更加宽容。1543年,比利时医生安德烈·维萨里(Andreas Vesalius)出版了《人体结构》这一巨作,纠正了盖伦时期的很多偏差,建立了近代人体解剖学理论。

1543年是奇迹的一年。那一年,哥白尼发表了“日心说”;那一年,德川家康出生,后来他统一了日本;那一年,西班牙探险家以西班牙亲王菲利普的名字给菲律宾命名;那一年,是中国明朝嘉靖二十二年……一年之间发生了很多事情,而在生命科学领域,《人体结构》让人类开始从生物角度更加了解自己。

随后,血液循环学说的提出、显微镜的发明、显微图谱的绘制、细胞学说的创立等都在为遗传物质的发现积蓄力量。直到1859年,达尔文发表《物种起源》,提出人类起源于古猿的可能,把“神创论”放到了尴尬的位置,才将生命起源推回到科学的正轨中去。达尔文从现象规律给出的生命起源的更合理推测,核心上是在哲学观角度否定了“神创”,这也正是达尔文的伟大之处。

1865年,格雷戈尔·约翰·孟德尔(Gregor Johann Mendel)通过豌豆实验建立了遗传法则。我认为孟德尔是十分幸运的,因为假如选择其他物种来做实验,其结果可能会截然不同。他的文章在最初发表时并未引起大的反响,1900年前后,有科学家重新做了类似实验,并引用了孟德尔的文章,生物学界由此才发现了豌豆实验的重要价值。

在这期间,年轻的瑞士医生弗雷德里希·米歇尔(Friedrich Miescher)发现了核酸是遗传信息的载体。大约1868年至1873年间,米歇尔生活的地区时常发生战乱,他得以从收集的绷带上观察白细胞。他发现,这些细胞的细胞核内有一种酸性物质,他称之为“核素”(nuclein,现称核酸),这种物质在细胞中广泛存在,细胞分裂前它的含量会显著增加。这里要说明,血细胞中成熟的红细胞没有细胞核和线粒体,所以也就没有DNA。然而,经过一番研究后,米歇尔认为不同生物的核素化学性质十分接近,这显然无法解释生物的多样性,或许核素并不是遗传物质。因此当时主流观点仍坚持认为生命的基本物质是蛋白质,遗传物质可能存在于蛋白质中。

大约1909年,丹麦遗传学家威廉·约翰森(Wilhelm Johannsen)赐予了遗传物质“gene”这样一个绝世好名字,并由中国遗传学先驱潘光旦、谈家桢、卢惠霖等将其汉语译名推广为“基因”。在考证“基因”一词的由来时,我们有一个有趣的发现:大量的史料证明,gene一词中译成“基因”大体是1930年由潘光旦首创;但gene一词作为遗传学词语引入中文,应是在更早的1923年。彼时,冯肇传将之译为“因子”,陈桢将之译为“因基”。20世纪30年代,gene在很多书中被翻译成了“因基”,解释为“物质的基本因子”,即便多次改版、再印,使用的都是“因基”这一中译词。有据可考的是,1936年,谈家桢先生首次谈及于此,他在《国立武汉大学理科季刊》刊发的《遗传“因基”学说之发展》一文,用的就是“因基”一词。但20世纪50年代之后,风向似乎发生了转变。不难看到,在那时的生物学相关教科书中,都普遍开始使用“基因”一词了,如谈家桢先生于1955年出版的首部著作《生物学引论》,用的就是“基因”这个词。因而,我们推测gene的中译词出现了演变,并排除“因基”是印刷错误的可能。毕竟,“基因”这一中译,无论是在音译还是意译方面,都更为契合,因而得以逐渐取代“因基”,成为主流的中译词。至于我们对gene的解构剖析,究竟是因基——“因子的物质基本”,还是基因——“基本的因子”,的确是一个很有意思的话题,值得我们进一步理解与思考。

1910年,美国生物学家托马斯·亨特·摩尔根(Thomas Hunt Morgan)及其夫人通过果蝇实验创立了染色体遗传理论,发现了染色体遗传机制。如果说孟德尔通过植物实验建立了宏观遗传法则,那么摩尔根则更多地侧重于动物实验,并由此推动了细胞遗传学发展。在这里不得不说,很多生物为人类遗传学研究作出过重要贡献,包括但不限于拟南芥、水稻、线虫、果蝇、斑马鱼、小鼠、大鼠、家兔、恒河猴、食蟹猴、黑猩猩等。这里值得一提的是,在1931年德国科学家恩斯特·鲁斯卡(Ernst Ruska)发明电子显微镜之前,因为可见光衍射极限的原因,人们只能看到细胞、细菌、细胞器或染色体,而更小的病毒、蛋白质、基因在当时还无法通过光学显微镜看到,人们只能通过观察细胞和染色体去进一步研究遗传学。基因到底是什么?人们仍旧为之着迷。

直到1944年,奥斯瓦德·西奥多·艾弗里(Oswald Theodore Avery)进行的肺炎双球菌体外转化实验,使“DNA是遗传物质”这一事实无可辩驳。他的发现开启了分子遗传学的大门。但是对于DNA的结构,人们还不甚了解。

到了1953年,沃森和克里克先于当时的权威莱纳斯·鲍林(Linus Pauling),确认了DNA的正确结构——双螺旋而非三螺旋,使遗传学的研究深入到分子层次,分子生物学时代由此正式开启。其中作出重要贡献的其实还有英国女科学家罗莎琳德·富兰克林(Rosalind Franklin)。

富兰克林在伦敦国王学院就职时,将X射线技术应用于DNA的结构研究,成功拍摄了DNA晶体的X射线衍射照片,而这张照片正是后来沃森和克里克得以发现DNA结构的关键所在。作为合作伙伴的莫里斯·威尔金斯(Maurice Wilkins)在富兰克林不知情的情况下,将这张照片展示给在剑桥大学做DNA结构研究的沃森和克里克,他们很快领悟到——DNA结构是两条以磷酸为骨架的链相互缠绕形成的双螺旋结构,由氢键将之连在一起。这一发现发表于1953年的《自然》(Nature)杂志上,他们与威尔金斯也因此获得了1962年的诺贝尔生理学或医学奖。在此过程中,富兰克林并未追究自己的照片被“盗用”,反而为这一发现而高兴,并在《自然》杂志上发表了一篇证明DNA双螺旋结构的论文。不幸的是,1958年,富兰克林因卵巢癌过早离世,未等到颁发诺奖的那天。不得不说,遗憾虽永远无法弥补,但这位了不起的女性科学家那纯粹的科研精神却让人感动。同时,女性科学家在研究道路上所受到的困难与阻碍,也实在是值得人们反省、沉思。

另外值得一提的是,1955年,华裔科学家蒋有兴不畏权威,将人类染色体数目由48条更正为46条,从而结束了持续32年的错误理论。在蒋有兴提出23对(46条)染色体时,“人类有48条染色体”的共识已经存在长达数十年之久。他的发现最初并不被科学界所认可,直到十几年后欧洲科学家受蒋有兴启发数出了46条染色体后才慢慢被大家接受。在此,我们要反思的,一是在科研中华裔科学家要进一步争取平等和尊重;二是科学必须可被证伪,要允许有人挑战权威,唯有如此科学才能不断进步。

基因后来的故事已被大家所熟知:1958年,克里克提出的“中心法则”(Central dogma),为遗传密码解读作出重要贡献。“中心法则”是指遗传信息从DNA传递给RNA,再从RNA传递给蛋白质,即完成遗传信息的转录和翻译过程;也可以从DNA传递给DNA,即完成DNA的复制过程。我们可以简单地描述遗传信息的传递流程:DNA造出了RNA,RNA制造了蛋白质,而蛋白质会配合前两者的传递,并协助DNA进行复制。时至今日,随着越来越多包括“朊病毒”之类的“例外”的挑战,使得该法则时不时就要补充阐述,但其依然是生物学本不多的基本法则之一。

至此,人们已经基本了解了遗传物质的结构与机制,后来的基因测序、基因编辑、基因合成等技术都得力于这漫长而曲折的基因发现历程。站在巨人的肩膀上,我们迎来了21世纪——生命科学的世纪,这一段故事我们将在基因技术部分来进行讲述。