生物遗传密码——基因组
基因组[*译者注:也称为遗传密码或DNA,基因组是指生物体所有遗传物质的总和。这些遗传物质包括DNA、RNA(病毒RNA)、编码DNA和非编码DNA、线粒体DNA和叶绿体DNA。研究基因组的科学称为基因组学]的基本单位是基因。这些基因由四种核苷酸(A、C、G、T)构成,它们可以被转录(想象一下大声读出一段文字)为RNA(A、C、G、U)。DNA代代传递,是主要的遗传分子。当它活跃时,就会被转录成RNA,作为“信使”分子来执行DNA的功能。RNA可以作为蓝图被翻译(就像将语言转化为行动)以创造蛋白质(编码RNA),而其他RNA本身已经是活跃的分子(非编码RNA,ncRNA),可以调整细胞内的其他过程。
这些蛋白质和ncRNA为细胞如何生长、适应和向身体其他部分发出信号搭设框架。它们构成了遗传密码的活性成分,使指甲生长,补充流失的血细胞,消化食物,在性高潮期间让人兴奋,引导睡眠,使人体茁壮成长。一个生物体的所有遗传代码的集合被称为基因组,如果从各种生物体的角度来统一考虑,其可以被称为元基因组。
虽然人类的基因组看起来十分庞大,约为3.1千兆碱基(31亿个碱基),但它实际上不是最大的基因组。大多数植物的基因组比人类的大得多(10千兆~30千兆碱基),已知最大的基因组存在于眼虫属内,足足有120千兆碱基[*译者注:Base Pair,碱基对,其是形成核酸DNA、RNA单体及编码遗传信息的化学结构。组成碱基对的碱基包括腺嘌呤、胸腺嘧啶、鸟嘌呤、胞嘧啶、尿嘧啶]。人类基因组最引人注目的并非它的规模,而是相对于基因组非编码区域(非编码RNA和基因之间的其他区域)的编码RNA的数量。阿里·梅尔尼克(Ari Melnick)、马诺利斯·凯利斯(Manolis Kellis)、马克·格斯坦(Mark Gerstein)、约翰·马蒂克(John Mattick)、克里斯蒂娜·莱斯利(Christina Leslie)和编码联盟等的研究表明,许多ncRNA定义了非常具体的细胞类型。事实上,这可能是人类基因组的一个方面,而这个部分实际上代表其相对于其他物种的特征,只有约2%的基因组为蛋白质编码。相比之下,细菌有99%的基因组为蛋白质产物,酵母有80%的基因组为蛋白质产物,而大多数生物的蛋白质产物比例为20%~30%。但是,其中究竟有多少个基因,我们能预测它们都在做什么吗?