上QQ阅读APP看书,第一时间看更新
第四节 个体基因组间的变异
从DNA序列来说,人类不同个体间是高度相似的(99.9%相同),但是DNA突变不断地将新的遗传变异引入基因库中,增加了人类遗传的多样性。对全人类来说,存在数以百万计的各种遗传变异。从进化角度来看,一些新生突变因其具有危害性而被淘汰,而很多突变在自然选择中是中性的,还有少量的突变甚至是有益的。因此通过世代更替,不同突变形成的遗传变异体在基因库中的频率会有不同。其中频率较高的常见变异体(>1%)又被称为遗传多态性,是人类遗传多样性的主要构成部分。大部分的遗传多态性位于基因之间或者基因的非编码区中,影响基因转录或RNA的稳定性和加工翻译。遗传多态性也可位于基因的编码区,从而产生不同的蛋白变异体。遗传多态性是研究人类和医学遗传学的重要部分,是实践精准医学的基础。人类基因组中最常见的遗传多态性是单核苷酸多态性、插入缺失多态性和拷贝数多态性。另外,在正常人群中还存在染色体多态性(见第四章)。
一、单核苷酸多态性
单核苷酸多态性是指在基因组水平上由单个核苷酸的变异引起的DNA序列多态性(图3-3)。在一个基因库中,基因组的某一特定位置上一般只存在两种不同的碱基,因此SNP通常具有二等位性(bi-allelic)。SNP是人类遗传多态性中最常见的一种,占所有已知多态性的90%以上。SNP在人类基因组中广泛分布,平均约每1kb中就有1个。大部分SNP位于基因组的非编码区、内含子区、基因的周边或者两个基因的中间区域,也有部分SNP位于基因编码区。
图3-3 单核苷酸多态性(SNP)
尽管SNP的存在非常普遍,但并不意味着其对人类的健康或寿命有显著影响。绝大多数的SNP的功能仍未可知,这也是遗传学研究的目标之一。目前认为,SNP可能更多地参与了疾病易感性的精细调节,而不是直接致病。
二、插入缺失多态性
第二大类的遗传多态性是由DNA片段插入或缺失引起的,其范围一般从1bp~1kb不等,大于1kb的插入缺失多态性亦有报道。每个个体的基因组内几乎都分布着成百上千的插入缺失多态性,估计其总数超过100万个。人类基因组中常见的插入缺失多态性如下。
1.微卫星多态性
微卫星(microsatellite)又称为短串联重复序列(STR)或简单重复序列(SSR),以2~6个核苷酸为单位进行串联重复排列所构成,如TGTGTG,CAACAACAA和AAATAAATAAAT等,是真核生物基因组重复序列中的主要组成部分。每个微卫星的核心序列结构相同,重复约10~60次。与SNP的二等位性不同,任意不同个体间某一微卫星的串联重复次数都可能不同,因此存在很多等位基因,呈高度多态性。动态突变在概念上与微卫星类似,但其在传代中重复次数的扩增速率远高于微卫星。而微卫星在基因组中相对稳定,因此作为遗传标记的应用非常广泛,常用于法医的个体识别、亲子鉴定,以及遗传学连锁分析(linkage analysis)和关联研究(association study)中。
2.小卫星多态性
与微卫星类似,还有一类插入缺失多态性源自长7~64bp的DNA序列的重复排列,重复次数通常为几百~几千个,称为小卫星(minisatellite)或可变数目串联重复(VNTR)。
3.可移动元件插入多态性
几乎一半的人类基因组区域中都含有分散重复序列,依其序列长短又可分为短分散核元件和长分散核元件。绝大部分的分散核元件是静止的,一小部分则可通过逆转录转座来移动,从而增加基因组的多样性。最常见的两个移动元件家族为 Alu和 Kpn I家族。目前在人类基因组中已发现了近10 000个可移动元件插入多态性。
三、拷贝数多态性
人类是二倍体生物,除了线粒体基因组和男性的性染色体外,其他DNA序列的拷贝数都应是2。但近年的研究发现在人类基因组中,有些大片段基因组序列的拷贝数出现异常,即拷贝数非2,因此称其为拷贝数变异(copy number variation,CNV)。这一变异的范围可从1kb至数百kb,是介于小片段DNA变异和染色体水平变异之间的一大类变异,又称为结构变异(structural variation)。CNV区域可包含部分、整个或多个基因,也可位于基因间区域。CNV最早是在健康人群的基因组中发现的,目前认为人类基因组50%的区域可有CNV的存在。人群里频率>1%的CNV又被称为拷贝数多态性(copy number polymorphism,CNP),而频率<1%的CNV则被称为罕见CNV。近年研究表明CNV也是一些重要疾病(特别是多基因病)的遗传学基础。