医学遗传学(第4版)(全国高等学历继续教育“十三五”(临床专本共用)规划教材)
上QQ阅读APP看书,第一时间看更新

第二节 人类基因组中的变异

随着人类基因组序列测序的完成,不同个体间和不同人群间基因组的差异逐渐成为人们关注的焦点。在一些国际协作组的共同努力下,人类基因组中的变异及其与疾病关系的研究取得了快速的进展。
一、人类基因组变异的类型
(一)DNA重复序列的变异
基因组中DNA重复序列分为两类:串联重复序列(即卫星DNA)和分散重复序列。
1.卫星DNA
一些小的DNA单元串联重复若干次即为卫星DNA,也称为数目可变的串联重复(variable number of tandem repeat)。卫星DNA根据其重复单元的大小可分为卫星DNA、小卫星DNA和微卫星DNA。其中最常见的是微卫星DNA,其重复单元为2~6bp,它们也被称为短串联重复(short tandem repeat,STR)。每个STR位点可以代表基因组中一个特定的片段,同时因为它们具有高度的变异性,因此比限制性片段多态能提供更多的信息。
2.分散重复序列
即前面提到的长分散元件(long interspersing element,LINE)和短分散元件(short interspersing element,SINE)。其中LINE占人类基因组的15%左右,长度约为5000~7000bp,拷贝数在10 2~10 4之间。例如,KpnⅠ家族(KpnⅠ family)。KpnⅠ家族散在分布于基因组DNA中,用限制性内切酶KpnⅠ消化人的DNA,电泳可得到4种长度不同的DNA片段。SINE占人类基因组10%左右,长度300~500bp,拷贝数可高达9×10 5。例如,人类基因组中特有的Alu家族(Alu family),长度约300bp,在单倍体基因组中有30万~50万份拷贝,每个Alu序列中含有一个限制性内切酶AluⅠ的识别位点,AluⅠ可将Alu序列切割成170bp和130bp的两个片段。这些分散重复序列在基因组中插入的位置形成了基因组的多样性。
(二)拷贝数变异
拷贝数变异(copy number variation,CNV)的定义是长度>1kb的DNA片段在基因组中拷贝数的变异。因为CNVs片段很大,所以从前除非找到合适的定量PCR方法,否则很难鉴定出来。然而随着微阵列比较基因组杂交(array comparative genomic hybridization,aCGH)和新一代DNA测序等技术的出现,CNV的检测已变得越来越容易。从分类上,CNV是与LINEs和SINEs不同类的,但其实它们是存在一些交叉的,一些分散重复序列的不同重复次数就构成了CNVs。目前已报道的CNVs有58 000多个,而且还将有更多的CNVs被发现。从占基因组的大小来说CNVs对基因组变异起到了比SNP更多的作用。
(三)单核苷酸多态性
单核苷酸多态性(single nucleotide polymorphism,SNP)是指基因组中单个碱基的变异。人类基因组计划的完成大大促进了人们对SNP的认识,目前已经鉴定的人类SNP有大约4200万个,在描述SNP的时候通常用rs作为前缀,后面是一个数字,例如rs10768683是β-珠蛋白基因中的一个SNP。SNP已经取代了微卫星作为基因组的一种研究工具,因为它们在基因组中广泛存在,并且检测价格也迅速下降。
(四)单核苷酸变异
随着基因组测序的完成,越来越多的单个碱基的变异被发现,因此又出现了一个新的词汇——单核苷酸变异(single nucleotide variation,SNV)。目前很难给出一个准确的SNV的定义,但通常SNP指中性的变异,如在一个人群中常见的单个碱基的改变,而SNV通常指作用尚不明确的单个碱基的改变,有待进一步确认是SNP还是突变(即可以导致疾病的DNA改变)。
二、基因组中的变异与疾病的相关性
人们已经开始越来越关注这些大量的人类基因组变异,致力于鉴定它们在产生人类多样性中的作用,并证明它们是中性的DNA多态或是导致疾病的突变。
DNA重复序列变异中的三核苷酸重复是最常见的与疾病相关的变异。例如Huntington病是一种典型的由三核苷酸拷贝数变异引起的疾病,它的临床症状多样,包括进行性加重的行动异常(通常表现为舞蹈病)、精神异常和痴呆。一般35~45岁发病。该病的致病基因是 IT15(interesting transcript 15)基因,现在正式的命名为 HTT基因。在该基因第一外显子内有一个三核苷酸重复(CAG)n,正常人该重复数的变异范围为6~26次,当重复数超过39次时就可能导致该病的发生。一般来说重复次数越多,疾病的发生越早。
全基因组测序和大数据分析在很多正常人中发现了CNVs,它们可以削弱基因功能,但没有明显的临床症状。然而更有用的发现是在一种疾病当中没有发现预期的基因本身的异常,但发现了CNV的缺失或重复,这些疾病包括精神分裂症和Alzheimer病等。同时CNV在体细胞遗传病中也很重要,例如人类表皮生长因子受体(human epidermal growth factor receptor, HER2)基因和乳腺癌。 HER2阳性的乳腺癌是由于基因扩增造成的过表达,往往预后较差,但对药物赫赛汀(Herceptin)反应敏感。因此,在治疗之前往往都会对肿瘤进行 HER2基因扩增的检测。
SNPs在基因中可造成三联体密码子的改变,因此可以改变编码的氨基酸(称为非同义SNPs)或者对氨基酸没有影响(称为同义SNPs)。之前认为后者是中性改变,对基因产物没有影响,但现在已发现一些同义SNPs可以通过产生隐秘剪切位点而影响基因功能。