第四节 放射损伤易感性预测的研究方法
放射性肺炎、放射性食管炎、放射性口腔黏膜炎、放射性直肠炎等剂量限制性毒性严重影响放疗剂量的提高;而晚期毒性会持续存在并影响肿瘤存活患者的生活质量。因此随着常见肿瘤诊治水平的提高,放疗毒性得到了更多的关注。有研究证实近80%的正常组织毒副作用取决于个体差异,遗传因素发挥重要作用,例如ATM基因突变患者对放疗超敏且肿瘤发病风险高。然而,这类高度外显性的罕见突变无法解释大多数个体间的差异。随着基因组学和生物信息学技术的发展,研究遗传变异与放疗毒性关联的新学科—放射基因组学(radiogenomics)应运而生。放射基因组学具有两方面目标:①结合遗传因素和临床变量构建放疗敏感性的预测模型;②通过研究相关分子机制,预防放疗毒性的发生。目前放射基因组学研究主要集中在放疗毒性预测方面。
放射基因组学的本质为关联研究,其基本原理是:通过比较单核苷酸多态性(single nucleotide polymorphisms,SNPs)位点的次要等位基因频率(minor allele frequency,MAF)在放疗毒性组和对照组间有无显著性差异,进而得到该SNP是否与放疗毒性存在统计学关联的结论。因为位于同一染色体区域的SNP位点倾向于整体遗传,多个位点之间具有较强的相关性,即连锁不平衡(linkage disequilibrium,LD),其中一个或多个标签位点即可代表该区域的所有位点。最后根据该SNP在基因组中的位置和LD关系推测放疗毒性易感基因及相关机制。
放射基因组学有两种设计方式:两/多阶段设计和meta分析。在两/多阶段设计中,首先利用基因芯片或测序的方法对一批样本进行基因分型,筛选和放疗毒性显著相关的SNPs,之后扩大样本在另一独立的人群中进行验证。两/多阶段设计减少了基因分型的工作量和费用,同时通过验证实验降低了结果的假阳性率。但是在验证组仅能获取和筛选研究终点相关的SNPs信息,所以二次分析数据有限。
meta分析设计是汇总针对同一放疗毒性的多项放射基因组学数据进行统计分析来提升关联检验的功效。该设计能够利用已有数据,降低研究成本,扩大样本量,而且可能找出单个研究不足以发现但确实对放疗毒性风险具有微小效应的遗传变异。但该设计的缺点在于需要统一不同研究的毒性终点,而且如何有效地剔除各个研究中潜在的混杂因素也是一个无法回避的问题。
早期的放射基因组学研究采用候选基因策略,即选择已知的放射应答相关基因的功能性SNPs进行放疗毒性关联研究,一般纳入研究的放射应答通路包括DNA损伤修复,炎症,凋亡和生长。该研究策略的优势在于成本相对低且能够利用已有的研究背景将研究基因数量限制在可控范围内;而缺点是重复性差,不同研究经常出现不一致甚至相反的结果,目前认为主要原因是未考虑种族差异,未校正多重假设检验P值等。经过改进试验设计,纳入独立验证,目前一些侯选基因研究的结果见表4-4-1。
尽管取得了一些研究成果,候选基因策略仍然具有一些局限性。第一,此方法仅能研究感兴趣基因的一个或多个SNPs,然而很多基因包含数百个SNPs。第二,候选基因的选择一般局限在蛋白编码区域,这就会阻碍转录调节基因SNPs的挖掘。候选基因策略最关键的局限性在于该研究的科学性是基于对放射应答机制全面准确地了解,然而目前这些理论多来源于体外实验,研究者对于体内的放射应答机制知之甚微。
随着人类基因组单体型图谱计划的完成以及高通量基因分型技术和生物信息学的发展,全基因组关联研究(genome-wide association studies,GWAS)方法被应用到放疗毒性的遗传学研究中,即在全基因组范围内筛选和放疗毒性相关的遗传变异。为扩大样本量并促进国际合作,国际放射基因组学联盟(radiogenomics consortium,RGC)于2009年成立。RGC推动了放射基因组学研究从单中心向多中心,从候选基因向全基因组策略的发展。
文献检索结果显示目前已发表的以放疗晚期毒性为研究终点的GWAS研究共五项。2010年Kerns等发表的第一项放射基因组学GWAS结果显示SNP rs2268363和非洲-美洲裔前列腺癌患者的放疗后勃起功能障碍显著相关。该SNP标记基因FSHR内的位点,基因FSHR编码卵泡刺激素受体,参与性腺的发育和功能。值得注意的是基因FSHR并非传统认识的放疗敏感性相关基因,这提示组织特异性放射反应通路也很重要。随后Kerns等扩大样本量,以欧洲裔前列腺癌患者为研究对象设计了两阶段的GWAS研究。结果显示12个SNPs和放疗后勃起功能障碍有关,这12个SNPs位于参与勃起功能或其他细胞功能的基因内部或附近。研究结果还显示与SNP rs7120482高度LD的染色体11q14.3上的位点和放疗后晚期直肠出血相关。该SNP位于MTNR1B和SLC36A4的基因间区,通过调节mTOR复合体Ⅰ信号通路影响血管生长、细胞增殖、存活和放疗敏感性。
Barnett等进行了迄今为止样本量最大的多中心放射基因组学GWAS研究,纳入了1217例接受辅助放疗的乳腺癌患者和633例接受根治放疗的前列腺癌患者。在前列腺癌筛选组中发现了3个具有统计学意义的SNPs,分别与尿流变细、大便失禁和尿频相关。其中,位于基因KCND3内的SNP rs2788612与大便失禁的关联性在验证组中得到了重复,但另外两个SNPs与放疗毒性的关联均未得到验证。同样,在乳腺癌筛选组中与毛细血管扩张相关的SNP在验证组中关联为阴性。分析原因可能是筛选组关联为假阳性,或者是样本量不足以检测到MAF低或效应值小的关联。
最近Fachal等发表的GWAS研究结果显示染色体2q24.1上的位点和前列腺癌患者放疗后的晚期总毒性(包括泌尿和肠道毒性)有关。该研究纳入西班牙的741例接受放疗的前列腺癌患者作为筛选组,来自英国的633例患者和北美的368例患者作为验证组。结果显示SNP rs364663位于内含子区,标记一个表达数量性状基因座,影响基因TANC1的表达。TANC1参与肌细胞修复,因此可能与放疗后受损肌肉的再生有关。
综上所述,GWAS相比于候选基因研究不需要预先获知放射反应通路,能够在全基因组范围内筛选放疗毒性相关SNPs,挖掘新的组织特异的功能性SNPs,帮助研究者全面地了解遗传变异对于放疗毒性的作用机制。
虽然GWAS在很大程度上加深了研究者对放疗毒性遗传机制的理解,但也表现出一定的局限性。首先,GWAS检测到的关联位点仅能解释一部分表型变异,未能解释的那部分遗传变异被称为遗传性缺失。遗传性缺失有两方面原因。第一,GWAS是基于“常见疾病,常见变异(MAF>5%)”的假设。然而从生物进化和群体遗传学角度来看,绝大部分突变等位基因是低频的,常见变异的效应可能是从罕见变异的效应“稀释”而来,即“常见疾病,罕见变异(MAF<1%)”假设。Dickson等提出“合成关联”的概念,即因为常见变异与高效应值的罕见变异之间存在LD,所以GWAS会发现常见变异和表型的关联性。目前认为,常见变异和罕见变异都在致病效应上有所贡献。然而罕见变异难以被现有的GWAS检出,一方面是罕见SNPs频率低,除非效应很强,现有的GWAS样本量不足以检测出这些位点;另一方面罕见SNPs数量多,相互之间LD程度较低,GWAS芯片难以较好覆盖这些位点。精细作图分析、针对特定区域再测序及全基因组测序可能为罕见SNPs的检出提供帮助。遗传性缺失的另一原因是GWAS芯片难以检测基因拷贝数变异(copy number variation,CNV),即1kb以上的基因组结构变异。CNV在复杂性状遗传机制中具有重要作用。随着千人基因组计划的不断推进,人类基因组CNV图谱会更加清晰,同时测序技术有望为阐明CNV在放疗毒性中的作用提供更好的平台。
GWAS面临的另一挑战是发现的许多SNPs并不影响蛋白质的编码,这为从机制上解释SNPs与表型之间的关系造成了一定的困难。但随着研究的逐渐深入,非编码DNA被发现具有重要的调节作用。ENCODE项目结果显示非编码DNA通过DNA甲基化、乙酰化和募集转录因子调节基因表达。一旦GWAS中SNPs与放疗毒性的关联得到了独立大样本的验证,研究者就可以开展SNPs影响放疗毒性的深入机制研究。
此外GWAS需要考虑群体分层问题,这是导致病例-对照设计下的关联研究出现假阳性结果的重要混杂因素。在一个群体中GWAS结果显著关联的SNP在另外的群体中有时并不显著,可能是由于不同人群等位基因频率不同或具有不同LD区域所致。纠正GWAS群体分层的方法有很多种,如全基因组控制、结构关联和主成分分析等。
上述局限性存在于所有GWAS研究,以下对放射基因组学研究特有的挑战进行总结:
第一,对于某些肿瘤,研究的放疗毒性与非放疗相关症状有所重叠,难以区分鉴别。例如前列腺癌患者因合并良性前列腺增生常有不同程度的基础泌尿系统症状或性功能障碍。因此放射基因组学研究需要考虑患者的基线症状,才能确认放疗毒性相关的SNPs。针对此问题有以下解决方法:将放疗毒性评分定义为治疗前后功能评分的差值、排除基线功能差的患者或利用多因素分析对基线情况做校正。
第二是由于治疗方案影响放疗毒性的发生和严重程度,因此研究者需要获取准确的治疗方案数据。治疗因素对于SNP与放疗毒性的关联性具有效应修饰作用,即治疗因素影响SNP与放疗毒性的相关性强弱,因此按照治疗因素校正或分层能够更准确估计SNP的效应值。
第三是不同研究中放疗毒性的评价标准和时间不同。比如毒性分级标准有CTCAE、LENT-SOMA和RTOG等,毒性评判方法有患者主观评价和医生客观报告,评价时间选取有特点时间点和毒性最重的时间点等。由于缺乏统一的毒性测量和报告方法使得不同研究结果难以比较或汇总,以及单中心的研究结果难以推广。为了推进毒性数据采集的标准化,RGC发布了关联研究数据报告指南。
最后,以晚期毒性为研究终点的放射基因组学研究需要长期随访数据。虽然早晚期毒性的时间界点定义为放疗后3个月,但是临床上许多晚期毒性在治疗后数年才出现。若随访时间过短,部分患者晚期毒性还没有表现出来,这部分患者将被作为对照纳入分析,从而导致错误分类偏倚。对于某些预后好的肿瘤(如乳腺癌、前列腺癌等),放射基因组学研究理想的随访时间在5年以上。