第1章 绪论
1.1 研究背景
蛋白质(protein)取自希腊文“proteios”,是“首要”“最原始”的意思,可见蛋白质在生命活动中的重要性。蛋白质是决定细胞性质的最主要物质,它是一类重要的生物大分子,在生物体内占有特殊的地位,是生命活动的主要承担者,是生命现象的主要物质基础。蛋白质不仅是构成一切细胞和组织的重要组成成分,而且也是生物体细胞中含量最丰富的高分子有机化合物。蛋白质与生命的基本现象密切相关,许多重要的生命现象和生理活动都是通过蛋白质来实现的,如催化反应、代谢调节、免疫保护、物质运输、机体运动、遗传控制、生长发育等[1]。
然而,蛋白质只有折叠成正确的三维空间结构才能具有正常的生物学功能[2]。错误的折叠、过慢的折叠不仅会导致其生物学功能的丧失,甚至会引起疾病,如可传播性海绵状脑病(CJD)、疯牛病(BSE)、肌萎缩性脊髓侧索硬化症(ALS)、帕金森综合征(PD)、阿尔茨海默病(AD)[3]等。可见蛋白质折叠过程对所有的生物体系来说都是最重要和最基本的过程,这个过程是一个既复杂又深奥的基础理论问题,也是生命科学中最基本的问题之一,但对人类而言仍然是个未解之谜。
蛋白质折叠是一个生命自组织过程,当一个蛋白质自发地经历一个“混乱↔有序(disorder↔order)”转变时,称为蛋白质“折叠↔解折叠(folding↔unfolding)”,其中有很多谜团尚未解开。这是一个非常复杂的过程。在这一过程中,除二硫键外,主要是氢键、盐键等共价键的断裂和形成。这一折叠过程遵循自由能减小的原理,即蛋白质在一定的时间范围内沿着某些或某一特定的路径到达其自由能最小或极小的生物学天然构象。
目前有关蛋白质折叠的研究主要包括以下几个方面:①对蛋白质折叠编码问题的研究,即天然结构是如何选择它的氨基酸序列的,该问题属于蛋白质折叠的热力学问题;②对蛋白质折叠过程的研究,即蛋白质是如何在一定的生物学时间范围内从一条伸展的多肽链到达其特定的天然构象的,该问题涉及蛋白质折叠的动力学和能量变化规律问题,以此为基础可以更好地对蛋白质结构进行预测。蛋白质结构预测是指从蛋白质的氨基酸序列预测其三维空间结构。对于理解蛋白质的结构与功能关系,并在此基础上进行蛋白质复性、突变体设计以及基于结构的药物设计具有重要意义,因而进行蛋白质的结构预测成为一种迫切需要。近年来,随着高精度的蛋白质折叠数据的不断积累,使得从蛋白质折叠速率角度研究蛋白质折叠机制的理论工作者,迎来了前所未有的机遇和挑战。
蛋白质的折叠速率体现了蛋白质折叠的动力学特征,在蛋白质的折叠过程中,有些蛋白质,特别是一些小蛋白质,没有明显的中间态,遵循“全”或“无”的过程,而有些蛋白质则需要中间态的不断积累才能最终完成其折叠过程。在这些蛋白质中,它们的折叠速率又有着很大的差异(通常情况下,折叠速率用kf表示,单位为s-1),有些蛋白质在几微秒内就能完成其折叠过程,而有些则需要几个小时[4]。另外,蛋白质序列的极小差别或溶剂环境的细微变化,都会引起蛋白质折叠动力学的巨大改变。为了更好地解释这一差异,真实地模拟蛋白质的折叠过程,并计算出它们的折叠速率,近年来发展了许多实验方法来研究蛋白质的折叠过程,如各种光谱技术(圆二色、荧光、红外)、质谱技术、氢交换以及核磁共振等[5-9]。迄今为止,蛋白质动力学研究方面已经积累了相当可观的数据,并出现了相应的蛋白质折叠数据库[10][11],为我们数据库的建设奠定了深厚的基础。
目前,关于蛋白质折叠速率问题,大都是从蛋白质的高级结构、二级结构,乃至氨基酸序列出发进行研究的。然而,我们研究表明,除此之外,RNA也包含了影响蛋白质折叠速率的因素。这是生物学的一个重要问题,如果解决了这一问题,等同于回答了以下多年来一直困惑生物学家们的问题:分子生物学“中心法则”揭示了遗传信息从DNA到RNA到蛋白质的传递过程,在此过程中,通过翻译,由成熟的mRNA序列得到相应的蛋白质氨基酸序列。除了这种翻译信息之外,mRNA是否携带决定蛋白质构象的更为重要的因素呢?1973年,Anfinsen[12]等提出一个原理认为蛋白质的氨基酸序列包含了决定蛋白质结构的全部信息。但是,随后的研究者发现存在着氨基酸序列相同但构象不同的蛋白质,以及构象相似而氨基酸序列相差显著的蛋白质[13]。这说明氨基酸序列并不是决定蛋白质空间结构的充分条件,即除氨基酸序列以外的其他信息对蛋白质空间结构的形成也是重要的。这种信息很有可能存在于mRNA的序列和结构中。基于这个思路,我们就相关问题开展了系列研究。