蛋白质结合位点预测及辅助分子对接
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.4.1 蛋白质-蛋白质和蛋白质-配体结合位点的比较

蛋白质复合体是在生理条件下由蛋白质分子各自折叠,然后聚集连接而成的。属于蛋白质-蛋白质复合体的例子有抗原-抗体、酶-抑制剂、很多信号转导以及细胞周期蛋白复合体。我们已知的蛋白质-蛋白质复合体结构多数是通过X射线晶体学方法解析得到的,这就要求蛋白质与蛋白质分子能够形成稳定规则的晶体。基于这些已知的蛋白质-蛋白质复合体结构,人们对蛋白质-蛋白质结合位点的几何及物理化学性质已经有了详细的了解[16~22]。需要指出的是,这些关于结合位点性质的分析仅适用于足够稳定的蛋白质-蛋白质复合体。由这些复合体分析得出的规律可能不同于发生瞬时相互作用的蛋白质结合位点。

多数蛋白质-蛋白质复合体所包埋的分子表面积在1200~2000Å2[注]之间,这要远大于与小分子配体结合所需要的表面积[一般几百平方埃(Å2),具体依赖于配体分子的大小]。已知结构数据的分析指出多数情况下蛋白质-蛋白质结合表面几乎是平坦的,其中酶-抑制剂复合体是一个例外。抑制剂分子的结合位点经常会形成一个凸起的表面,形状上正好与酶分子结合位点的凹槽相契合。这方面与蛋白质-配体结合位点形成了鲜明的对比。蛋白质-配体结合位点通常是非常不平的,这使得其与配体分子能从多个方向充分结合[23~26]

在物理化学性质和几何特征方面,蛋白质结合位点明显区别于蛋白质分子的其余表面。然而,蛋白质间的相互作用是非常多样的,所以不能以单个表面属性就把结合表面和非结合表面区分开。根据残基的溶剂可及性,蛋白质-蛋白质复合体中结合位点上的残基可分为两个不同的区域:核心区和边缘区。核心区包含这样的残基,就是残基中至少有一个原子被完全包埋,在复合体形成后溶剂接触不到。这些残基通常是几乎没有极性的残基,它们被极性更强的边缘区包围。边缘区包含的残基在复合体形成后至少还有部分的溶剂可及性。某些蛋白质-蛋白质结合面在氨基酸残基组成方面会明显区别于分子表面的其他部分。结合区域富含脂肪族(Leu、Val、Ile、Met)和芳香族氨基酸(His、Phe、Tyr、Trp),并且除了精氨酸外,很少会有带电残基(Asp、Glu、Lys)。

有一个方法可用来确定结合位点残基对结合自由能的相对贡献,就是检测结合位点上残基突变成丙氨酸前后结合亲和力的变化。残基被丙氨酸替代就相当于从表面去除其侧链原子以及它们对结合强度的影响。有趣的是,对于使用丙氨酸扫描突变方法分析的蛋白质-蛋白质复合体,仅有一部分这种替代会对结合强度产生实质性的影响。这一发现引出了蛋白质表面热点的概念,即热点残基负责蛋白质间大部分相互作用[2728]

与蛋白质-蛋白质结合位点相似,与小分子配体结合的高亲和结合口袋,相对于其他区域,具有较少的极性或者说较多的疏水性。由于有机小配体分子比较小,所以,相对于蛋白质-蛋白质复合体,小分子配体-蛋白质相互作用中的包埋表面积通常也比较小。为了通过具有足够大数量的有利的蛋白质-配体接触而取得强相互作用,在蛋白质分子表面,经常会有非常凹陷的口袋或洞,有时,会把小配体部分包埋。

在很多方面,预测蛋白质-蛋白质结合位点的算法类似于预测小分子结合区域的方法。但是,由于这些种类的结合位点基本架构不同,在预测算法方面,仍然存在一些重要差别。