Protein Sci. -评估和增强设计蛋白质的折叠性

大家好,今天推送的文章来自于发表在Protein Science上的“

Assessing and enhancing foldability in designed proteins”,作者为以色列雷霍沃特魏茨曼科学研究所生物分子科学系的Dina Listov。

在过去的十年中,蛋白质设计方法取得了显著的进展。新方法使新折叠、新组件和新功能或改进功能的常规设计成为可能。尽管取得了这些成就,但只有一小部分经过实验测试的设计是有用的。尽管进行了几十年的研究,但可靠的从头酶设计仍然是未解之谜,目前所有的工作效率都很低。对先前成功和失败的酶设计的结果分析表明,催化位点设计的不准确部分是罪魁祸首。此外,对许多不同折叠和酶设计研究的观察表明,相对于设计模型的错误折叠可能是失败设计中最普遍和最关键的问题。事实上,错误折叠的重要性已成为研究设计新的理想化折叠的原则以及开发提高设计蛋白质折叠性和稳定性的一般方法的主要动机。

作者的策略是基于之前开发的方法,通过天然酶的大骨架片段(60-150 个氨基酸)的模块化组装来设计新的骨架。模块化组装和设计成功地产生了准确的抗体和超高特异性结合物和酶,从任何天然蛋白质中产生了多达100个突变。此外,大多数失败的设计表现出非合作折叠转变。在作者正在进行的从头酶设计研究中,可折叠性和活性之间的对应关系促使他们检查使用当前原子设计方法生成的蛋白质中低可折叠性的来源,并开发检测和改善设计蛋白质亚优性的策略。

作者开发了一种自动计算方法,以根据蛋白质设计的模型结构识别蛋白质设计中的能量次优位置。作者发明了一种新方法叫做pSUFER。首先使用Rosetta原子建模疏松输入结构。然后对每个位置的所有单点突变进行建模,迭代侧链填充和全蛋白最小化,并计算系统能量(ΔΔG)相对于亲本蛋白的变化。最后,pSUFER将表现出超过一定数量的突变(通常为5个)的位置标记为潜在次优位置,这些突变降低了自然状态能量(ΔΔG<0)。这些阈值是根据经验选择的,可以根据建模需要进行更改。用于自动松弛蛋白质结构、计算次优位置并在PyMOL中可视化的可定制脚本可在https://github.com/Fleishman-Lab/pSUFER.网站使用。

为了测试pSUFER,作者分析了过去四年中设计和实验表征的一组酶和binder。作者研究的第一对设计是通过糖苷水解酶10(GH10)木聚糖酶的模块化组装和设计产生的。在该组中,43种设计中的21种表现出可检测的木聚糖酶活性,只有两种表现出GH10家族天然酶中观察到的高活性水平。从该研究中,作者选择了两种具有最高和最低可检测活性水平的设计进行pSUFER分析,作者有晶体数据,分别为xyl3.1和xyl8.3(分别为(kcat/KM 9,417 and 0.61 M-1 s-1)。这两种设计相对于天然GH10酶具有高度突变,分别表现出105和130个来自任何天然酶的突变(共350个氨基酸),并表现出明显的热变性温度>55℃C、 xyl3.1的晶体结构相对于设计概念显示出显著的准确性,整个蛋白质的均方根偏差(rmsd)为0.7Å,活性位点残基的所有原子rmsd均小于1Å。相比之下,尽管xyl8.3是大体精确的(rmsd=0.9Å),并且核心催化基团在设计模型和实验结构之间排列良好,但实验结构在活性位点袋附近的两个相邻环中显示出明显的缺失密度,表明局部错折叠。在结构确定后,对两种设计进行的目视检查未发现xyl8.3中可能解释设计不准确的重大缺陷。

应用于两种木聚糖酶设计模型,pSUFER标记了相似数量的位置。正如预期的那样,大多数标记位置要么在活性部位袋中,要么在液体可触及的位置。然而,值得注意的是,在xyl8.3中,pSUFER标记位置Lys306,该位置埋在其中一个不显示电子密度的环的主干处。此外,Lys306不被负电荷吸引,表明环无序可能是该位置及其周围应变的结果。

作者在大肠杆菌BL21细胞中表达了N端与麦芽糖结合蛋白(MBP)融合的xyl8.3和xyl8.3-fix,并使用直链淀粉柱纯化了这些蛋白。然后,作者使用4-硝基苯基β-木二糖苷(OPNPX2)显色底物测试了两种设计的催化效率。xyl8.3-fix的催化效率为226M-11 s-1,比亲本xyl8.3高330倍。作者还分析了从MBP标签切割后两种设计的热变性,发现两种设计具有相似的表观变性温度xyl8.3和xyl8.3-fix分别为57℃和59℃。因此,催化效率的显著提高不是由于蛋白质稳定,相反,这可能是由于设计折叠成活性构象的能力的提高或活性位点应变的降低。

.

接下来,作者测试pSUFER是否可以揭示设计binder中的问题。设计策略采用自下而上的方法:首先定义功能呈现基序,然后设计蛋白质折叠以支持基序。36其中一种设计(4H.01)通过X射线结晶学精确地形成结合位点;然而,实验确定的结构相对于设计概念显示出显著的骨架偏差(2.9Å),并显示出回路中的缺失密度。pSUFER在本设计中标记11个位置;例如,Gln84和Leu78,其定位在环附近的空腔中,所述空腔表现出缺失的密度。根据设计模型,Gln84部分去溶剂化,不与环形成紧密的极性接触。Leu78被迫进入应变侧链构象,表现出的Rosetta侧链构像能量为+3个能量单位。由于松弛侧链构象中的空间重叠,该侧链不能组装成有利构象。与此设计相反,在精确结晶设计中,仅标记三个位置,所有位置都暴露于溶剂中(His1、Thr19和Thr35)。

pSUFER基于分子结构或模型分析次优性,因此仅限于分析设计的自然状态属性。然而,折叠性也取决于蛋白质是否可能折叠成替代(错误折叠)状态,这种可能性可以通过从头计算结构预测来评估。使用深度学习的方法在从头计算结构预测中非常成功。其中最成功的AlphaFold2在社区盲预测实验和其他结构预测挑战中展示了原子精度预测。重要的是,为了评估设计的可折叠性, AlphaFold2为预测模型结构中的每个位置提供了置信度分数(每个残差局部距离差测试;plDDT)。假设plDDT得分和AlphaFold2预测结构与设计模型之间的rmsd可能预测设计精度和可折叠性。AlphaFold2依赖于同系物的多序列比对来进行精确的结构预测,因此作者没有分析从头设计的binder。

两种经过精确设计的蛋白质(GH10 xyl3.1和大肠杆菌素免疫des3)的AlphaFold2分析与设计模型非常吻合(rmsd<0.7Å)。此外,除Nand C端尾部外,xyl3.1和大多数des3的plDDT得分较高(>90%)。对于des3,结合表面环骨架是从非同源蛋白移植的,这解释了为什么该区域的plDDT评分不高(>80%)。值得注意的是,在大肠杆菌素免疫des4的情况下,AlphaFold2模型在与缺失密度相对应的区域偏离设计模型。

此外,与其他两种设计相比,des3和xyl8.3中这些区域的plDDT得分明显降低。接下来,作者分析了xyl8.3-fix的AlphaFold2结果。AlphaFold2模型结构概括了rmsd<0.8Å的设计模型,类似于xyl8.3。值得注意的是,306位周围区域以及根据结晶学分析显示密度缺失的环中的plDDT分数更高,与对蛋白质剩余部分观察到的分数相等(>92%)。这一结果表明,AlphaFold2置信分数甚至对设计蛋白质中的某些单点突变敏感。作者得出结论,AlphaFold2分析可以提供关于新设计的主干结构的可能准确性和可折叠性的关键信息,指示可能错误折叠的区域,并评估旨在减轻错误折叠的突变。

整理:张经纬

文章信息:

doi:110.1002/pro.4400

文章链接:

https://doi.org/110.1002/pro.4400

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章