服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

分子模拟(Molecular Simulation)

日期: 来源:计算材料学收集编辑:jimzz

虽然二维结构表示分子形式是非常有效的,可以帮助化学家快速理解和识别分子结构,三维结构对于理解药物分子的理化性质和合理的药物设计则非常重要,因此三维结构的测定就显得尤其关键。在药物设计中,只要能够获得晶体结构,都会作为解释药物分子生物活性的不可或缺的证据。但很多情况下研究人员并不能获得现成的三维结构,只能借助模拟的三维结构来解释实验结果。


01

 三维结构模型是化学研究的利器


三维模型的应用可以追溯到1890年,Jacobus H. van’t Hoff和Joseph Le Bel首次提到了三维模型的概念。另外,在Emil Fischer的自传Aus meinem Leben中也有关于三维模型的描述。在书中,他这样记载了自己在意大利度过的一个假期: 

在1890年末到1891年初的那个冬天,我忙于弄清楚糖的构型,但没有完全达到我的目标。在Bordighera时我想到,戊糖构型与三氧戊二酸有关。遗憾的是,由于缺乏一个模型,我无法根据理论判断这种酸在多大程度上是可能的,因此我向Baeyer提出了这个问题。他以极大的热情去研究这些东西,直接从面包和牙签的球体中构建碳原子。但经过多次尝试,他放弃了这高难度的工作。后来在沃尔兹堡仔细研究模型之后,我设法找到了最终的解决方案。

LinusPauling提出了用α螺旋作为蛋白质二级结构的论点。 

Linus成功的关键在于他对结构化学简单规律的洞悉,一个重要的问题是弄清楚哪些原子喜欢坐在彼此的旁边,只盯着X射线照片不可能发现α -螺旋。这项工作的主要工具是一套表面上类似学龄前儿童玩具的分子模型。

诺贝尔奖得主James Watson在他的书The Double Helix中描述了Pauling的方法。Pauling的成功也是基于他对理论化学知识的精通,他知道酰胺键具有一个刚性平面结构,而他的竞争对手则认为酰胺键是柔性的。James Watson和Francis Crick和Pauling用同样的方式来研究DNA结构。 

我们没有理由不像Paulign那样以同样的方式解决DNA问题。我们所要做的就是建立一套分子模型并进行搭建——幸运的是结构将是一个螺旋。 然而,我们与模型的最初几分钟并不愉快。即使只涉及到大约十五个原子,它们也不断地从为保持正确的距离而设置的笨拙的钳子中掉出来。连续几天没有建立严格的模型。我们不仅缺乏嘌呤和嘧啶成分,而且从未有店铺把任何磷原子拼在一起。我们的机械师至少需要三天的时间打造最简单的磷原子.. ..

在前人的基础上,Waston和Crick阐述了DNA的双螺旋结构,获得了1962年度诺贝尔奖。这表明模型在科学研究中的重要性,用Crick的话说:“一个好的模型是无价的”。


02

 分子模拟的策略


与20世纪50年代和60年相比,今天的电脑有着快速处理图形文件和高速计算的能力。如今已有专门的软件用于分子模型研究,并且促进了分子模拟这一领域的建立和发展。 


表1.分子模拟重要技术方法

技术

目标(算法或工具)

交互式计算机图形显示

显示各种分子三维结构(PyMOL)

小分子模拟

产生三维结构(RDKit, Openbabel, CORINA)


分子力学-力场 (AM1-BCC,RESP)


分子动力学(AMBER, GROMACS)


量子力学技术 (Gaussian)


构象分析 (RDKit)


计算物理化学性质

分子比对

相似性比对 (Morgan Fingerprints)


体积比较


3D-QSAR(CoMFA,CoMSIA)

蛋白质模拟

序列比对(Clustal W)


同源模建 (Alpha Fold2)


折叠模拟

蛋白质-配体模拟

分子对接(Autodock,Glide)


计算结合力 (MM-GBSA/PBSA)

配体设计

三维数据库搜索


基于结构的配体设计


从头设计 (LigBuilder)


虚拟筛选


基于片段的配体设计

分子模拟可以通过两个方面进行,一是从实验数据来推测研究对象的三维结构和理化性质;二是用第一性原理方法进行尽可能准确的预测,如量子化学方法和力场计算方法。实践中,两者可以交互进行。三维结构模型的构建分为三个步骤:

  •  生成起始模型

  • 优化和分析

  • 使用模型

 

03

 基于知识的方法


分子模拟中常用的方法是基于知识的方法,对于实验确定的分子结构、晶体堆积、蛋白质结构、蛋白质序列以及通过晶体复合物总结的相互作用和活性关系的知识积累,都可以用来作为分子模拟的参考。剑桥晶体学数据库是重要的信息来源,其中有500,000多个小分子的晶体结构。蛋白质数据库(PDB)收录了80000多个蛋白质和DNA结构。分子的理化性质也可以在数据库中查询,如Beilstein数据库有1000万种化学结构,其中20000多种化合物带有pKa数据。值得注意的是数据库不同来源的数据可能存在错误。


CSD,https://www.ccdc.cam.ac.uk/solutions/csd-core/components/csd/RCSB PDB: https://www.rcsb.org/

 

04

 基于力场的方法


基于力场的方法,也就是分子力学,是一种基于经验的计算分子立体结构的方法。原子之间的作用力,包括共价和非共价都可以用可解析的合适的参数来描述。分子力学的核心思想是假定分子的键长和键角都在标准值附近振动。空间相互作用,不直接连接的原子之间的排斥作用导致某些键长和键角处在非理想状态下,这些排斥作用可以归为范德华相互作用。1946年科学家首次提出了范德华尔斯相互作用、键伸缩作用和键角变形作用,用于计算分子的结构和能量。如今经典的力场还包括了二面角旋转的能量贡献,以及静电相互作用,为每个原子分配点电荷(partial charge),总电荷数即是整个分子的电荷数。

图1.分子能量计算公式


静电相互作用可以用库仑定律来计算,该定律阐明了电荷之间的相互作用与他们之间的距离的平方成反比,或者说势能与距离成反比。电荷的分配与正确介电常数(ε)的选择对于正确计算静电相互作用非常重要。介电常数在库伦方程的分母中,在水介质中ε=80,在真空体系中ε=1。因此在水相中静电相互作用衰减得非常迅速,而在真空中它们的作用范围更大,这也导致了蛋白质力场计算中,选择正确的介电常数非常困难。研究人员尝试ε=4~20的很多数值,而该值依赖于所处环境,在蛋白质表面附近ε大于蛋白质内部。对于范德华相互作用,则使用Lennard-Jones势能来描述。值得注意的是计算力场对初始构象非常敏感,从不同构型的分子开始计算,得到的能量最小化结构也可能不同,有许多分子尤其是蛋白质-配体复合物可能会呈现多种不同的低能构象。因此建议从不同的构象开始进行多次计算。

图2. 原子静电势计算示意图


05

 量子化学方法


在量子化学方法中,通过薛定谔方程计算分子的电子排布,但这一方法无法计算具有多个电子的分子,只能求其近似解。最常用的是Hartree-Fock方法,其中多体方法被分解成为多个单体问题,分子内部的电子-电子相互作用总和被可以迭代优化的有效场取代,故而有自洽场(SCF)的说法。量子力学从头计算可以直接计算分子结构和电子密度分布以及分子性质,不需要像力场计算那样需要初始假设设定,即一开始就指定原子类型,是平面还是锥形等。

 

量子力学方法精度比力场计算方法高,这种从头计算方法计算时间普遍很长,为了解决这一问题,一些所谓的半经验方法被开发出来,这一方法将从头计算的限时计算步骤替换为可快速计算的近似值。在牺牲一部分精度的前提下节省了计算时间,例如分子模拟中的QM/MM这种量子力场和分子力场结合的模式,通常利用QM计算配体和相互作用界面的氨基酸残基,用MM计算其余大体系的蛋白质。密度泛函理论(DFT)代表了另一种更快的从头算技术。用这种方法,计算了多体系统基态中与位置有关的电子密度分布;避免了多体系统的Schrodinger方程的完全解。

 

06

 计算分子性质


分子力学和量子化学计算的初始结果是一组定义分子三维形状的原子坐标,这可以用进一步计算分子能量。此外,分子的形状、大小和电子特性也可以通过计算得到。在分子形状显示技术中常用线条和球棍模型,通常不同原子有不同颜色,N为蓝色,氧为红色,硫原子为黄色,氟原子未绿松石色,氯原子未绿色,溴原子为棕色,碘原子为紫色。氢原子为白色,为了清晰通常氢原子被隐藏,碳原子则为灰色。另外一种显示方式是填充模型,原子的范德华尔斯表面被展示出来,原子显示为球形,大小代表其范德华尔斯半径,这些半径的大小来自非常精确的从头计算或则晶体结构。此外还有静电势分布表面和亲疏水表面等。


图3. 分子的不同展示形式


对蛋白质显示中,通过在分子表面用1个半径为1.4埃的球体(一个水分子的尺寸)进行滚动产生溶剂可及表面积,分子表面的低洼处表示其他分子可以进入,可以用于分析蛋白质-配体相互作用和结构优化。

图4. 蛋白质分子表面的定义方式


07

 分子动力学:模拟分子运动


分子动力学模拟(MD)可以用来描述分子系统的动态变化,原子和分子在指定的分子力场控制下进行运动。假定分子相互作用遵循经典力学规律,在模拟中对所有原子运动的牛顿方程进行求解,计算两个原子之间的相互作用时,不考虑其他原子的作用。动力学模拟从初始构象开始,然后将分子浸入溶剂中,因此需要构建相应的溶剂模型,同时为了满足体系的电中性需要添加离子。为了防止“墙壁”产生的边界效应,溶剂盒子周围需要添加上所谓的“周期性边界”,当模拟体系离开溶剂盒子时,计算体系将其处理为从另一面从新进入盒子内。实际模拟开始时,每个原子被赋予一个随机取向的初始速度。然后计算程序每隔1fs记录原子位置变化,在设定模拟时间,如几个纳秒内累计位置变化的记录就称为“轨迹”。10ns足够追踪氨基酸侧链的运动,然而这一尺度远不能描述小分子进入蛋白质结合口袋的生物过程,蛋白质折叠也需要更长的模拟时间,通常是20ms~1h左右。动力学模拟的另一应用是利用“轨迹”计算结合自由能。


图5.动力学模拟轨迹快照RMSD,分析轨迹中各个快照(snapshot)的构象差异。


动力学模拟轨迹展示


08

 模型和模拟的区别在于


模型处理用于分析和解释实验现象,分子会采取什么样的构象,候选药物是否能够与靶蛋白结合等问题的解答;而模拟用于给定一个初始模型和条件进行计算,用于预测体系动态变化,如今计算模拟已经发展到与理论和实验并驾齐驱的地步,被称为“精确科学的第三大支柱”。

 

然而,在药物设计领域对于计算模拟的期望并不能太高,在化学中存在非常多的不确定因素,且目前的模型通常不够精确,仅从蛋白质-配体相互作用看也存在诸多限制,等待更多的实验数据和晶体模型被公布后这一领域将会有更大的进步。


参考资料:Di L, Kerns E. Drug-like properties: concepts, structure design and methods from ADME to toxicity optimization[M]. Academic press, 2015.

相关阅读

  • Appl. Surf. Sci.:有序碗状氮化硼整体式泡沫

  • 第一作者和单位:刘秋文,中国科学院赣江创新研究院通讯作者和单位:刘秋文,中国科学院赣江创新研究院;张一波,中国科学院赣江创新研究院;邱惠斌,上海交通大学原文链接:https://

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 分子模拟(Molecular Simulation)

  • 虽然二维结构表示分子形式是非常有效的,可以帮助化学家快速理解和识别分子结构,三维结构对于理解药物分子的理化性质和合理的药物设计则非常重要,因此三维结构的测定就显得尤其
  • 二维超宽禁带半导体

  • 二维超宽禁带(UWBG)半导体由于其诱人的物理特性,在高功率透明电子器件、深紫外光电探测器、柔性电子皮肤和节能显示器领域引起了越来越多的兴趣。与占主导地位的窄带隙半导体材
  • 用 OLED 显示器的核心材料打造 AI「大脑」

  • 转载自公众平台:ScienceAI本文以传播知识为目的,如有侵权请后台联系我们,我们将在第一时间删除。编辑 | 绿萝ChatGPT 因其执行各种任务的能力而闻名,包括论文写作、翻译、编码等