跳到主要内容

Docking

简介

分子对接(Molecular Docking)是小分子药物开发过程中常见的技术手段,可用来预测药物分子与蛋白质的相互作用和结合模式,通过分子对接,研究人员可以筛选具有潜在生物活性的化合物,从而为药物发现过程提供重要信息。

深势科技团队前期提出了Uni-Dock,一个GPU加速的分子对接程序,旨在应对含有数千万或数亿分子的超大型数据库的筛选任务。与单CPU内核运行的AutoDock Vina相比,Uni-Dock速度提高了1000倍以上,且精度优于目前报道的所有GPU加速对接程序,包括AutoDock-gpu和Vina-gpu[1]。随后,深势科技团队进一步优化了对接算法,改进了用户界面体验。结合Uni-Mol预训练模型及新的打分函数之后,Uni-Dock能够提供更为精确的对接pose预测。此外,提供了四种Constrained Docking(H-Bond、Maximum Common Structure、Substructure、Shape),以适配更多的场景需求。

人表皮生长因子受体(EGFR)与小细胞肺癌、乳腺癌和胶质母细胞瘤有关。靶向EGFR的受体激酶的抑制剂已成为非小细胞肺癌(NSCLC)、乳腺癌患者,甚至是EGFR突变或耐药患者的标准治疗选择。8A2D是EGFR突变体与化合物EGFRai 57的共晶结构,分辨率为1.11 Å,EGFRai 57可用于治疗非小细胞肺癌,可单独使用或与奥西替尼联合使用[2]。本教程基于Hermite的Docking模块,对8A2D进行Redocking。

本教程所需文件如下:

8A2D_pro_prep.pdb

8A2D_Lig_prep.sdf

1. 蛋白及配体检查

1.1 导入蛋白及配体文件

左侧通用菜单栏 File → Import Structure。

弹出“Import Structure”窗口,点击“Select Files”,选择本地的“8A2D_Lig_prep.sdf”及“8A2D_pro_prep.pdb”文件,点击“Import”,将文件导入3D Workspace中进行查看。

1.2 蛋白-配体间相互作用展示

Entry List处,双击小眼睛/右击选择“Fix”固定展示蛋白和配体;

3D Workspace窗口的上方工具栏,点击“Hydrogen Display Setting”,选择“Hide All Polar Hydrogen”,隐藏3D界面中的所有极性氢。

3D Workspace窗口的上方工具栏,点击“Interaction Toggle”,观察到配体与其附近水分子之间无相互作用,因此后续操作中不保留水分子。

2. Docking

2.1 功能入口

左侧通用菜单栏 Function → Virtual Screening → Docking。

2.2 Select a Prepared Protein

点击“Select from 3D Workspace”,弹出Select Structure窗口 → 展开Structure Hierarchy下的“8A2D_pro_prep.pdb”,点击“Protein” → Select Structure窗口中出现选中的蛋白,点击“OK”。

上传的蛋白进行力场检查,待Valid处由“Processing”变成“Valid”后,点击“Next”。

注:力场检查不通过时,可通过右上角“Protein Preparation”进行蛋白准备。更多蛋白选择方式的操作说明,详见《蛋白及配体选择、口袋设置》。

2.3 Select Prepared Ligands

点击“Select from 3D Workspace”,弹出Select Ligands窗口 → 选中Structure Hierarchy下的“8A2D_Lig_prep” → Select Ligands窗口中出现选中的配体,点击“OK”。

点击“Next”。

注:输入Docking任务的配体需经过准备,包括加氢、质子化、能量最小化等。更多配体选择方式的操作说明,详见《蛋白及配体选择、口袋设置》。

2.4 Pocket Setting

在 Entry List窗口中将“Ligand”显示在 3D workspace 中 → 点击“Select Ligand in the structure as center”,选择“8A2D_Lig_prep_A MOL 1”,以该配体为中心产生口袋,其他参数保留默认,点击“Next”。

注:更多配体选择方式的操作说明,详见《蛋白及配体选择、口袋设置》。

2.5 Constrained Docking

不需要基于条件限制进行对接,因此此处点击“No, skip this step”,跳过该步骤。

注:若您需要进行基于条件的限制对接,可参考下表:

Constrained Docking操作方式界面展示
H-Bond1) 选择“H-Bond”,Ligand Showed in 3D Workspace下拉选择参考配体,点击“Confirm”;
2)在3D Workspace窗口中选择与配体具有氢键相互作用的受体中的原子,选中的原子自动解析至右侧氢键受体和供体列表中
import_structure
import_structure
1)当配体与受体之间形成的某些氢键与分子活性相关时,可通过基于氢键限制的对接来筛选具有潜在活性的新分子
2)橙色虚线表示当前配体与受体之间存在的氢键相互作用
Maximum Common Substructure1)点击“Maximum Common Substructure”按钮,点击“Confirm”;
2)选择参考配体(即与受体具有合适结合模式的配体),上传好的配体会自动进入力场检查,检查通过后Valid列显示“Valid”,同时Structure View窗口中展示分子2D图
import_structure当您已知一个分子与受体的结合模式合适,需要从新的分子中筛选出与这种结合模式匹配的分子时,可以选择“Maximum Common Substructure”
Substructure1)点击“Substructure”按钮,点击“Confirm”;
2)选择参考配体(即具有特定子结构的配体),上传好的配体会自动进入力场检查,检查通过后Valid列显示“Valid”,同时Structure View窗口中展示分子2D图,选择需要的子结构后,点击“Save”保存该子结构
import_structureSubstructure选项提供了基于子结构筛选的分子对接,通过搜索出输入配体中包含特定子结构的配体,进一步与受体对接
Shape1)点击“Shape”按钮,点击“Confirm”;
2)选择参考配体(即具有特定形状的配体),上传好的配体会自动进入力场检查,检查通过后Valid列显示“Valid”,通过输入在原分子体积上的扩大比例确定需要形成的形状,点击右侧“Sync to 3D”将该形状显示于3D Workspace窗口
import_structure1)基于形状的虚拟筛选在骨架跃迁、生物异构体替代、虚拟库设计等方面具有重要意义,“Shape”选项提供了基于形状的虚拟筛选功
2)举例:比例设置为20%时,代表在原分子的体积上,扩大20%的范德华半径形成一个新的体积

2.6 Confirmation and Setting

确认蛋白、配体、对接盒子;

“Scoring Function”(打分函数)选择“Vina”,“Search Mode”选择“Detailed”,Number of Results to Keep选择All,开启Keep Multi Binding Poses for Each Ligand,Number of Binding Pose设置为20,Energy Range设置为9。勾选“Use Uni-Mol to optimize the resulting ligands' pose(s)”,“Do Rescoring”选择“Gnina”。

“Calculation”处确认计算花费,在“Job Name”处将该任务命名为“8A2D_Gnina”,点击“Submit”提交该任务。

参数
Scoring Function打分函数目前包括Vina、Vinardo、AutoDock4一般选择Vina
Search ModeFast:exhaustiveness 128 & max_step 20本质上设置了不同的分子对接计算复杂度,Detail对搜索空间的覆盖更全面,且准确性最高,其次为Balance,最后是Fast
Balanced:exhaustiveness 384 & max_step 40
Detailed:exhaustiveness 512 & max_step 40
Keep Multi Binding Poses for Each Ligand(每个配体生成多个构象)1)Number of Binding Pose,生成的构象个数,支持1~100;
2)Energy Range (kcal/mol):与最优结合模型相差的最大能量值,支持1~9;
——
Use Uni-Mol to optimize the resulting ligands' pose(s)使用Uni-Mol优化对接后的pose本质上是一种基于机器学习方法的限制性对接
Rescore对对接构象进行重打分。重打分函数包括Vina(↓), Vinardo(↓), GNINA(↑), KarmaDock Affinity(↑), RTMScore(↑), Uni-Mol Affinity(↓), Uni-Score(↑)推荐使用Gnina

3. 结果分析

3.1 任务入口

点击左侧通用菜单栏的“Job” → 在弹出的Job List界面处找出“8A2D_Gnina_Rescore”→ 点击“Show”。

注:由于选择了“Do Rescoring”,因此生成了任务“8A2D_Gnina_Rescore”。

3.2 评分结果

对接结果默认按重打分进行排序,观察到Gnina评分最高的为 0.967。

注:列表中重打分后的(+)代表该打分函数值越高越好,(-)表示值越低越好。

import_structure

3.3 构象复现

“Entry List”处,“8A2D_Lig_prep”的眼睛处双击/右击选择“Fix”固定展示该初始配体;

3D Workspace中选中该配体,右击,选择“Style”,Atom处选择颜色,点击“Apply”。可以看到,3D Workspace处原始配体被标记为所选色。

对于最佳打分的配体,点击右侧Operation下的3D,将配体分子与受体的对接结果显示于3D Workspace窗口中。

在3D Workspac窗口中观察对接前后的Ligand位置差异,发现此次Redocking能够较好地复现原始的结合位置,因此认为该工具能够进一步用于该靶标的虚拟筛选。

import_structure

键盘上下可切换pose,查看不同的对接结果。

3.4 筛选具有特定相互作用的对接结果

原始构象中,配体与蛋白残基ARG 858 A、PHE 856 A、ASP 855 A之间存在氢键相互作用。为进一步精准搜索出Docking结果,使用“Advanced Sort”过滤Docking结果。

点击“Advance Sort”,在弹出的界面中找到“IFP Filter”,热图中勾选如下三个氨基酸残基,选择“Must Include”,点击“Confirm”。

返回结果列表后,发现筛选出4个对接结果。

import_structure

  • Advance Sort:
    • Result Filter:根据Star、Score以及Rescore值的范围对Docking结果进行过滤;
    • Result Rank:根据Ligand Name、Star、Score以及Rescore对Docking结果进行排序;
    • IFP Filter:根据对接结果中配体与蛋白之间的相互作用过滤Docking结果;
      • Include/Must Include:Include代表当Docking结果包含所选的任意一种相互作用时,即保留该结果;Must Include代表Docking结果必须包含所选的所有的相互作用时,才保留该结果。
      • 热图:
        横轴为相互作用类型,纵轴为残基及其位数,图中的颜色深浅代表Docking结果中,配体与残基之间出现相互作用的频率。
        悬停至热图的小框中,显示的数字代表Docking结果中,存在该相互作用的结果数。|

4. 参考文献

[1] Yu Y, Cai C, Wang J, et al. Uni-dock: Gpu-accelerated docking enables ultralarge virtual screening[J]. Journal of Chemical Theory and Computation, 2023, 19(11): 3336-3345.

[2] Obst-Sander U, Ricci A, Kuhn B, et al. Discovery of novel allosteric EGFR L858R inhibitors for the treatment of non-small-cell lung cancer as a single agent or in combination with osimertinib[J]. Journal of medicinal chemistry, 2022, 65(19): 13052-13073.