跳到主要内容

Virtual Screening Workflow

简介

虚拟筛选在药物设计中具有重要作用,它可以提高药物研发效率、指导合成和优化、提高命中率、发现新的药物靶点以及进行药物再定位等。

Hermite平台的Virtual Screening Workflw模块提供了高通量虚拟筛选功能,集成了依据配体化学性质的过滤工具、四种限制性对接(H-Bond、Maximum Common Structure、Substructure、Shape)、基于对比学习算法粗筛配体的Uni-Clip、速度精度大大提升的分子对接工具Uni-Dock[1]、优化对接pose的Uni-Mol预训练模型以及计算结合自由能的MM PB/GBSA,您可全面快速地完成虚拟筛选相关工作。并且,依托于简单易上手的操作界面,您可以快速掌握计算机辅助药物设计中的虚拟筛选方法。此外,Hermite平台内置海量虚拟化合物库(2200w),您可以快速完成大化学空间的虚拟筛选任务。

σ2受体在增殖细胞和许多肿瘤中过表达,标记的σ2配体已被提出作为癌症诊断和治疗的工具。σ2受体也被认为是治疗中枢神经系统疾病的靶点。7M94为σ2受体与Roluperidone(一种σ2受体拮抗剂)的共晶配体[2],本教程基于该受体对数据库中的分子进行虚拟筛选。

本教程所需文件如下:

7M94_prep.pdb

pocket.txt

1. Virtual Screening Workflow

1.1 功能入口

左侧通用菜单栏Function → Virtual Screening → Virtual Screening Workflow。

弹出“MM PB/GBSA”窗口,点击“Yes”。

1.2 Select a Prepared Protein

点击“Select File”,上传本地文件“7M94_prep.pdb”;

上传的蛋白自动进入力场检查,待Valid处由“Processing”变成“Valid”后,点击“Next”。

注:力场检查不通过时,可通过右上角“Protein Preparation”进行蛋白准备。更多蛋白选择方式的操作说明,详见《蛋白及配体选择 》。

1.3 配体准备

非此处Database来源的配体,自动进入配体准备流程,详见《Ligand Preparation》。

1.3.1 Select Prepared Ligands From

点击“Select from Database”,弹出Select Ligands窗口 → 选择数据集“Specs”,点击“OK”。

点击“Next”。

注:在进行虚筛前,配体需要进行配体准备,包括生成同分异构体、加氢、质子化、能量最小化等。Hermite中的数据库中的配体已经过配体准备处理,因此选择“Database”中的配体数据集不进入配体准备的工作流。更多配体选择方式的操作说明,详见《蛋白及配体选择 》。

1.3.2 Filters Setting

根据化学性质的取值范围过滤配体,此处不设置。

化学性质含义
Molecular Weight分子质量
Lipid-Water Partition Coefficient脂水分配系数
Number of Hydrogen Bond Donors氢键供体数目
Number of Hydrogen Bond Acceptors氢键受体数目
Number of Rotatable Bonds可旋转键数目

1.4 Pocket Setting

点击“Select File”按钮,上传本地盒子文件“pocket.txt”。

注:其他盒子生成方式见下表,盒子体积不得小于1000ų。更多口袋设置方式的操作说明,详见《Pocket 》。

1.5 Constrained Docking

在本教程中,不需要基于条件限制进行对接,因此此处点击“No, skip this step”,跳过该步骤。

注:若您需要进行基于条件的限制对接,可参考下表:

Constrained Docking操作方式界面展示
H-Bond1) 选择“H-Bond”,Ligand Showed in 3D Workspace下拉选择参考配体,点击“Confirm”;
2)在3D Workspace窗口中选择与配体具有氢键相互作用的受体中的原子,选中的原子自动解析至右侧氢键受体和供体列表中
import_structure
import_structure
1)当配体与受体之间形成的某些氢键与分子活性相关时,可通过基于氢键限制的对接来筛选具有潜在活性的新分子
2)橙色虚线表示当前配体与受体之间存在的氢键相互作用
Maximum Common Substructure1)点击“Maximum Common Substructure”按钮,点击“Confirm”;
2)选择参考配体(即与受体具有合适结合模式的配体),上传好的配体会自动进入力场检查,检查通过后Valid列显示“Valid”,同时Structure View窗口中展示分子2D图
import_structure当您已知一个分子与受体的结合模式合适,需要从新的分子中筛选出与这种结合模式匹配的分子时,可以选择“Maximum Common Substructure”
Substructure1)点击“Substructure”按钮,点击“Confirm”;
2)选择参考配体(即具有特定子结构的配体),上传好的配体会自动进入力场检查,检查通过后Valid列显示“Valid”,同时Structure View窗口中展示分子2D图,选择需要的子结构后,点击“Save”保存该子结构
import_structureSubstructure选项提供了基于子结构筛选的分子对接,通过搜索出输入配体中包含特定子结构的配体,进一步与受体对接
Shape1)点击“Shape”按钮,点击“Confirm”;
2)选择参考配体(即具有特定形状的配体),上传好的配体会自动进入力场检查,检查通过后Valid列显示“Valid”,通过输入在原分子体积上的扩大比例确定需要形成的形状,点击右侧“Sync to 3D”将该形状显示于3D Workspace窗口
import_structure1)基于形状的虚拟筛选在骨架跃迁、生物异构体替代、虚拟库设计等方面具有重要意义,“Shape”选项提供了基于形状的虚拟筛选功
2)举例:比例设置为20%时,代表在原分子的体积上,扩大20%的范德华半径形成一个新的体积

1.6 Workflow Setting

勾选“Use Uni-Clip to retain ligands with the top 50% of rankings”,且将50%调整为70%;

勾选“1st:Fast Mode Docking”

Number of Results to Keep to 1st Docking处设置为Top Percent 20%;

其他参数默认;

勾选“2nd:Balance Mode Docking”

Number of Results to Keep to 1st Docking处设置为Top Percent 20%;

其他参数默认;

勾选“3rd:Detail Mode Docking”

Number of Results to Keep to 1st Docking处设置为Top Percent 20%;

其他参数默认;

勾选“Use Uni-Mol to optimize the resulting ligands' pose(s)”,优化对接构象;

勾选“Do rescoring”,打分函数选择“Gnina”;

MM PB/GBSA Setting保留默认参数;

Job Name处保留默认;

点击“Submit”提交任务。

参数意义
Uni-Clip一种基于对比学习算法的工具,根据训练得到的配体与靶标的关系,快速过滤构象不合适的配体是一种粗略的过滤方式,建议保留70%的结果
Fast/Balance/Detail Mode DockingFast:exhaustiveness 128 & max_step 20三种不同的搜索模式,本质上设置了不同的分子对接计算复杂度,Detail对搜索空间的覆盖更全面,且准确性最高,其次为Balance,最后是Fast
Balanced:exhaustiveness 384 & max_step 40
Detailed:exhaustiveness 512 & max_step 40
Number of Results to Keep to 1st/2nd/3rd Docking保留结果数,可选All/Top Number/Top Percent
Keep Multi Binding Poses for Each Ligand(每个配体生成多个构象)1)Number of Binding Pose,生成的构象个数,支持1~100;
2)Energy Range (kcal/mol):与最优结合模型相差的最大能量值,支持1~9
Scoring Function打分函数目前包括Vina、Vinardo、AutoDock4一般选择Vina
Uni-Mol使用Uni-Mol优化对接后的pose本质上是一种基于机器学习方法的限制性对接
Rescoring对对接构象进行重打分。重打分函数包括Vina(↓), Vinardo(↓), GNINA(↑), KarmaDock Affinity(↑), RTMScore(↑), Uni-Mol Affinity(↓), Uni-Score(↑)推荐使用Gnina

注:MM PB/GBSA参数说明详见《MM PB/GBSA》。

2. 结果分析

2.1 任务入口

左侧通用菜单栏Job → 该任务生成了四个结果文件:7M94_protein_prep_Clip、7M94_protein_prep_VSW、7M94_protein_prep_Rescore和7M94_protein_prep_GBSA。

注:Virtual Screening Workflow最多产生如下五类子任务:

Job类型说明
Ligand Prep当配体经过配体准备生成同分异构/构象,才产生该任务,当输入配体为平台提供的Database时则不产生该任务
Uni-Clip勾选Use Uni-Clip to retain ligands with the top 50% of rankings时产生该任务
VSW经过Fast、Balance和Detail搜索模式对接后的最终对接结果
Docking Rescore对接构象的重打分结果,勾选 Do Rescoring时产生该任务
MM PB/GBSA勾选MM PB/GBSA计算时产生该任务

2.2 Uni-Clip结果

7M94_protein_prep_Clip为使用Uni-Clip粗筛后的配体结果。

注:下载结果中包含一个表格文件,记录着Uni-Clip筛选出的配体结果,包含三列:Ligand ID、Ligand Name和Clip Score(Uni-Clip的打分值,越大越好)。

2.3 VSW结果展示

7M94_protein_prep_VSW为Uni-Clip粗筛后的配体通过三步分子对接后的结果,点击该任务Operation列中的Show显示该任务的结果。

对接结果默认按打分值进行排序,观察到Vina打分最低的pose的打分值为-12.724。

Docking Result表格说明:

列名含义
Rank根据打分函数值的pose排序VSW类型任务默认按照Score Function排序,Rescoring类型任务默认按照Rescoring排序
Stars标星——
Ligand Name配体名称——
Score经过Fast、Balance和Detail搜索模式对接后pose的打分值打分函数为最后一步搜索模式所选的打分函数
[Constrain Type] Score限制性对接的打分值当Constrained Docking处对配体进行条件限制性对接时,产生该列数据
[Rescore Function] RescoreRescoring打分函数值(+)代表该打分函数值越高越好,(-)表示值越低越好
OperationFix在3D Workspace中固定显示——
3D在3D Workspace中显示该配体——
Property查看性质信息——
Download下载该pose配体存为sdf格式

根据Rank排名,点击排名第一的pose右侧的3D按钮,将该pose展示于3D Workspace窗口中,并且可通过键盘上下键切换pose。合适的pose可打星。

配体以球棍模型显示,与配体具有相互作用的氨基酸残基以Line形式呈现,虚线表示相互作用,点击或悬停至虚线则于3D Workspce窗口左下角显示相互作用说明,不同的相互作用以不同的显色表示。

注:通过Show最多展示排名前3000的配体结果,全量数据可通过Job处的下载获取。

import_structure

Tyr150与配体之间的Pi-Pi Stacking相互作用与配体的活性具有潜在相关性,因此期望筛选出与蛋白之间具有该相互作用的pose,可通过如下操作实现:

点击“Advance Sort”,在弹出的界面中找到IFP Filter,热图中作如下选择,点击“Confirm”,筛选后的结果重新排列于结果表格中。

import_structure

注:Advance Sort可用来筛选pose,包含如下方式:

  • Result Filter:根据Star、Score以及Rescore值的范围对Docking结果进行过滤;

  • Result Rank:根据Ligand Name、Star、Score以及Rescore对Docking结果进行排序;

  • IFP Filter:根据对接结果中配体与蛋白之间的相互作用过滤Docking结果;

    • Include/Must Include:Include代表当Docking结果包含所选的任意一种相互作用时,即保留该结果;Must Include代表Docking结果必须包含所选的所有的相互作用时,才保留该结果。

    • 热图:横轴为相互作用类型,纵轴为残基及其位数,图中的颜色深浅代表Docking结果中,配体与残基之间出现相互作用的频率。悬停至热图的小框中,显示的数字代表Docking结果中,存在该相互作用的结果数。

2.4 Rescoring结果展示

7M94_protein_prep_Rescore是该任务的Rescoring结果,与7M94_protein_prep_VSW的差别在于结果列表中具有“Gnina Rescore(+)”列,并且结果表格默认按照“Gnina Rescore(+)”列打分值进行排序。

Rescoring提供了更加多样的打分函数,且由于打分方式的差异,虚筛结果会有较大差异。本教程的案例,当根据“Score”列进行重新排序后,结果如下,在这批分子中,Score(Vina)打分第一的pose使用Gnina打分仅排第39名。结合Rescoring,您可以更加全面地筛选出所需配体。

import_structure

2.5 MM PB/GBSA结果

MM PB/GBSA是计算配体与蛋白质受体之间的结合自由能的一个工具,它比大多数分子对接打分函数更准确。

7M94_protein_prep_GBSA是该任务的MM PB/GBSA计算结果,计算得到的结合自由能结果顺序如下图所示。点击右侧Operation下的3D,可将该pose展示于3D Workspace窗口中,根据ΔG Total值及分子构象,您可进一步筛选分子。

import_structure

MM PB/GBSA计算结果展示:

提供溶剂态、气态和总和3种维度的ΔG数据:

  • ΔGgas=ΔGMM+ΔGvdw+ΔGeleΔG_{gas}=ΔG_{MM}+ΔG_{vdw}+ΔG_{ele}

  • ΔGsol=ΔGploar+ΔGnonpolarΔG_{sol}=ΔG_{ploar}+ΔG_{nonpolar}

  • ΔG=ΔGgas+ΔGsolvΔG=ΔG_{gas}+ΔG_{solv}

  • ΔG=ΔGCOMΔGRECΔGLIGΔG=ΔG_{COM}-ΔG_{REC}-ΔG_{LIG}

注:详见《MM PB/GBSA》。

3. 参考文献

[1] Yu Y, Cai C, Wang J, et al. Uni-dock: Gpu-accelerated docking enables ultralarge virtual screening[J]. Journal of Chemical Theory and Computation, 2023, 19(11): 3336-3345.

[2] Alon A, Lyu J, Braz J M, et al. Structures of the σ2 receptor enable docking for bioactive ligand discovery[J]. Nature, 2021, 600(7890): 759-764.