买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:武汉科技大学
摘要:本发明公布了一种预测未知小分子配体靶点的方法及应用,先将具有相互作用且配体及蛋白质片段类型相同的配体‑蛋白质片段复合物归为一类,并基于蛋白质片段结构叠合该类配体‑蛋白质片段复合物,构建成该类的叠合模型,采用贝叶斯高斯混合模型对各类叠合模型的配体原子进行聚类,用表示出各类叠合模型中配体原子的空间分布,然后输入蛋白质片段与未知小分子配体的结合构象数据,并分类后,根据蛋白质片段与未知小分子配体每个原子之间的原子间距统计相互作用对数量,再基于上述空间分布的数据计算未知小分子配体与已求出的空间分布之间的距离,根据距离求出命中数N和命中率P,当N和P达到阈值时,判断蛋白质片段为未知小分子配体的靶点。
主权项:1.一种预测未知小分子配体靶点的方法,其特征在于,包括以下步骤:步骤1.将具有相互作用且配体原子类型相同并且蛋白质片段类型相同的配体-蛋白质片段复合物归为一类,对该类配体-蛋白质片段复合物进行三维坐标的转换,使该类中每个蛋白质片段能够置于同一三维空间坐标系下,再基于蛋白质片段结构叠合该类配体-蛋白质片段复合物,构建成该类的叠合模型,采用贝叶斯高斯混合模型对各类叠合模型中的蛋白质片段周围分布的配体原子进行聚类,删除聚类结果中配体原子数小于20的类,用95%置信椭球体表示各类叠合模型中未删除的配体原子的空间分布: 存储该空间分布中μx,μy,μz,σx,σy、σz,其中μx,μy,μz指各类叠合模型中未删除的所有配体原子分别在x,y,z轴坐标的平均值,σx,σy、σz指各类叠合模型中未删除的所有配体原子分别在x,y,z轴坐标的标准差,Dx,y,z是配体原子与95%置信椭球体之间的距离,x,y,z是配体原子的坐标:LIGAND:Xligand,Yligand,Zligand;步骤2.输入蛋白质片段与未知小分子配体的模拟结合构象数据,即含有蛋白质-未知小分子配体三维结构的文件数据,文件数据的格式为.pdb,该文件格式表示蛋白质和未知小分子配体空间结构的标准文件格式,包含在三维空间坐标系中每一个原子的坐标信息,其中模拟结合构象数据是使用分子模拟对接软件对接蛋白质片段与未知小分子配体产生的;步骤3.对步骤2中的结合构象数据进行处理:用SYBYL原子类型标记未知小分子配体的每个原子,将蛋白质拆分为蛋白质片段,每个蛋白质片段即一个氨基酸残基,氨基酸残基即自然界中20种标准氨基酸在相互结合后由肽键连接的氨基酸失水后剩余部分,从每个氨基酸残基的共价连接的重原子中取出3个重原子进行排列组合,每种3个重原子的排序组合为一种蛋白质片段分类,各蛋白质片段分类按氨基酸残基的名称及三个重原子的排列顺序进行命名,使每个蛋白质片段中3个重原子的排序不同,或重原子的种类不同,3个重原子中的每个原子是C、N、O、S中的一种;步骤4.计算蛋白质片段的3个重原子的排列顺序中的第一个原子与未知小分子配体每个原子之间的原子间距,若称为蛋白质片段与未知小分子配体原子为相互作用对,在所有相互作用对中统计配体原子类型相同并且蛋白质片段类型相同的各群组中配体-蛋白质片段复合物的数量记作M,将各群组的M个相互作用对中的配体-蛋白质片段复合物进行三维坐标的转换,使同类型的每个蛋白质片段能够置于同一三维空间坐标系下,根据各群组的M个相互作用对中蛋白质片段和未知小分子配体的原子类型搜索步骤1中类型对应的空间分布,并提取数值:μx、σx、μy、μz、σy、σz,同时基于各群组的转换后未知小分子配体原子的坐标,按式1计算各群组的未知小分子配体原子与步骤1已求出的95%置信椭球体之间的距离Dx,y,z,统计各群组中满足Dx,y,z≤1的配体-蛋白质片段复合物的总数为N,计算各群组的相互作用模式命中率:P=NM;步骤5.若步骤4的各群组中N≥600,P≥0.8,则该群组中的蛋白质片段为未知小分子配体的靶点。
全文数据:
权利要求:
百度查询: 武汉科技大学 一种预测未知小分子配体靶点的方法及应用
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。