Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 森瑞斯生物科技(深圳)有限公司曾梓硕获国家专利权

森瑞斯生物科技(深圳)有限公司曾梓硕获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉森瑞斯生物科技(深圳)有限公司申请的专利一种基于大型预训练模型的新型抗菌肽设计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116741275B

龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310731546.3,技术领域涉及:G16B30/00;该发明授权一种基于大型预训练模型的新型抗菌肽设计方法是由曾梓硕;许薷方;罗小舟设计研发完成,并于2023-06-20向国家知识产权局提交的专利申请。

一种基于大型预训练模型的新型抗菌肽设计方法在说明书摘要公布了:本发明公开了一种基于大型预训练模型的新型抗菌肽设计方法,属于生物信息学和人工智能的交叉领域。所述方法利用更大规模的预训练生成式模型ProtGPT2生成新型抗菌肽,生成出来的序列更能体现蛋白质中氨基酸残基间的功能和结构关系,且利用另一个大型预训练蛋白质模型来对蛋白质进行特征提取,在进行特征提取时,先用字符转换器将多肽序列转化成数字字符串,再用特征提取器将这些数字字符串转化成N×L×1024的阵列,因此只需一个判别器,简化了筛选条件,且具有较高的准确率。

本发明授权一种基于大型预训练模型的新型抗菌肽设计方法在权利要求书中公布了:1.一种基于大型预训练模型的新型抗菌肽设计方法,其特征在于,所述方法包括: 步骤1,获取训练样本;其中,以已知抗菌肽的序列作为正样本,无抗菌效果的短链多肽序列作为负样本,且保证正负样本中包含同样数量氨基酸的多肽的数量对应相同; 步骤2,以ProtGPT2作为蛋白质生成模型,并采用深度卷积神经网络作为判别器以构成大型预训练模型ProtTransProtT5-XL-UniRef50; 步骤3,对蛋白质生成模型ProtGPT2进行微调,并利用微调后的模型生成预定数量的多肽,记为微调过生成的多肽;利用微调前的蛋白质生成模型ProtGPT2生成预定数量的多肽,记为未微调过生成的多肽; 步骤4,对所述训练样本、微调过生成的多肽以及未微调过生成的多肽利用大型预训练模型ProtTransProtT5-XL-UniRef50进行特征提取; 步骤5,利用已进行特征提取的正样本和负样本序列训练所述判别器; 步骤6,利用训练好的判别器预测步骤3中得到的微调过生成的多肽,根据预测值筛选出最有可能是抗菌肽的候选序列; 步骤7,根据候选序列化学合成得到新型抗菌肽; 所述步骤4进一步包括: 用Python编程语言里的transformers工具包里的T5Tokenizer.from_pretrained函数设置字符转化器,用TFT5EncoderModel.from_pretrained函数设置特征提取器,字符转化器和特征提取器的模型来源均为Rostlabprot_t5_xl_uniref50;特征提取器对多肽的最大提取长度设为50; 先用字符转换器将多肽序列转化成数字字符串,再用特征提取器将这些数字字符串转化成N×L×1024的阵列,其中,N为序列数量,L为最大序列长度50,1024为单个氨基酸残基的向量表示长度,将提取到的特征作为所述深度神经网络的输入; 所述步骤5进一步包括: 用已作特征提取的正样本和负样本序列训练判别器,该判别器的架构为深度卷积神经网络,所述深度卷积神经网络的先后层级包括:输入层,3×3的卷基层,2×2的最大值抓取层,3×3的卷基层,2×2的最大值抓取层,扁平化层,三层全连接层,以及输出节点; 所述神经网络由Python里的Keras工具包实现,优化器为Adam,其中learningrate为0.001,损失函数为binarycrossentropy,评价方式为准确度,特征X为所述步骤4提取到的特征,标签y为正负样本里是否抗菌肽; 用Keras模型对象里的fit函数对X和y进行神经网络的训练;训练过程中,将训练集以9:1方式分割训练集和验证集;最大训练轮数设置为75,并用Keras里的EarlyStopping函数设置提早退出机制,耐心值设置为6,即如果六轮训练内损失值没有降低,则提早结束训练; 用事先预留的验证集对训练好的判别器进行测试,用Keras模型对象里的evaluate函数评估准确度;随后用Keras模型对象里的predict函数对随机阴性对照和未微调过生成的多肽也进行预测,来评估生成模型微调前后的改变; 所述步骤6进一步包括: 根据预测值来筛选候选多肽序列,并随机挑选候选序列,进行编号,以供实验验证;按照上述挑选出的候选序列的长度分布及氨基酸分布,随机生成一组多肽序列作为阴性对照。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人森瑞斯生物科技(深圳)有限公司,其通讯地址为:518067 广东省深圳市南山区招商街道沿山社区南海大道1019号南山医疗器械产业园A、B座B402;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。