北京领初医药科技有限公司刘萍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京领初医药科技有限公司申请的专利一种基于大语言模型与术语库的医药文献翻译方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121234957B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511678905.9,技术领域涉及:G06F40/58;该发明授权一种基于大语言模型与术语库的医药文献翻译方法是由刘萍;王国庆;邓晨辉;胡玉芳设计研发完成,并于2025-11-17向国家知识产权局提交的专利申请。
本一种基于大语言模型与术语库的医药文献翻译方法在说明书摘要公布了:本发明涉及医药文献翻译技术领域,尤其涉及一种基于大语言模型与术语库的医药文献翻译方法;包括以下步骤:S1、读取待翻译文档,得到文档对象模型DOM;S2、筛选出文档对象模型中的特殊格式;S3、构建翻译数据库,翻译数据库包括术语库、记忆库和缩略语库,使用Aho‑Corasick自动机和向量索引技术,将待翻译文档与翻译数据库进行匹配,针对每个翻译数据库都得到对应的匹配结果;S4、使用AI系统,将S3步骤的匹配结果提供给AI系统作为参考,完成待翻译文档的翻译,得到译文;S5、在S4步骤翻译的译文中,对S2步骤筛选出的特殊格式,进行格式还原,本发明可以提高医药文献翻译的准确性和专业性。
本发明授权一种基于大语言模型与术语库的医药文献翻译方法在权利要求书中公布了:1.一种基于大语言模型与术语库的医药文献翻译方法,其特征在于,包括以下步骤: S1、读取待翻译文档,得到文档对象模型DOM; S2、筛选出文档对象模型中的特殊格式;步骤S2筛选的特殊格式包括但域、上下标;步骤S2筛选特殊格式的具体方法为: S21、遍历根节点树,收集多个段落树,然后解析每个段落树,收集最小格式单元树,每个段落树包括多个最小格式单元树; S22、根据每个段落树对应的最后一个最小格式单元树对应的标签名称,得到该段落树的类型; S23、根据每个段落树对应的最小格式单元树,根据最小格式单元树中w:rPr节点数的内容,确定段落树的样式; S24、根据每个段落树对应的最小格式单元树,读取其中节点树的内容,表示为:w:tXXXw:t,其中,XXX表示节点树的内容; S25、根据确定的类型、样式和内容,解析每个段落,确定域的位置,同时收集域之外的段落内容;按照先后顺序将域的内容和其他段落内容进行排序存放,形成阅读序; S26、遍历阅读序的节点数组,对上下角标节点进行处理,把查找到的vertAlign字符串前面的先导字符识别出来,在逻辑上进行切分和聚合; S27、汇总域的位置和上下标的位置; S3、构建翻译数据库,翻译数据库包括术语库、记忆库和缩略语库,使用Aho-Corasick自动机,将待翻译文档与术语库和缩略语库进行匹配,使用向量索引技术,将待翻译文档与记忆库进行匹配,得到匹配结果; S4、使用AI系统,将S3步骤的匹配结果提供给AI系统,完成待翻译文档的翻译,得到译文;包括以下步骤: S41、对待翻译文档的段落进行结构化处理,为每个段落构建包含段落标识、原文内容和译文字段的结构化数据体; S42、构建包含段落合并指令的结构化提示词,所述结构化提示词中定义了待合并段落的合并规则,所述合并规则指示将合并后的译文存储在被合并段落组中具有最小段落标识的段落的译文字段中,其余被合并段落的译文字段设置为空; S43、根据S3步骤匹配的结果,将包含所有段落结构化数据体、合并指令的结构化提示词通过单次API调用发送至主用模型中,获取包含段落合并处理结果的译文; S5、在S4步骤翻译的译文中,对S2步骤筛选出的特殊格式,进行格式还原;步骤S5具体包括以下步骤: S51、将每个特殊格式都设为一个需要还原格式的对象,对每个需要还原格式的对象进行排序,按照在译文出现的顺序,重新调整顺序; S52、查找段落内的文字节点,作为译文容器,并设置为译文内容,除了译文容器之外的节点清空文字,保持DOM树结构不变; S53、遍历每个需要还原格式的对象,输出每个对象的匹配结果; S54、当匹配结果为“无”时,将该对象从DOM树中移除,当匹配结果为“有”时,分情况进行格式还原; S55、重复S51-S54,完成全部的格式还原。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京领初医药科技有限公司,其通讯地址为:101100 北京市通州区经济开发区东区靓丽三街9号-229;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励