买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:易联云计算(杭州)有限责任公司;金卡智能集团(杭州)有限公司
摘要:本申请公开了一种支持多语言知识库的检索增强生成方法和系统,所述方法包括:获取待处理文档;识别待处理文档的语种类别,待处理文档包含第一语种的文本,且,第一语种的文本在待处理文档中的占比最大;利用针对第一语种的文档拆分模型对待处理文档进行拆分,以获得复数个文本片段;识别第一文本片段中的语种类别,第一文本片段包含第二语种的文本,且,第二语种的文本在第一文本片段中的占比大于预设阈值,第二语种与第一语种相同或者不同;将第一文本片段存储至与第二语种相对应的语种知识库中。本申请能够更好地保留文本片段的语义完整性,提升文本理解效果,大幅提升了对多语言文档处理的准确性和效率。
主权项:1.一种支持多语言知识库的检索增强生成方法,其特征在于,所述方法包括以下步骤:获取待处理文档;识别所述待处理文档的语种类别,所述待处理文档包含第一语种的文本,且,所述第一语种的文本为在所述待处理文档中的占比最大的语种文本;利用针对所述第一语种的文档拆分模型对所述待处理文档进行拆分,以获得复数个文本片段;识别第一文本片段中的语种类别,所述第一文本片段包含第二语种的文本,且,所述第二语种的文本在所述第一文本片段中的占比大于预设阈值,所述第二语种与所述第一语种相同或者不同;将所述第一文本片段存储至与所述第二语种相对应的语种知识库中。
全文数据:
权利要求:
百度查询: 易联云计算(杭州)有限责任公司 金卡智能集团(杭州)有限公司 支持多语言知识库的检索增强生成方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。