Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜北京外国语大学任佳伟获国家专利权

恭喜北京外国语大学任佳伟获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜北京外国语大学申请的专利融合多策略分句与语义聚类的大模型知识增强方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118069837B

龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410113900.0,技术领域涉及:G06F16/35;该发明授权融合多策略分句与语义聚类的大模型知识增强方法及装置是由任佳伟;李佐文;邹积凯;李娜;王子晗;王玉玲;孙尚设计研发完成,并于2024-01-27向国家知识产权局提交的专利申请。

融合多策略分句与语义聚类的大模型知识增强方法及装置在说明书摘要公布了:本发明公开了一种融合多策略分句与语义聚类的大模型知识增强方法及装置,该方法包括:获取用户本地文档和用户输入问题,分别进行有害信息判断;当用户本地文档的读取内容无害时,进行预处理,采用多策略分句方式进行多策略切分;当用户输入问题无害时,分别对用户输入问题和经多策略切分的用户本地文档内容,进行词嵌入向量化操作;对经过向量化的用户输入问题与用户本地文档内容进行向量相似度计算;基于语义聚类的搜索增强方式选取部分的最相似向量,将其对应的文档分句进行相应扩充作为最终结果进行输出。该方法可提高对大模型进行知识增强的用户本地文档信息召回的准确率,适用于对大模型知识问答准确率较高的教育领域、法律领域和医药领域。

本发明授权融合多策略分句与语义聚类的大模型知识增强方法及装置在权利要求书中公布了:1.一种融合多策略分句与语义聚类的大模型知识增强方法,其特征在于,包括以下步骤:步骤1:获取用户本地文档和用户输入问题;步骤2:对所述用户本地文档进行内容读取;步骤3:对所述用户本地文档的读取内容和所述用户输入问题,进行有害信息判断;步骤4:当判断所述用户本地文档的读取内容无害时,进行预处理;步骤5:将预处理后的所述用户本地文档的读取内容,采用多策略分句方式进行多策略切分;步骤6:当判断所述用户输入问题无害时,分别对所述用户输入问题和经多策略切分的用户本地文档内容,进行词嵌入向量化操作;步骤7:对经过向量化的所述用户输入问题与用户本地文档内容进行向量相似度计算;步骤8:基于语义聚类的搜索增强方式选取部分的最相似向量,将其对应的文档分句进行相应扩充作为最终结果进行输出;其中,所述步骤5包括:将预处理后的所述用户本地文档的读取内容,采用基于句子标点符号的分句法、基于句子语义结构的分句法和基于实体扩延的分句法,进行多策略切分;其中,基于实体扩延的分句法进行多策略切分,包括:S41:获取预处理后的所述用户本地文档的读取内容;S42:基于文档内标点符号对文档进行拆分;S43:分别对切分的句子进行命名实体识别;S44:对当前句子是否为文档首句进行判断,若当前句子为该文档的首句时,将直接切分该句;若当前句子为非文档首句时,将根据切分的句子中所包含的实体情况分别对句子进行处理:S45:分别对文档中的句子进行切分和合并,直至完成文档所有句子的切分和处理;所述步骤8包括:1:根据向量相似度计算后的得到序列:fn=[f1,f2,f3,...,fn]其中,序列fn的长度为N,f1,f2,…,fn为向量化的所述用户输入问题分别与向量化的用户本地文档内容,经过语义相似度计算后得到的相似度值;2:设有进行数据增强运算的函数序列gm: 其中,gm的序列长度为M,且M为奇数,表示临近句子与中心句子语义关联程度的权重值,g1,g2,……,gm代表次临近句子与中心句子语义相关联程度的权重值;3:将相似度计算结果序列fn与gm进行类卷积运算,得到序列sn: 其中,n的范围为n∈[0,N-1],m的取值范围为N为相似度计算结果序列fn的长度,M为序列函数gm的长度;4:分别对文档中的分句完成算法的计算,至此得到经过搜索增强算法的最终的分句的相似度计算结果;根据所述相似度计算结果,将其对应的文档分句进行相应扩充作为最终结果进行输出。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京外国语大学,其通讯地址为:100089 北京市海淀区西三环北路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。