上海文因互联信息技术有限公司张一博获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海文因互联信息技术有限公司申请的专利一种基于语义预测的结构化知识单元生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121029783B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511131610.X,技术领域涉及:G06F16/242;该发明授权一种基于语义预测的结构化知识单元生成方法及系统是由张一博;鲍捷;吴琳智设计研发完成,并于2025-08-13向国家知识产权局提交的专利申请。
本一种基于语义预测的结构化知识单元生成方法及系统在说明书摘要公布了:本发明涉及自然语言处理技术领域,尤其涉及一种基于语义预测的结构化知识单元生成方法,包括,响应结构化知识提取请求;接收原始非结构文档并将非结构文档切分为一个或多个语义文本块,计算对应的语义密度向量特征;调用训练好的语义信息产出率预测模型,根据每个语义密度向量特征预测每个结构化知识单元目标数量;根据预测的结构化知识单元目标数量,调用大型语言模型迭代生成候选结构化知识单元,同时对候选结构化知识单元进行语义去重,直至达到结构化知识单元目标数量或满足预设饱和条件时,输出知识单元结果集合。根据文本块的语义密度向量自适应调整生成策略,逐步饱和文档语义内容,确保目标数量的知识单元生成,并具有良好的扩展性。
本发明授权一种基于语义预测的结构化知识单元生成方法及系统在权利要求书中公布了:1.一种基于语义预测的结构化知识单元生成方法,其特征在于,包括: 响应结构化知识提取请求; 基于所述结构化知识提取请求接收原始非结构文档,并将所述非结构文档切分为一个或多个语义文本块,并计算每个所述文本块对应的语义密度向量特征,包括:对所述非结构文档按照预设语义切分策略进行切分,得到一个或多个语义完整的所述文本块,针对切分后的每个所述文本块提取对应的语义密度向量特征,所述语义密度向量特征的维度包括局部惊异度得分、嵌入轨迹散度得分、实体与概念密度得分、术语特异性得分中的任意一项或多项,以及片段位置和绝对长度; 调用训练好的语义信息产出率预测模型,根据每个所述语义密度向量特征预测每个结构化知识单元目标数量,包括:将每个所述语义密度向量特征输入至训练完成的所述语义信息产出率预测模型中,生成对应的语义信息产出率预测值;基于所述语义信息产出率预测值和所述文本块的所述绝对长度,计算所述文本块生成所述结构化知识单元目标数量;将所有所述文本块的所述结构化知识单元目标数量进行汇总获取所述非结构文档的整体语义信息产出目标数量;根据预测的所述结构化知识单元目标数量,启动自适应生成流程,调用大型语言模型迭代生成候选结构化知识单元,同时对所述候选结构化知识单元进行语义去重,直至达到所述结构化知识单元目标数量或满足预设饱和条件时,输出知识单元结果集合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海文因互联信息技术有限公司,其通讯地址为:200000 上海市浦东新区自由贸易试验区临港新片区环湖西二路888号C楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励