之江实验室胡斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉之江实验室申请的专利一种参数数据提取方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121480449B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610027425.4,技术领域涉及:G06F40/103;该发明授权一种参数数据提取方法及装置是由胡斌;王冰花;王海平;葛海文;曹永乐;熊军;泸艺鸣;魏一雄设计研发完成,并于2026-01-09向国家知识产权局提交的专利申请。
本一种参数数据提取方法及装置在说明书摘要公布了:本申请提供一种参数数据提取方法及装置,涉及人工智能技术领域,该方法能够实现对包含PDF文件在内的描述文件进行统一的图像化处理,并基于目标区域的内容类型标签与参数类别信息,结合多模态大模型的图文对齐能力,自动、准确地提取待提取对象在多种目标数据类别下的参数数据,有效提高数据提取的精确度和完整度,提高跨模态融合能力。
本发明授权一种参数数据提取方法及装置在权利要求书中公布了:1.一种参数数据提取方法,其特征在于,所述方法包括: 获取待提取对象的描述文件,并将所述描述文件转换为图像数据;所述描述文件包括可携带文档格式PDF文件; 从所述图像数据中识别出至少一个目标区域,并确定所述目标区域对应的内容类型标签;所述内容类型标签包括表格和或图片; 针对任一目标区域,从待提取对象的多种参数类别中,确定出所述目标区域内包含的至少一种目标参数类别; 将所述目标区域、所述目标区域对应的内容类型标签以及所述目标区域对应的目标参数类别输入至多模态大模型,得到所述多模态大模型输出的、所述待提取对象在各种目标数据类别下的参数数据; 所述多模态大模型用于: 基于所述目标区域对应的内容类型标签、所述目标区域对应的目标参数类别以及预先输入的任务描述信息,对所述目标区域进行多模态对齐语义分析,得到语义分析信息; 基于所述任务描述信息以及所述语义分析信息,输出所述待提取对象在各种目标数据类别下的参数数据; 所述多模态大模型包括文本子模型、视觉子模型以及多模态对齐子模型; 所述文本子模型用于对所述描述文件进行文本提取,得到所述描述文件对应的文本信息;对所述文本信息进行清洗、去噪以及段落划分,得到所述文本信息对应的多个文本块;基于所述任务描述信息,从所述文本块中检索与所述任务描述信息相关的目标文本块;所述目标文本块用于为所述多模态对齐子模型提供上下文信息; 所述视觉子模型用于对所述目标区域中的图像进行语义分析; 所述多模态对齐子模型用于基于所述目标文本块以及图像的语义分析信息进行多模态对齐与融合; 所述方法还包括: 在所述多模态对齐子模型输出多模态对齐与融合后的参数数据之前,通过图文一致性检测确定所述目标区域的语义可信度; 在所述语义可信度低于阈值的情况下,通过跨区域对比机制重新进行多模态对齐与融合;所述跨区域对比机制用于在所述目标区域的语义可信度不足时,选取与其具有空间或语义关联的其他区域进行对比,得到参考数据;所述参考数据用于重新进行多模态对齐与融合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人之江实验室,其通讯地址为:311121 浙江省杭州市余杭区文一西路2880号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励