首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

信息抽取方法以及信息抽取模型训练方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:阿里巴巴(中国)有限公司

摘要:本说明书实施例提供信息抽取方法以及信息抽取模型训练方法,其中所述信息抽取方法包括:获取信息抽取任务的任务图像;对任务图像进行图像特征提取,获得任务图像特征;将任务图像特征输入信息抽取模型中的编码单元,获得任务编码特征,并将任务编码特征输入信息抽取模型中的解码单元,获得任务图像的文本抽取结果,其中,信息抽取模型基于样本图像特征训练得到,样本图像特征基于对样本掩码图像进行特征提取得到,样本掩码图像基于对样本图像中的文本内容进行掩码处理得到。通过对样本图像中的文本内容进行掩码处理后训练模型,使得模型可以理解图像特征和文本上下文内容,实现了高精度信息抽取。

主权项:1.一种信息抽取方法,包括:获取信息抽取任务的任务图像;对所述任务图像进行图像特征提取,获得任务图像特征;将所述任务图像特征输入信息抽取模型中的编码单元,获得任务编码特征,并将所述任务编码特征输入所述信息抽取模型中的解码单元,获得所述任务图像的文本抽取结果,其中,所述信息抽取模型包括所述编码单元、实体预测单元和所述解码单元,所述实体预测单元包括实体区域预测单元、实体内容预测单元和实体块预测单元;所述信息抽取模型基于样本预测结果和实体预测结果调整初始抽取模型的模型参数得到;所述样本预测结果通过将样本编码特征输入所述解码单元获得,所述样本编码特征通过将样本图像特征输入所述编码单元获得,所述样本图像特征基于对样本掩码图像进行特征提取得到,所述样本掩码图像基于对样本图像中的文本内容进行掩码处理得到;所述实体预测结果包括实体区域预测结果、实体内容预测结果和实体块预测结果;所述实体区域预测结果,通过将所述样本编码特征输入所述实体区域预测单元获得,所述实体内容预测结果通过将所述样本编码特征输入所述实体内容预测单元获得,所述实体块预测结果通过将所述样本编码特征输入所述实体块预测单元获得。

全文数据:

权利要求:

百度查询: 阿里巴巴(中国)有限公司 信息抽取方法以及信息抽取模型训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。