恭喜广州科奥信息技术股份有限公司刘国兴获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜广州科奥信息技术股份有限公司申请的专利一种稿件预处理方法、装置、电子设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114863460B 。
龙图腾网通过国家知识产权局官网在2025-04-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210617158.8,技术领域涉及:G06V30/416;该发明授权一种稿件预处理方法、装置、电子设备和存储介质是由刘国兴;邱国超;杨双林;邹国恒;吕铭方设计研发完成,并于2022-05-31向国家知识产权局提交的专利申请。
本一种稿件预处理方法、装置、电子设备和存储介质在说明书摘要公布了:本发明公开了一种稿件预处理方法、装置、电子设备和存储介质,稿件预处理方法包括:将待处理稿件的内容转换为图像得到第一图像,图像中待处理稿件的内容的每个段落的文本区域的像素值为指定像素值;从第一图像中截取第二图像,第二图像为每个段落的第一个文本的最小外接矩形区域所对应的图像。将第一图像和第二图像输入预先训练好的稿件预处理模型中,则可以得到待处理稿件的各个段落属于各个文本要素的概率和属于各个文本格式的概率,根据各个段落属于各个文本要素的概率和属于各个文本格式的概率生成待处理稿件的预处理信息,相比于人工审核识别,可以更加快速、简单、准确,可有效提高稿件审核的效率,同时方便审稿人审稿。
本发明授权一种稿件预处理方法、装置、电子设备和存储介质在权利要求书中公布了:1.一种稿件预处理方法,其特征在于,包括:将待处理稿件的内容转换为图像得到第一图像,所述图像中所述待处理稿件的内容的每个段落的文本区域的像素值为指定像素值;从所述第一图像中截取第二图像,所述第二图像为每个段落的第一个文本的最小外接矩形区域所对应的图像;将所述第一图像和所述第二图像输入预先训练好的稿件预处理模型中,得到所述待处理稿件的各个段落属于各个文本要素的概率和属于各个文本格式的概率;根据各个段落属于各个文本要素的概率和属于各个文本格式的概率生成所述待处理稿件的预处理信息;所述根据各个段落属于各个文本要素的概率和属于各个文本格式的概率生成所述待处理稿件的预处理信息,包括:确定各个所述段落的最大概率的文本要素,得到所述待处理稿件的文本要素集合;判断所述文本要素集合是否包含预设的多个指定文本要素;若是,确定所述待处理稿件的文本要素完整;若否,从多个指定文本要素中查找出所述文本要素集合中不存在的文本要素作为所述待处理稿件的缺失文本要素,并生成文本要素缺失信息;针对每个所述段落,获取所述段落的最大概率的文本要素对应的预设文本格式;获取所述段落的最大概率的文本格式;判断所述最大概率的文本格式是否是所述预设文本格式;若是,则确定所述段落的文本格式正确;若否,则确定所述段落的文本格式错误,并生成文本格式错误信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州科奥信息技术股份有限公司,其通讯地址为:510000 广东省广州市黄埔区广州国际生物岛寰宇一路27号1001房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。