买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京来也网络科技有限公司;来也科技(北京)有限公司
摘要:本公开提供了一种结合RPA和AI的表格生成方法、装置、电子设备及存储介质,涉及人工智能领域。该方案为:由RPA系统执行,RPA系统从图像中基于人工智能AI提取第一表格的横线和竖线;RPA系统获取横线与竖线的交点集合,其中,交点集合中包括由横线和竖线相交而成的第一类交点,以及横线的延长线和或竖线的延长线相交而成的第二类交点;RPA系统根据交点集合生成与第一表格一致的空白的第二表格;RPA系统将从图像中基于OCR识别出的文本条目,填充至空白的第二表格中,得到目标表格。本公开运用RPA技术,识别图片中的表格,并将其还原为拥有相同表格结构的表格文档,自动地将线下数据转化为线上数据,取代了繁琐的人工处理流程,提高了表格生成的效率。
主权项:1.一种结合RPA和AI的表格生成方法,其特征在于,由RPA系统执行,所述方法包括:所述RPA系统从图像中基于人工智能AI提取第一表格的横线和竖线;所述RPA系统获取所述横线与所述竖线的交点集合,其中,所述交点集合中包括由所述横线和所述竖线相交而成的第一类交点,以及所述横线的延长线和或所述竖线的延长线相交而成的第二类交点;所述RPA系统根据所述交点集合生成与所述第一表格一致的空白的第二表格;所述RPA系统将从所述图像中基于光学字符识别ORC识别出的文本条目,填充至所述空白的第二表格中,得到目标表格;所述RPA系统根据所述交点集合生成与所述第一表格一致的空白的第二表格,包括:所述RPA系统根据所述交点集合中的交点对单元进行枚举,获取候选单元格和所述候选单元格的属性信息;所述RPA系统对枚举的所有候选单元格,按照单元格面积从小到大进行排序;所述RPA系统按序对所述候选单元格进行遍历,对遍历到的目标候选单元格的存在性进行判断;所述RPA系统每当判断出所述目标候选单元格存在,则从未遍历到的所述候选单元格中删除与所述目标候选单元格存在重叠的单元格,并将判断出存在的所述目标候选单元格确定为一个目标单元格;所述RPA系统对删除后未遍历到的所述候选单元格继续按序遍历,直至遍历结束得到所有的所述目标单元格;所述RPA系统对所述目标单元格按照位置排布生成所述空白的第二表格。
全文数据:
权利要求:
百度查询: 北京来也网络科技有限公司 来也科技(北京)有限公司 结合RPA和AI的表格生成方法、装置、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。