一种古籍文档顺序检测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华南理工大学

摘要：本发明公开了一种古籍文档顺序检测方法,包括：获取图像数据，基于图像数据进行各个字符的连接顺序标注以及整个文档的文本行顺序标注，获得训练数据集；基于训练数据集，通过空间几何关系构造图的邻接矩阵，构造图中各个结点的特征以及边特征，训练字符连接关系预测模型，得到将字符连接后的文本行；基于训练数据集，通过编码‑解码的序列模型，构建并训练文本行顺序预测模型，获得文本行顺序预测结果；根据图像数据，基于训练字符连接关系预测模型和训练文本行顺序预测模型，获得图像数据的符合阅读顺序的文档内容。本发明针对密集字符型的文档图片，基于字符检测结果进行顺序检测，提出包括单字连接关系预测模型以及文本行顺序预测模型。

主权项：1.一种古籍文档顺序检测方法，其特征在于，包括：获取图像数据，基于所述图像数据进行各个字符的连接顺序标注以及整个文档的文本行顺序标注，获得训练数据集；基于所述训练数据集，通过空间几何关系构造图的邻接矩阵，构造图中各个结点的特征以及边特征，训练字符连接关系预测模型，得到将字符连接后的文本行；基于所述训练数据集，通过编码-解码的序列模型，构建并训练文本行顺序预测模型，获得文本行顺序预测结果；根据所述图像数据，基于字符连接关系预测模型和文本行顺序预测模型，获得图像数据的符合阅读顺序的文档内容；构建字符连接关系预测模型包括：通过计算各个字符结点的L2距离，对于每个字符结点找到最近的8个字符结点，构造k阶子图网络，基于各个字符的几何结构，构造图的结点特征以及边特征，基于空间几何关系构造图的邻接矩阵，训练得到基于字符结点的连接关系图网络预测模型；构建字符连接关系预测模型还包括阈值，所述阈值用于判断所述图像数据能否进行训练；基于空间L2距离，构造每个结点的8邻域子图，计算节点数目的IoU，当IoU大于阈值则图像数据不进行训练，反之则进行训练；所述编码-解码的序列模型包括：基于文本行的版面坐标信息以及位置编号信息，通过Transformer模型得到编码后的特征序列，通过Decoder添加分类分支，预测各个时间步对应输入序列的索引，根据各个时间步的预测结果，基于交叉熵损失计算损失训练编码-解码的序列模型。

全文数据：

权利要求：

百度查询：华南理工大学一种古籍文档顺序检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：可重构射频波形的无线充电

下一篇：一种长链二元酸的生产方法

相关技术

可重构射频波形的无线充电

一种长链二元酸的生产方法

一种提高N型TOPCon电池烘干效果的方法、N型TOPCon电池及制备方法

一种热压装置和电池生产设备

用于太阳能领域的DC功率转换和传输的系统和方法

时序预测方法和装置

一种发光结构及发光器件

一种异辛烷抗静电剂加注装置及加注工艺

一种新材料双扇防护密闭门

一种焊接机器人预测性维护方法、系统、介质及设备

一种MIMO-PLC的信道特征提取方法

聚芳烷基交联改性聚苯并咪唑阴离子交换膜及其制备方法和应用

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种古籍文档顺序检测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务