内蒙古师范大学董杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉内蒙古师范大学申请的专利一种古籍算表识别评价方法、系统及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120126162B 。
龙图腾网通过国家知识产权局官网在2025-12-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510197844.8,技术领域涉及:G06V30/412;该发明授权一种古籍算表识别评价方法、系统及电子设备是由董杰;李艳玲;郭浩林;杨承;白胡日查;王志伟设计研发完成,并于2025-02-21向国家知识产权局提交的专利申请。
本一种古籍算表识别评价方法、系统及电子设备在说明书摘要公布了:本发明公开了一种古籍算表识别评价方法、系统及电子设备,涉及古籍算表识别技术领域,本发明包括:S1.由工作人员上传古籍算表及其对应的特征集合,并确定古籍算表的自识别模型;S2.从古籍算表随机选取若干训练样本输入到自识别模型中,输出古籍算表的客观识别信息,并将古籍算表的若干训练样本分配给识别人员,由识别人员输出古籍算表的主观识别信息;S3.评价古籍算表的自识别模型的识别指标,确定古籍算表的自识别模型的优化方向,并将古籍算表的自识别模型的优化方向进行显示,本发明避免造成自识别模型的资源浪费,也提高古籍算表的识别效率,本发明确保了古籍算表在文字识别、数值识别等的精度。
本发明授权一种古籍算表识别评价方法、系统及电子设备在权利要求书中公布了:1.一种古籍算表识别评价方法,其特征在于,包括: S1.由工作人员上传古籍算表及其对应的特征集合,并确定古籍算表的自识别模型; 所述自识别模型包括图像处理方法和识别方法的搭配; 所述确定古籍算表的自识别模型,其具体确定过程为: S100、通过图像识别技术识别古籍算表的缺陷参数; 所述缺陷参数为缺陷总体表征参量; S101、将古籍算表的缺陷参数补充到古籍算表的特征集合中,得到古籍算表的更新特征集合; S102、将古籍算表的更新特征集合与web数据仓中存储的古籍算表的难易程度划分表进行对比,经匹配得到古籍算表的难易程度; S103、将古籍算表的难易程度与web数据仓中存储的古籍算表的各难易程度对应的自识别模型进行对比,经匹配得到古籍算表的自识别模型; S2.从古籍算表随机选取若干训练样本输入到自识别模型中,输出古籍算表的客观识别信息,并将古籍算表的若干训练样本分配给识别人员,由识别人员输出古籍算表的主观识别信息; 所述客观识别信息包括若干训练样本的文本数据集、数值数据集、符号数据集和算表结构数据集; 所述主观识别信息包括若干训练样本的文本数据集、数值数据集、符号数据集和算表结构数据集; S3.评价古籍算表的自识别模型的识别指标,确定古籍算表的自识别模型的优化方向,并将古籍算表的自识别模型的优化方向进行显示; 所述评价古籍算表的自识别模型的各级识别指标,其具体实现步骤为: S300、基于古籍算表的客观识别信息和主观识别信息,以某训练样本为指定样本,确定古籍算表的指定样本的第一识别指标、第二识别指标、第三识别指标和第四识别指标 所述确定古籍算表的指定样本第一识别指标,其具体确定方法为: 从古籍算表的指定样本的客观识别信息中提取文本数据集中的表头关键字集合和各单元格的关键字集合,并从古籍算表的指定样本的主观识别信息中提取文本数据集中的表头关键字集合和各单元格的关键字集合; 通过集合相似度算法,计算得到古籍算表的指定样本的客观识别信息中表头关键字集合与主观识别信息中表头关键字集合的相似度,作为古籍算表的指定样本的表头识别准确度; 通过集合相似度算法,计算得到古籍算表的指定样本的客观识别信息中各单元格的关键字集合与对应单元格的关键字集合的相似度,作为古籍算表的指定样本的各单元格的识别准确度,若某单元格的识别准确度小于单元格识别准确度阈值,则将该单元格记为异质单元格,筛选古籍算表的指定样本的各异质单元格; 汇总古籍算表的指定样本的异质单元格的数量和单元格的总数量,并将其与古籍算表的指定样本的表头识别准确度导入到第一识别指标模型中,输出古籍算表的指定样本的第一识别指标; 所述古籍算表的指定样本的第二识别指标具体是通过集合相似度算法,计算古籍算表的客观识别信息中数值数据集与主观识别信息中数值数据集的相似度,作为古籍算表的第二识别指标; 所述确定古籍算表的指定样本的第三识别指标,其具体确定方法为: 从古籍算表的指定样本的客观识别信息中提取符号数据集中的运算符号集合、表格分隔符号集合,并从古籍算表的指定样本的主观识别信息中提取符号数据集中的运算符号集合、表格分隔符号集合; 通过集合相似度算法,计算古籍算表的指定样本的客观识别信息中运算符号集合与主观识别信息中运算符号集合的相似度,作为古籍算表的指定样本的运算符号识别准确度,同理,计算得到古籍算表的指定样本的表格分隔符号识别准确度; 将古籍算表的运算符号识别准确度和表格分隔符号识别准确度导入到第三识别指标模型中,输出古籍算表的指定样本的第三识别指标,式中、分别表示为web数据仓中存储的运算符号识别准确度阈值、表格分隔符号识别准确度阈值,、分别为逻辑符号且、或; 所述确定古籍算表的指定样本的第四识别指标,其具体确定方法为: 从古籍算表的指定样本的客观识别信息中提取算表结构数据集的行数、列数、各合并单元格和各拆分单元格,并从古籍算表的指定样本的主观识别信息中提取算表结构数据集的行数、列数、各合并单元格和各拆分单元格,分别记为古籍算表的参考行数、参考列数、各参考合并单元格和各参考拆分单元格; 比对分析得到古籍算表的指定样本的行数偏差值、列数偏差值、各偏差合并单元格和各偏差拆分单元格,汇总得到古籍算表的指定样本的偏差合并单元格的数量和偏差拆分单元格的数量; 汇总得到古籍算表的指定样本的参考合并单元格的数量和参考拆分单元格的数量,经数值处理得到古籍算表的指定样本的第四识别指标,所述第四识别指标包含0和1的数值; S301、以此类推,得到古籍算表的各训练样本的第一识别指标、第二识别识别指标、第三识别指标和第四识别指标,并将其进行均值处理,得到古籍算表的第一识别指标均值、第二识别指标均值、第三识别指标均值和第四识别指标均值,作为古籍算表的自识别模型的一级识别指标、二级识别指标、三级识别指标、四级识别指标。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人内蒙古师范大学,其通讯地址为:010020 内蒙古自治区呼和浩特市赛罕区昭乌达路81号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励