首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种甲骨文数据库的构建方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:清华大学

摘要:本发明提供一种甲骨文数据库的构建方法和装置。其中,所述方法,包括:获取第一甲骨文数据集中的第一图片,提取第一图片中的第一单字信息及其对应的关联信息,基于第一单字信息及其对应的关联信息,生成拓写数据集;获取第二甲骨文数据集中的第二图片,提取第二图片中的第二单字信息,基于第二图片和第二单字信息,生成甲片数据文档;基于拓写数据集和甲片数据文档,生成甲骨文数据库。在本发明中,基于提供的甲骨文数据库的构建方法构建的甲骨文数据库,整合了第一甲骨文数据集和第二甲骨文数据集中的数据样本,具有数据样本的规模较大、且数据多样性较好的特点;同时,前述数据库可以向公众开放,且可应用于文物保护之中,提高了其通用性。

主权项:1.一种甲骨文数据库的构建方法,其特征在于,包括:获取第一甲骨文数据集中的第一图片,提取所述第一图片中的第一单字信息及其对应的关联信息,基于所述第一单字信息及其对应的所述关联信息,生成拓写数据集;获取第二甲骨文数据集中的第二图片,提取所述第二图片中的第二单字信息,基于所述第二图片和所述第二单字信息,生成甲片数据文档;基于所述拓写数据集和所述甲片数据文档,生成甲骨文数据库;所述提取所述第一图片中的第一单字信息及其对应的关联信息,基于所述第一单字信息及其对应的所述关联信息,生成拓写数据集,包括:基于预设的字符处理方式,对所述第一图片进行字符提取,得到所述第一单字信息;基于所述第一单字信息是否对应汉字,对所述第一图片进行划分,得到第一图片集和第二图片集;其中,所述第一图片集中的所述第一单字信息对应所述汉字,所述第二图片集中的所述第一单字信息不对应所述汉字;分别提取所述第一图片集中所述第一单字信息对应的所述汉字以及所述汉字对应的拓写字形,和所述第二图片集中所述第一单字信息的类别序号;聚合所述第一单字信息、所述第一单字信息分别对应的所述汉字、所述汉字对应的所述拓写字形以及所述类别序号,生成所述拓写数据集;所述获取第二甲骨文数据集中的第二图片,提取所述第二图片中的第二单字信息,包括:基于预设的数据处理方式,对所述第二甲骨文数据集进行视觉处理,得到所述第二图片;提取所述第二图片中的甲骨文例句,对所述甲骨文例句进行拆分,得到所述第二单字信息。

全文数据:

权利要求:

百度查询: 清华大学 一种甲骨文数据库的构建方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。