一种基于深度学习的藏文古籍版面分析方法和系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西北民族大学

摘要：本发明涉及一种基于深度学习的藏文古籍版面分析方法和系统。该方法通过采用训练好的包括有用于进行文本行Mask预测的分支、用于进行文本行X‑Height高度位置Mask预测的分支、用于进行字符区域Mask预测的分支、用于进行注释信息Mask预测的分支以及用于进行边框线Mask预测的分支的版面分析模型，基于藏文古籍文档的整体图像或藏文古籍文档的切片图像就可以实现藏文古籍版面的精确分析。

主权项：1.一种基于深度学习的藏文古籍版面分析方法，其特征在于，包括：获取待分析的藏文古籍文档图像；所述待分析的藏文古籍文档图像为藏文古籍文档的整体图像或藏文古籍文档的切片图像；将所述待分析的藏文古籍文档图像输入至训练好的版面分析模型得到藏文古籍版面分析结果；所述版面分析模型采用数据集进行训练；所述数据集包括：原始图像数据集和Mask图像数据集；所述版面分析模型包括：分支一、分支二、分支三、分支四和分支五；所述分支一用于进行文本行Mask预测；所述分支二用于进行文本行X-Height高度位置Mask预测；所述分支三用于进行字符区域Mask预测；所述分支四用于进行注释信息Mask预测；所述分支五用于进行边框线Mask预测；所述数据集的构建过程包括：获取原始图像，以生成原始图像数据集；对所述原始图像数据集中的原始图像进行二值化处理，得到二值化结果图；对所述二值化结果图进行结构元素分割得到结构元素分割结果图；所述结构元素分割结果图包括：边框线Mask图像、注释信息Mask图像、字符区域Mask图像和文本行分割图像；根据所述结构元素分割结果图中的文本行分割图像得到文本行X-Height高度位置Mask图像；将所述文本行X-Height高度位置Mask图像与所述文本行分割图像进行按位相加得到叠加图像；对所述叠加图像进行挤压操作得到文本行Mask图像；基于所述边框线Mask图像、文本行X-Height高度位置Mask图像、字符区域Mask图像、注释信息Mask图像和所述文本行Mask图像生成Mask图像数据集；所述对所述叠加图像进行挤压操作得到文本行Mask图像，具体包括：预设相邻两个文本行间向外侧挤压的最大像素个数和经挤压后相邻两个文本行间的最小像素个数；依据相邻两个文本行的开始坐标位置和结束坐标位置，根据预设最大像素个数和所述预设最小像素个数确定实际最大向外侧挤压像素个数；根据实际最大向外侧挤压像素个数调整所述叠加图像得到文本行Mask图像；所述依据相邻两个文本行的开始坐标位置和结束坐标位置，根据所述预设最大像素个数和所述预设最小像素个数确定实际最大向外侧挤压像素个数，具体包括：当Qi-Pi-Maxpush+Mindist*2≥0时，Pushdist＝Maxpush；当Qi-Pi-Maxpush+Mindist*2＜0，且Qi-Pi-Mindist2＞0时，Pushdist＝Qi-Pi-Mindist2；当Qi-Pi-Maxpush+Mindist*2＜0，且Qi-Pi-Mindist2≤0时，Pushdist＝-Mindist；其中，表示取整，Qi表示相邻两个文本行的开始坐标位置，Pi表示相邻两个文本行的结束坐标位置，Maxpush表示预设相邻两个文本行间向外侧挤压的最大像素个数，Mindist表示预设经挤压后相邻两个文本行间的最小像素个数，Pushdist表示实际最大的向外侧挤压像素个数。

全文数据：

权利要求：

百度查询：西北民族大学一种基于深度学习的藏文古籍版面分析方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种导电浆料电阻率测试装置及导电浆料电阻率测试方法

下一篇：一种流量计标定装置及标定方法

相关技术

一种导电浆料电阻率测试装置及导电浆料电阻率测试方法

一种流量计标定装置及标定方法

一种电网高影响天气特征与模式识别方法及系统

一种商用电动汽车充电效率提升的装置及方法

大语言模型生成SQL查询语句中的数据权限控制方法及设备

路径规划方法、系统、设备及计算机可读存储介质

一种矿山采空区顶板离层测量装置及其测量方法

储能变流器及储能系统

ZnO/石墨烯复合材料、Zn杂化石墨烯阻燃环氧丙烯酸酯涂层及制备方法

一种用于多弯曲半径的数控弯曲连接装置及使用方法

一种膨化食品加工用粉碎装置

一种1-溴乙基乙酸酯的制备方法

古籍相关技术

绢本与纸本古籍字画上红色系霉斑的移除方法_复旦大学_202310517068.6

古籍修复防褶皱用压平装置_山西旅游职业学院_202420589873.X

一种新型古籍资料整理用装订装置_赤峰学院_202323238369.X

一种用于古籍书本缝边的引线装置_中国中医科学院中医药信息研究所_202420584399.1

一种古籍数学符号的识别方法和装置_内蒙古师范大学_202410806709.4

一种古籍识别方法、装置、存储介质及设备_北京有竹居网络技术有限公司_202210258636.0

一种基于深度学习的藏文古籍版面分析方法和系统_西北民族大学_202210219619.6

文物碑文拓片拓印及古籍扫描一体的机器人_吉林工程技术师范学院_202410932987.4

一种防潮隔绝防护式古籍图书书架及使用方法_安徽理工大学_202410855706.X

一种古籍文献的修复压平装置_湖南省中医药研究院_202420438313.4

版面相关技术

一种基于版面的文本分块方法、设备及存储介质_重庆赛力斯新能源汽车设计院有限公司_202410966698.6

固定版面证件结构化信息提取方法、装置、设备及介质_北京捷通华声科技股份有限公司_202011029027.5

文本行区域定位方法、版面分析方法及字符识别方法_北京中安未来科技有限公司_202010640573.6

一种基于深度学习的藏文古籍版面分析方法和系统_西北民族大学_202210219619.6

一种广告牌版面安置用连接件_平湖市初耘广告传媒有限公司_202420316203.0

基于目标检测和关键点检测的证件版面分析方法_盛视科技股份有限公司_202411008369.7

一种可多版面展示的海报广告展示架_西安千骑启梦互动娱乐有限责任公司_202323620287.1

基于深度学习和传统算法的证件版面分析方法_盛视科技股份有限公司_202311560569.9

网印机用版面清洁装置_晋江市金井荣昌彩印有限公司_202420240430.X

封装基板及其制法与整版面结构_芯爱科技(南京)有限公司_202310952717.5

分析相关技术

品位分析装置及品位分析方法_北京霍里思特科技有限公司_202411079986.6

一种自动分析方法及其分析装置_北京谷器数据科技有限公司_202410997249.8

离子分析装置_株式会社岛津制作所_202080060217.5

自动分析装置_株式会社日立高新技术_202380032252.X

分析仪器_Q-莱纳公司_201980036596.1

自动分析装置_株式会社日立高新技术_201980021747.6

单细胞分析_高济生物医药科技(上海)有限公司_202111005542.4

宝石的表面分析_美国杰莫洛吉克尔研究所有限公司(GIA)_202380027552.9

电子邮件安全分析_微软技术许可有限责任公司_202080017951.3

视频分析方法及系统_株式会社日立制作所_202310547173.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于深度学习的藏文古籍版面分析方法和系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务