Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜深圳市高斯全球信息技术有限公司范志勇获国家专利权

恭喜深圳市高斯全球信息技术有限公司范志勇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜深圳市高斯全球信息技术有限公司申请的专利一种基于深度学习的智能简历OCR解析与自动化信息提取系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119227670B

龙图腾网通过国家知识产权局官网在2025-04-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411415747.3,技术领域涉及:G06F40/205;该发明授权一种基于深度学习的智能简历OCR解析与自动化信息提取系统及方法是由范志勇;王超;蔺佳明;李国民设计研发完成,并于2024-10-09向国家知识产权局提交的专利申请。

一种基于深度学习的智能简历OCR解析与自动化信息提取系统及方法在说明书摘要公布了:本发明公开了一种基于深度学习的智能简历OCR解析与自动化信息提取系统及方法,具体涉及自动化信息技术领域,包括获取简历模块、简历预处理模块、简历文本采集模块、简历文本分析模块、综合简历分析模块、判别模块以及反馈模块。本发明通过获取用户发送的第一简历文本,并进行预处理操作获取第一文本,再划分成各子文本;对子文本中采集的各类数据进行分析处理,之后通过数学模型进行综合分析,计算得到目标文本的信息精确度指数,有助于呈现更加直观的效果,便于做出决策,最终提高了智能简历的自动化信息提取的全面性和安全性。

本发明授权一种基于深度学习的智能简历OCR解析与自动化信息提取系统及方法在权利要求书中公布了:1.一种基于深度学习的智能简历OCR解析与自动化信息提取系统,其特征在于,包括:获取简历模块:响应于浏览器目标插件渠道的自动化识别操作,获取用户发送的第一简历文本;简历预处理模块:对用户发送的第一简历文本进行预处理操作,获取第一简历文本对应的第一文本,确定第一文本为目标文本,将目标文本进行划分成各子文本,并将各子文本依次编号为i=1、2,……,n;简历文本采集模块:用于目标文本划分中的任意子文本中采集各类数据,并将采集的各类数据传输到简历文本分析模块;采集的数据包括图像色彩特征数据、图像识别数据、亮度识别特征数据以及识别耗时数据;简历文本分析模块:用于对简历文本采集模块采集的各类数据进行分析,并将分析结果传输到综合简历分析模块;包括图像色彩特征数据计算单元、图像识别数据计算单元、亮度识别特征数据计算单元以及识别耗时数据计算单元;所述图像色彩特征数据计算单元用于建立图像色彩特征数据的数学模型,将简历文本采集模块采集图像色彩特征数据导入图像色彩特征数据的数学模型,计算出各子文本的图像色彩系数值,具体表示为: TAi表示第i个子文本的图像色彩系数值,Tli表示第i个子文本的冷色调字符识别准确率,Tbi表示第i个子文本的图像中高饱和分布率,Tni表示第i个子文本的暖色调字符识别错误率,n表示子文本数量;所述图像识别数据计算单元用于建立图像识别数据的数学模型,将简历文本采集模块采集图像识别数据导入图像识别数据的数学模型,计算出各子文本的图像识别系数值,具体表示为: SAi表示第i个子文本的图像识别系数值,Sgi-1表示第i-1个子文本的高分辨率图像正确识别字符数量,Sgi表示第i个子文本的高分辨率图像正确识别字符数量,Sqi表示第i个子文本的清晰图像中特定字体识别准确率,Sdi表示第i个子文本的无噪点图像识别速度,n表示子文本数量;所述亮度识别特征数据计算单元用于建立亮度识别特征数据的数学模型,将简历文本采集模块采集亮度识别特征数据导入亮度识别特征数据的数学模型,计算出各子文本的亮度识别系数值,具体表示为: LAi表示第i个子文本的亮度识别系数值,Lti表示第i个子文本的过亮图像识别字符数量,Lzi表示第i个子文本的过暗图像识别耗时增加量,Lqi表示第i个子文本的特殊字符识别准确率,n表示子文本数量;所述识别耗时数据计算单元用于建立识别耗时数据的数学模型,将简历文本采集模块采集识别耗时数据导入识别耗时数据的数学模型,计算出各子文本的识别耗时系数值,具体表示为: BAi表示第i个子文本的识别耗时系数值,Bsi表示第i个子文本的单页字符识别的速度,Bsmax表示目标文本的单页字符识别的最大速度,Bci表示第i个子文本的不同格式文本识别的耗时差异值,Bti表示第i个子文本的特殊字符识别时间,n表示子文本数量;综合简历分析模块:用于简历文本分析模块传输的数据导入综合简历分析模块中,计算出目标文本的信息精确度指数,并传输到判别模块;该模块包括综合简历计算单元;所述综合简历计算单元用于建立目标文本的数学模型,将简历文本分析模块计算的各系数值导入目标区域的数学模型,计算出目标文本的信息精确度指数,具体表示为: [αi=TAi×λ1+SAi×λ2+LAi×λ3+BAi×λ4],其中η表示目标文本的信息精确度指数,αi表示第i个子文本的信息精确度指数,TAi表示第i个子文本的图像色彩系数值,SAi表示第i个子文本的图像识别系数值,LAi表示第i个子文本的亮度识别系数值,BAi表示第i个子文本的识别耗时系数值,λ1、λ2、λ3、λ4表示信息精确度指数的权重系数,λ1取值范围0.15至0.25,λ2取值范围0.20至0.24,λ3取值范围0.15至0.26,λ4取值范围0.14至0.23,λ5取值范围0.14至0.22,其中β表示目标文本的信息精确度指数的其他影响因子,其中i=1,2,……,n;判别模块:用于目标文本的信息精确度指数与预设目标文本的信息精确度指数在实际过程中进行比较并将判断的结果传输至反馈模块;反馈模块,用于判别模块发送的信号按照反馈方式发送于相对应的管理人员。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市高斯全球信息技术有限公司,其通讯地址为:518000 广东省深圳市南山区粤海街道高新区社区白石路3609号深圳湾科技生态园二区9栋B916;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。