恭喜北京百度网讯科技有限公司马小明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京百度网讯科技有限公司申请的专利一种图像处理方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113887394B 。
龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111152043.8,技术领域涉及:G06V30/413;该发明授权一种图像处理方法、装置、设备及存储介质是由马小明设计研发完成,并于2021-09-29向国家知识产权局提交的专利申请。
本一种图像处理方法、装置、设备及存储介质在说明书摘要公布了:本公开提供了一种图像处理方法、装置、设备及存储介质,涉及人工智能领域,尤其涉及计算机视觉、深度学习和地图数据生产技术领域,具体可用于智能防控场景下。具体实现方案为:对目标文本图像进行文本检测,得到所述目标文本图像中的目标文本区域,以及所述目标文本区域的第一文本类别;对所述目标文本区域中的文本内容进行分类,得到所述目标文本区域的第二文本类别;对所述目标文本区域的第一文本类别和第二文本类别进行融合处理,得到所述目标文本区域的目标类别。通过上述技术方案,将视觉角度的文本类别和语义角度的文本类别进行融合以确定目标文本类别,使得最终所得到的目标文本类别具有较高的准确度。
本发明授权一种图像处理方法、装置、设备及存储介质在权利要求书中公布了:1.一种图像处理方法,包括:基于视觉分割模型中的特征提取网络,提取目标文本图像的图像特征;基于所述视觉分割模型中的候选区域生成网络,根据所述图像特征,确定所述目标文本图像中的候选文本区域;采用多类别的非极大值抑制算法,对所述候选文本区域进行筛选;对筛选后的文本区域进行处理,得到所述目标文本图像中的目标文本区域,以及所述目标文本区域的第一文本类别;对所述目标文本区域中的文本内容进行分类,得到所述目标文本区域的第二文本类别;对所述目标文本区域的第一文本类别和第二文本类别进行融合处理,得到所述目标文本区域的目标类别;其中,视觉分割模型、文本识别模型和文本分类模型的具体实现:将样本文本图像输入至视觉分割模型的特征提取网络中得到样本图像特征;将样本图像特征输入至候选区域生成网络,得到候选文本区域;采用多类别的非极大值算法对候选文本区域进行筛选,得到筛选后的文本区域;将筛选后的文本区域输入至视觉分割模型的结果输出网络,所述结果输出网络包括三个分支,分别为位置分支、区域分支和类别分支,得到样本文本图像的文本框位置即样本文本区域位置、分割结果即分割的文本框也即样本文本区域、以及样本文本区域的第一文本类别;进而将样本文本区域输入至文本识别模型,得到样本文本区域的文本内容;将文本内容输入至文本分类模型中,得到样本文本区域的第二文本类别;根据视觉分割模型预测的第一文本类别、文本分类模型预测的第二文本类别、以及标注的类别数据,确定类别损失,即将视觉分割模型和文本分类模型的类别损失进行融合,同时根据标注的文本框数据,以及视觉分割模型的分割结即分割的文本框,确定分割损失;以及根据标注的文本框位置、视觉分割模型预测的文本框位置即样本文本区域位置,确定位置损失;进而根据分类损失、分割损失和位置损失,一并对视觉分割模型、文本识别模型和文本分类模型进行训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京百度网讯科技有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦2层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。