首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

用于输出信息的方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京字节跳动网络技术有限公司

摘要:本公开的实施例公开了用于输出信息的方法和装置。该方法的一具体实施方式包括:响应于接收到用户发起的点读请求,获取对目标文字进行拍摄所获得的图像作为待识别图像,其中,目标文字是用户指向的文字;对待识别图像中的目标文字进行检测,获得包围目标文字的多边形框;确定多边形框所对应的多边形区域的面积;基于所确定的面积,确定目标文字的字号作为目标字号;基于目标字号,生成及输出针对目标文字的点读结果。该实施方式在生成点读结果的过程中考虑到了文字的字号,引入更多的与点读结果相关的数据,进而可以输出更为准确、有效的点读结果,有助于提高用户体验。

主权项:1.一种用于输出信息的方法,包括:响应于接收到用户发起的点读请求,获取对目标文字进行拍摄所获得的图像作为待识别图像,其中,所述目标文字是所述用户指向的文字;对所述待识别图像中的目标文字进行检测,获得包围所述目标文字的多边形框;确定所述多边形框所对应的多边形区域的面积;基于所确定的面积,确定所述目标文字的字号作为目标字号;基于所述目标字号,生成及输出针对所述目标文字的点读结果;所述基于所述目标字号,生成及输出针对所述目标文字的点读结果包括:响应于所述目标字号大于预设字号,对所述多边形区域进行缩放,获得缩放后多边形区域;将所述缩放后多边形区域输入预先训练的第一文字识别模型,获得第二识别文字;获取所述第二识别文字所对应的音频;将所述第二识别文字所对应的音频作为点读结果输出;或者,所述基于所述目标字号,生成及输出针对所述目标文字的点读结果包括:响应于所述目标字号大于预设字号,将所述多边形区域输入预先训练的第二文字识别模型,获得第三识别文字;获取所述第三识别文字所对应的音频;将所述第三识别文字所对应的音频作为点读结果输出。

全文数据:

权利要求:

百度查询: 北京字节跳动网络技术有限公司 用于输出信息的方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。