买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:一汽奔腾汽车股份有限公司
摘要:本发明属于车机座舱系统技术领域,具体涉及一种基于OCR实现导航可见及可说的方法;监听TopActivity变化,根据packageName判定当前车机系统的TopActivity为导航画面;语音进入对话中状态,开启OCR扫描,并确认OCR开启;对车机系统当前画面进行截图;将图片压缩给云端OCR解析引擎,云端OCR解析引擎进行文字解析,车机系统根据解析结果重组为热词服务格式的json串;在本地形成热词列表;用户说出可见即可说指令,云端增强识别引擎给出最终自动语音识别结果;端侧对话管理模块判断ASR结果是否能够匹配到热词列表中的某一热词,通过热词列表找到ASR结果对应的控件;车机中语音模块执行虚拟点击动效,针对对应的控件执行步骤六用户所说的指令;本发明利用端侧截图和图片压缩工具,云端的OCR识别引擎将辅助服务不支持的导航App变成支持,增加了用户使用车机时通过语音操作导航的场景,提高了开车场景的安全性,降低了整车成本。
主权项:1.一种基于OCR实现导航可见及可说的方法,其特征在于,包括如下内容:步骤一,OCR扫描判定,当同时满足以下三个条件时进入步骤二,否则重复步骤一;条件1,监听TopActivity变化,根据packageName判定当前车机系统的TopActivity为导航画面;条件2,监听语音对话状态,语音进入对话中状态;条件3,开启OCR扫描,并确认OCR已经开启;步骤二,对车机系统当前画面进行截图;步骤三,将图片大小压缩至200KB以下;步骤四,发送压缩后的图片给云端OCR解析引擎,云端OCR解析引擎进行图片中文字的解析,并将解析结果返回至车机系统;步骤五,车机系统根据云端OCR解析引擎返回的OCR解析结果,重组为热词服务格式的json串并分别发送给本地和云端增强识别引擎;其中车机系统将热词服务格式的json串发送给本地后,形成每个热词对应的UI控件以及控件对应的坐标点列表,即热词列表;步骤六,用户说出可见即可说指令;步骤七,语音活性检测VAD系统检测到用户说话结束后,云端增强识别引擎给出最终自动语音识别结果;步骤八,车机中语音模块中的子模块——端侧对话管理模块将ASR结果与热词列表中的每一项热词记录依次进行对比,判断ASR结果是否能够匹配到热词列表中的某一热词,一旦匹配到热词,通过热词列表找到ASR结果对应的控件;步骤九,车机中语音模块执行虚拟点击动效,针对对应的控件执行步骤六用户所说的指令。
全文数据:
权利要求:
百度查询: 一汽奔腾汽车股份有限公司 一种基于OCR实现导航可见及可说的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。