Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 声音猎手公司霍思旦获国家专利权

声音猎手公司霍思旦获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉声音猎手公司申请的专利车载装置以及处理话语的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN112420033B

龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202010841021.1,技术领域涉及:G10L15/22;该发明授权车载装置以及处理话语的方法是由霍思旦设计研发完成,并于2020-08-20向国家知识产权局提交的专利申请。

车载装置以及处理话语的方法在说明书摘要公布了:本申请涉及车载装置以及处理话语的方法。描述了用于处理语音的系统和方法。特定示例使用视觉信息来改善语音处理。该视觉信息可以是从车辆内获得的图像数据。在示例中,图像数据描述车辆内的人的特征。特定示例使用图像数据来获得说话者特征向量,以供经适配的语音处理模块使用。语音处理模块可以被配置为使用说话者特征向量来处理描述话语的特征的音频数据。音频数据可以是从车辆内的音频捕获设备导出的音频数据。特定示例使用神经网络架构来提供声学模型,从而处理音频数据和说话者特征向量。

本发明授权车载装置以及处理话语的方法在权利要求书中公布了:1.一种车载装置,包括: 音频接口,被配置为从车辆的音频捕获设备接收音频数据,所述音频数据描述所述车辆内的人的话语的特征; 图像接口,被配置为从用于从所述车辆捕获图像的图像捕获设备接收图像数据,所述图像数据描述所述人的面部区域的特征; 语音处理模块,被配置为基于所述音频数据和所述图像数据来解析人的话语;以及 说话者预处理模块,被配置为接收所述图像数据,并且基于所述图像数据来获得说话者特征向量以预测音素数据,其中获得所述说话者特征向量包括: 对所述图像数据执行面部识别以标识所述车辆内的所述人; 基于所述面部识别来获得针对所述人的用户配置文件数据;以及 根据所述用户配置文件数据来获得所述说话者特征向量; 其中根据所述用户配置文件数据来获得所述说话者特征向量包括: 将与所述用户配置文件数据相关联的所存储的说话者特征向量的数量与预定义阈值进行比较; 响应于所存储的说话者特征向量的数量低于所述预定义阈值,使用所述音频数据和所述图像数据中的一个或多个来计算所述说话者特征向量;以及 响应于所存储的说话者特征向量的数量大于所述预定义阈值,获得与所述用户配置文件数据相关联的静态说话者特征向量,所述静态说话者特征向量是使用所述数量的所存储的说话者特征向量来生成的。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人声音猎手公司,其通讯地址为:美国加利福尼亚州;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。