广东优创合影文化传播股份有限公司林文珊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东优创合影文化传播股份有限公司申请的专利一种全景声空间声音识别模型的训练方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120032644B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510175276.1,技术领域涉及:G10L15/22;该发明授权一种全景声空间声音识别模型的训练方法及系统是由林文珊;张维佳;田园;卢雅婕;陈育华;袁奕设计研发完成,并于2025-02-18向国家知识产权局提交的专利申请。
本一种全景声空间声音识别模型的训练方法及系统在说明书摘要公布了:本发明涉及听力辅助训练技术领域,具体为一种全景声空间声音识别模型的训练方法及系统。本发明首先搭建场地形成空间课堂,包括实际生活中的多元场景;在空间课堂对残障人士进行模拟演练,获得模拟演练数据。其次,构建全景声空间声音识别模型,包括音频信息采集过程和空间音频重建过程。然后,在空间课堂中,残障人士根据场景音频生成结果做出行为反应;基于行为反应,计算环境敏感度。最后,设定环境敏感度阈值,若不大于环境敏感度阈值,则将对应场景在空间课堂中重新模拟,对全景声空间声音识别模型进行重新训练。本发明能够提高残障人士在日常生活和学习中的综合适应能力。
本发明授权一种全景声空间声音识别模型的训练方法及系统在权利要求书中公布了:1.一种全景声空间声音识别模型的训练方法,其特征在于,包括: 搭建场地形成空间课堂,所述空间课堂包括存在视力障碍的残障人士在实际生活中遇到的多元场景;所述多元场景是使用场地、道具和声音设备进行模拟的;在所述空间课堂对所述残障人士进行模拟演练,获得模拟演练数据;所述模拟演练数据是所述多元场景中发出的各种声音形成的可被人耳接收的环境音,包括所述残障人士需要的音频信息和不需要的噪音;对所述模拟演练数据进行数据预处理; 构建全景声空间声音识别模型,包括音频信息采集过程和空间音频重建过程;所述音频信息采集过程生成所述模拟演练数据中的声音方向信息、声源位置信息和声音频谱信息;所述空间音频重建过程基于所述声音方向信息、所述声源位置信息和所述声音频谱信息进行音频重建,获得场景音频生成结果; 在所述空间课堂中,所述残障人士根据所述场景音频生成结果做出行为反应;所述行为反应包括所述残障人士对所述场景音频生成结果的反应时间和行为动作;基于所述行为反应,计算环境敏感度;所述反应时间通过监测所述残障人士的心跳和肌肉活动变化来获得,公式为:反应时间=反应开始时间-声音触发时间;利用所述残障人士的肌肉活动变化,获取所述残障人士的行为动作,包括两个方面:第一,判断所述残障人士的动作是否对应声音来源;第二,判断所述残障人士的动作幅度; 基于所述行为反应,计算所述环境敏感度,具体过程为: 为每一个所述行为动作分配权重因子,表示对所述环境敏感度的贡献; 定义匹配度指标,若所述匹配度指标等于1则表示动作完美匹配声音方向,若所述匹配度指标等于0则表示动作完全不匹配声音方向;根据所述残障人士的动作和声音的实际方向,计算所述匹配度指标; 定义动作幅度指标,通过所述残障人士动作的转头角度和走动距离来计算所述动作幅度指标; 综合所述反应时间、所述匹配度指标和所述动作幅度指标,及其对应的所述权重因子,计算所述环境敏感度; 设定环境敏感度阈值,若不大于所述环境敏感度阈值,则将对应场景在所述空间课堂中重新模拟,对所述全景声空间声音识别模型进行重新训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东优创合影文化传播股份有限公司,其通讯地址为:510000 广东省广州市黄埔区中新广州知识城腾飞一街2号1023室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。