Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 科大讯飞股份有限公司方昕获国家专利权

科大讯飞股份有限公司方昕获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉科大讯飞股份有限公司申请的专利音频感知大模型训练方法以及音频处理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121438869B

龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202512001999.2,技术领域涉及:G10L25/51;该发明授权音频感知大模型训练方法以及音频处理方法是由方昕;李晋;杨辉;高天;刘聪;胡国平设计研发完成,并于2025-12-29向国家知识产权局提交的专利申请。

音频感知大模型训练方法以及音频处理方法在说明书摘要公布了:本发明提供一种音频感知大模型训练方法以及音频处理方法,涉及自然语言处理技术领域,通过跨场景的音频表征对比学习,不仅可以强化目标场景下知识的覆盖度和记忆能力,还可以结合目标场景下的第一音频样本混合训练,提升目标场景下不同任务间混合处理分析的能力。此外,引入文本属性信息,并结合同场景的音频文本表征对比学习,可以增加目标场景下同一内容用不同音频表达的概率,例如不同动物表达害怕的叫声,通过语义相近音频间的迁移学习缓解低资源数据稀缺问题。而且,完成对第一备选音频大模型的训练,可以强化第二备选音频大模型在目标场景下提取音频表征向量的通用能力,减少后续对初始音频感知大模型的训练重复性。

本发明授权音频感知大模型训练方法以及音频处理方法在权利要求书中公布了:1.一种音频感知大模型训练方法,其特征在于,包括: 获取各场景下的第一音频样本、所述第一音频样本的文本属性信息以及带有目标场景下的感知任务的任务标签的第二音频样本; 基于所述第一音频样本以及所述文本属性信息,应用掩码预测准则,结合跨场景的音频表征对比学习以及同场景的音频文本表征对比学习,在所述目标场景下,对第一备选音频大模型进行训练,得到第二备选音频大模型;所述音频表征对比学习是指利用相同场景下不同第一音频样本的音频表征向量相似度以及不同场景下的第一音频样本的音频表征向量相似度,计算音频表征对比损失,所述音频文本表征对比学习是指利用相同场景下第一音频样本的音频表征向量与对应的文本属性信息的文本表征向量的相似度,以及第一音频样本的音频表征向量与其他文本属性信息的文本表征向量的相似度,计算音频文本表征对比损失; 基于所述感知任务以及所述第二备选音频大模型,构建初始音频感知大模型,基于所述第二音频样本,对所述初始音频感知大模型进行训练,得到目标音频感知大模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大讯飞股份有限公司,其通讯地址为:230088 安徽省合肥市高新开发区望江西路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。