买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京百度网讯科技有限公司
摘要:本公开提供了一种音频转写方法和装置,涉及人工智能技术领域,具体为自然语言处理和深度学习技术领域。该方法的一具体实施方式包括:接收通过客户端安装的存储服务应用的场景入口上传的音频信息;基于场景入口,确定音频信息的场景类型;对音频信息进行语音识别,得到音频信息对应的文本信息;将文本信息和场景类型对应的提示信息输入至语言模型,得到总结信息,其中,语言模型是利用各种场景类型对应的样本对预训练模型进行有监督微调得到的,各种场景类型对应的提示信息是利用语言模型对各种场景类型对应的初始提示信息进行调优得到的。该实施方式的语言模型的输出效果更加符合各种场景类型下用户的需求。
主权项:1.一种音频转写方法,包括:接收通过客户端安装的存储服务应用的场景入口上传的音频信息;基于所述场景入口,确定所述音频信息的场景类型;对所述音频信息进行语音识别,得到所述音频信息对应的文本信息;将所述文本信息和所述场景类型对应的提示信息输入至语言模型,得到总结信息,其中,所述语言模型是利用各种场景类型对应的样本对预训练模型进行有监督微调得到的,各种场景类型对应的提示信息是利用所述语言模型对各种场景类型对应的初始提示信息进行调优得到的。
全文数据:
权利要求:
百度查询: 北京百度网讯科技有限公司 音频转写方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。