买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供一种对话式多媒体内容生成方法、系统,通过预训练的大语言模型对标准文本进行语义理解和意图分析,以判断输入指令为检索指令还是编辑指令;若输入指令为检索指令,则将文本单元输入至预设的视频检索模型中,以使视频检索模型反馈出与所述文本单元相适配的目标视频;若输入指令为编辑指令,则对标准文本进行相似度匹配,以获取编辑模式,并采用编辑模式依次对用户预选定的待编辑视频进行视频抠像、视频调和、视频分割、视频修复、音频生成和口型生成等类型的编辑处理以获取多媒体生成内容,如此,使得多媒体内容编辑变得智能化,能够大大降低多媒体编辑的门槛,为用户提供更加便捷、高效的编辑体验。
主权项:1.一种对话式多媒体内容生成方法,其特征在于,包括:通过后台将前置用户对话框内的输入指令转换为标准文本;通过预训练的大语言模型对所述标准文本进行语义理解和意图分析,以判断所述输入指令为检索指令还是编辑指令;其中,若所述输入指令为检索指令,则对所述标准文本进行5W1H分析以获取文本单元,并将所述文本单元输入至预设的视频检索模型中,以使所述视频检索模型反馈出与所述文本单元相适配的目标视频;若所述输入指令为编辑指令,则对所述标准文本进行相似度匹配,以获取编辑模式,并采用所述编辑模式依次对用户预选定的待编辑视频进行编辑处理以获取多媒体生成内容;其中,所述编辑模式包括视频抠像、视频调和、视频分割、视频修复、音频生成和口型生成。
权利要求:
百度查询: 中国传媒大学 对话式多媒体内容生成方法、系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。