买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京网智天元大数据科技有限公司;网智天元科技集团股份有限公司
摘要:本申请涉及语料生成技术领域,尤其涉及一种基于AIGC的藏语场景化音频语料生成方法及装置,方法包括:根据藏语音频语料的需求领域建立对应的知识库;对知识库进行关键词提取;基于AIGC模型,根据提取到的关键词生成需求领域对应的汉语场景化文本语料;基于翻译引擎,将生成的汉语场景化文本语料翻译为藏语场景化文本语料;获取根据藏语场景化文本语料录制的藏语场景化音频语料,将藏语场景化音频语料和藏语场景化文本语料进行绑定;将绑定的藏语场景化音频语料和藏语场景化文本语料按照需求领域及场景进行分类入库。本申请中的技术方案,可以显著提高藏语场景化音频语料的生成效率,且生成的藏语场景化音频语料标准、规范,有利于标准化管理。
主权项:1.一种基于AIGC的藏语场景化音频语料生成方法,其特征在于,包括:根据藏语音频语料的需求领域建立对应的知识库;对所述知识库进行关键词提取;基于AIGC模型,根据提取到的关键词生成需求领域对应的汉语场景化文本语料;基于翻译引擎,将生成的汉语场景化文本语料翻译为藏语场景化文本语料;获取根据所述藏语场景化文本语料录制的藏语场景化音频语料,将所述藏语场景化音频语料和所述藏语场景化文本语料进行绑定;将绑定的藏语场景化音频语料和藏语场景化文本语料按照需求领域及场景进行分类入库;根据藏语音频语料的需求领域建立对应的知识库,包括:对所述需求领域进行流程环节划分;针对不同的流程环节分别获取相关文本知识,建立所述需求领域对应的知识库;对建立的知识库按照词典内容索引进行归纳和标记;基于AIGC模型,根据提取到的关键词生成需求领域对应的汉语场景化文本语料,包括:根据提取到的关键词编写AIGC模型的提示文本;所述提示文本为与所述AIGC模型交互的短文本;所述提示文本用于向所述AIGC模型提供指令以引导所述AIGC模型生成所述关键词相关的文本对答内容;将所述提示文本输入所述AIGC模型,使所述AIGC模型生成需求领域对应的汉语场景化文本语料。
全文数据:
权利要求:
百度查询: 北京网智天元大数据科技有限公司 网智天元科技集团股份有限公司 基于AIGC的藏语场景化音频语料生成方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。