买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京邮电大学
摘要:本发明提出一种基于对话流自举的深度学习对话策略模型构建方法和系统,其中,方法包括:通过对话流自举方式构建语料训练集,对话流自举方式包括:基于用户的多对话轮次对话数据获得对话流状态机,使用宽度优先搜索获取对话流状态机中起始状态到任意状态的所有路径,进而获得多对话轮次的对话序列标注数据,多对话轮次的对话序列标注数据构成语料训练集;构建深度学习对话策略模型,将语料训练集输入至深度学习对话策略模型,输出目标对话动作,其中,深度学习对话策略模型包括对话动作预测模型和置信度比较模型。根据本发明的方法解决现有技术中模型训练数据不足导致模型冷启动的问题。
主权项:1.一种基于对话流自举的深度学习对话策略模型构建方法,其特征在于,包括:通过对话流自举方式构建语料训练集,所述对话流自举方式包括:基于用户的多对话轮次对话数据获得对话流状态机,使用宽度优先搜索获取对话流状态机中起始状态到任意状态的所有路径,进而获得多对话轮次的对话序列标注数据,所述多对话轮次的对话序列标注数据构成语料训练集;构建深度学习对话策略模型,将所述语料训练集输入至所述深度学习对话策略模型,输出目标对话动作,其中,所述深度学习对话策略模型包括对话动作预测模型和置信度比较模型,所述对话动作预测模型用于对所述语料训练集进行对话动作预测,所述置信度比较模型用于获取预测动作的置信度,基于置信度阈值和预测动作的置信度确定目标对话动作;判断所述深度学习对话策略模型中的预测动作是否有误,若有误,则输入预定义动作中的正确动作,基于所述多对话轮次对话数据和所述正确动作生成新的对话数据训练集,利用所述新的对话数据训练集对所述深度学习对话策略模型重新训练;其中,所述用户的多对话轮次对话数据获取方法包括:对多对话轮次过程中的用户输入语句进行自然语言理解获得用户意图和槽值;对所述用户意图和槽值进行对话状态跟踪得到多对话轮次对话数据,所述多对话轮次对话数据包括用户意图、槽值、动作、状态流转条件、当前对话状态、历史对话状态以及用户的回复;还包括判断所述用户意图和槽值是否有误,若有误,则输入预定义意图和槽值中的正确意图和槽值,基于所述正确意图和槽值生成新的训练样本,利用所述新的训练样本对进行自然语言理解的自然语言理解模型重新训练。
全文数据:
权利要求:
百度查询: 北京邮电大学 基于对话流自举的深度学习对话策略模型构建方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。