Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜华南理工大学王振宇获国家专利权

恭喜华南理工大学王振宇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜华南理工大学申请的专利一种融合用户满意度的任务导向型对话策略学习方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115344667B

龙图腾网通过国家知识产权局官网在2025-05-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210738419.1,技术领域涉及:G06F16/3329;该发明授权一种融合用户满意度的任务导向型对话策略学习方法是由王振宇;张睿设计研发完成,并于2022-06-27向国家知识产权局提交的专利申请。

一种融合用户满意度的任务导向型对话策略学习方法在说明书摘要公布了:本发明公开了一种融合用户满意度的任务导向型对话策略学习方法。所述方法包括以下步骤:收集人机对话数据并结合任务场景进行数据清洗;提取出对话中的意图、槽值和情绪状态信息,并进行向量化表示;构建对话策略模块;构建情感策略模块;构建加权融合模块,获取候选响应动作对应的聚合动作价值与动作情感价值的总得分,并根据总得分预测响应动作;获取预测的响应动作后的对话状态、奖励和用户真实情绪状态信息,优化对话策略模块和情感策略模块的网络参数。本发明充分考虑了对话和情感状态的特征,通过融合深度强化学习和监督学习技术,兼顾对话效率和用户满意度目标,提高了对话策略模型的效果。

本发明授权一种融合用户满意度的任务导向型对话策略学习方法在权利要求书中公布了:1.一种融合用户满意度的任务导向型对话策略学习方法,其特征在于,包括以下步骤:S1、收集人机对话数据并结合任务场景进行数据清洗;S2、对数据清洗后的人机对话数据进行预处理,提取出对话中的意图、槽值和情绪状态信息,并进行向量化表示;S3、构建以任务完成效率为目标的对话策略模块,评估候选响应动作的动作价值;S4、构建以用户满意度为目标的情感策略模块,评估对候选响应动作的情感价值,具体包括以下步骤:S4.1、通过Lookup-Table映射得到候选动作集合Acandidate中的每个候选响应动作和用户在当前时刻t的情感状态对应的候选响应动作向量和当前情感状态向量,将候选响应动作向量、当前情感状态向量和当前对话状态向量输入到情感策略模块,情感策略模块预测执行该候选响应动作后用户在下一时刻的情绪状态S4.2、采用情感效用函数U估算各候选响应动作的情感价值;S5、构建加权融合模块,获取候选响应动作对应的聚合动作价值与动作情感价值的总得分,并根据总得分预测响应动作,具体包括以下步骤:S5.1、对于候选响应动作集合Acandidate中的每个候选响应动作,通过加权融合公式计算候选响应动作的总得分Score;S5.2、比较候选响应动作集合Acandidate中各个候选响应动作的总得分,选取总得分最高的候选响应动作作为加权融合模块的输出即加权融合模块预测的响应动作;S6、获取执行步骤S5中预测的响应动作后的对话状态、奖励和用户真实情绪状态信息,优化对话策略模块和情感策略模块的网络参数,包括以下步骤:S6.1、在每轮交互中,执行加权融合模块预测的响应动作,获取执行响应动作后的对话状态信息和情感状态数据即情感状态真实值并将执行响应动作后的对话状态信息和情感状态真实值存储至经验回放池;S6.2、根据响应动作后的对话状态信息和情感状态真实值优化对话策略模块和情感策略模块,更新后继续下一轮对话,直到对话结束或者超过S3.1中设置的最大对话轮数L。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。