一种基于深度学习的对话模型构建方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华东师范大学

摘要：本发明公开了一种基于深度学习的对话模型构建方法，模型由对话动作编码模型，对话历史编码模型，对话动作预测模型以及对话回复生成模型构成。对话动作编码模型以及对话历史编码模型用于对历史对话动作序列以及对话历史进行编码；对话动作预测模型用于预测下一轮的对话动作，最后使用对话回复生成模型来生成回复。对话模型通过对历史对话动作以及下一轮对话动作的预测来提高生成回复的精准性，通过编码对话历史可以避免生成重复冗余的信息，可以有效加快任务型对话系统在实际应用中效率，提高用户体验。

主权项：1.一种基于深度学习的对话模型构建方法，该方法在构建过程中需要使用包含以下内容的对话数据集：包含双方聊天内容的对话历史，T＝{U1，R1，...，Ut-1，Rt-1，Ut}，Ui表示第i轮用户询问的语句，Ri表示第i轮的回复；包含对话历史中每一句对话目的的对话动作序列A＝{a1，a2，a3，...，an}，对于任意一个动作ai中包含任意多个单词；包含完成任务所需信息的对话数据库D＝{d1，d2，...，dn}表示，用于信息的查询；包含截止目前为止己获取信息的对话信念状态V＝{v1，v2，v3，...，vn}，第i轮的信念状态为vi＝{s1＝p1，s2＝p2，...，sk＝pk}，其中si是完成任务所规定的需要的信息槽，pi是其对应的值；构建过程如下：1对历史对话动作序列进行编码将截止到当前轮数的历史对话动作序列A＝a1，a2，a3，...，acur进行拼接，在每个对话动作的前后分别加上独立标签[ACT]、[EOS]，并在整个拼接完成的字符序列前加上标签[CLS]，得到最后的拼接序列：Acat＝[CLS][ACT]a1[EOS][ACT]a2[EOS]...[ACT]acur[EOS]；利用TransformerEncoder模型实现对话动作编码模型ACTEncoder，并将Acat进行输入，具体公式如下： ACTEncoderAcat＝TransformerEncoderAcat，Acat，AcatTransformerEncoderAcat，Acat，Acat＝FFNMultiHeadAcat，Acat，AcatFFNx＝LNReluxW1+b1W2+b2+xMultiHeadQ，K，V＝Concathead1，...，headhWO+Q 其中ACTEncoder表示对话动作编码模型，TransformerEncoder表示TransformerEncoder模型，FFN表示线性操作，MultiHead是多头注意力机制计算，Attention为注意力机制计算，Q，K，V是注意力机制的输入向量，LN表示LayerNorm，Relu为激活函数，W1，W2，b1，b2，WO，WiQ，是深度学习可训练参数，dk表示在Transformer结构中隐层的维度，Q，K，V表示输入矩阵，KT是K的转置，Concat表示拼接操作；取[CLS]字符通过对话动作编码模型计算的向量作为历史对话动作序列的特征表示，记为作为对话动作编码模型的输出；2将对话历史进行编码将对话历史T＝{U1，R1，...，Ut-1，Rt-1，Ut}与对话数据库信息D＝{d1，d2，...，dn}进行拼接，记为E，利用TransformerEncoder模型实现对话历史编码模型HisEncoder，并将E进行输入，具体公式如下：E＝concat[T；D]He＝HisEncoderEHisEncoderE＝TransformerEncoderE，E，E其中Concat表示拼接操作，TransformerEncoder表示TransfromerEncoder模型，HisEncoder代表对话历史编码模型；最后的输出He则是代表对话历史的编码信息，作为对话历史编码模型的输出；3对下一轮的对话动作进行预测使用对话历史的编码信息He、历史对话动作序列的特征表示以及对话信念状态V＝{v1，v2，v3，...，vn}来预测下一轮的动作，首先将历史对话动作序列A＝a1，a2，a3，...，acur与信念状态V来进行结合；其中代表着对话信念状态第t步的表示向量，通过vt使用独热编码的方式计算得到，代表着对话的动作序列A＝a1，a2，a3，...，acur第t步输入单词的嵌入向量，Wb表示可训练参数，每一步的构成矩阵之后利用TransformerDecoder构建对话动作预测模型ActDecoder，输入对话历史的编码信息He、历史对话动作序列编码以及Ua来进行计算：Ca＝ActDecoderUa，0，0ActDecoderUa，0，0＝TransformerDecoderua，0，0 TransformerDecoderUa，O，O＝FFNMultiHeadMultiHeadUa，Ua，Ua，O，O 其中Ca表示对话动作预测模型ActDecoder的输出，TransformerDecoder表示TransformerDecoder模型，表示Ca第t步的向量，concat表示对两个向量进行拼接，通过线性映射FFN与激活函数softmax预测下一个词at，并且将对话动作预测模型每一步的结果组合得到下一轮对话动作的编码信息4生成回复使用下一轮的对话动作信息编码Ha、历史对话动作序列编码与对话历史编码He进行回复生成，使用TransformerDecoder模型构建对话回复生成模型ResDecoder，模型生成过程使用自回归的方法逐步生成，每一步生成一个单词yt，生成的单词组成回复Y＝{y0，y1，...，yt}，第一步初始化的时候Y＝{[BOS]}，其中[BOS]是特殊标签，之后每一步生成的结果将加入到Y中，并且来帮助后续的生成；具体公式如下： Mr＝TransformerDecoderGr，Ha，HaCr＝TransformerDecoderGr，0，0 其中Mr和Cr是TransfromerDecoder模型输出结果的编码，concat表示拼接操作，0是拼接后的向量结果编码，表示生成结果Y中的第t步生成结果的编码，表示生成结果Y中第1步到第t-1步结果的编码，则表示Mr和Cr中第t步的编码，yt表示第t步生成的单词，y1：t-1表示第1步到第t-1步生成的单词结果；由对话动作编码模型、对话历史编码模型、对话动作预测模型以及对话回复生成模型构成整体的对话模型，在训练过程中的损失函数计算将分为两部分，对话动作生成的损失计算以及对话回复生成的损失计算，分别记为和其中，θ代表着对话模型的参数，T表示对话历史，D表示对话数据库，V表示信念状态，和分别代表对话动作生成的损失函数以及对话回复生成的损失函数；并且使用如下公式对两个函数进行平衡：其中σ，σ代表可学习的参数，则为整个对话模型最后是用的损失函数。

全文数据：

权利要求：

百度查询：华东师范大学一种基于深度学习的对话模型构建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于动态正交子空间的质量相关微小故障检测方法

下一篇：基于多目标优化的异构计算资源调度方法及装置

相关技术

基于动态正交子空间的质量相关微小故障检测方法

基于多目标优化的异构计算资源调度方法及装置

深度学习框架中功能模块适配方法及装置

FCRN抗体及其使用方法

激光泵浦光热微区荧光寿命测温系统

一种市政施工给水排污管道组件

一种金属结构管内部应力检测装置

一种功能化壳聚糖基复合气凝胶、制备方法和用途

一种新型发光车标及成型工艺

一种(R)-3-氨基哌啶双盐酸盐的制备方法及转氨酶

一种空气处理设备及控制方法

一种激光直写纸基多通道LIG传感器的制备方法及其应用

模型相关技术

基于地质模型和结构模型的BIM模型接口及其构建方法_北京城建勘测设计研究院有限责任公司_202410576350.6

人源化小鼠模型_杰克逊实验室_202280090859.9

一种模型训练方法、模型应用方法和相关装置_腾讯科技(深圳)有限公司_202310265503.0

大语言模型辅助的机器学习算法模型推荐方法及系统_上海声通信息科技股份有限公司_202410680176.X

基于CLIP模型和生成式模型的街道深度图生成方法_北京建筑大学_202410409637.X

图像处理模型的训练方法、装置、图像处理方法及模型_华为技术有限公司_202011132152.9

电池热失控模型的建模方法及电池热失控模型的建模装置_北京车和家汽车科技有限公司_202310260854.2

神经内镜基础训练模型_医伴无忧(广州)科技有限公司_202323616129.9

预测模型训练方法及系统_北京明略软件系统有限公司_202011285086.9

模型评估检测方法及装置_北京金山云网络技术有限公司_201911211869.X

构建相关技术

地图构建方法、装置以及车辆_广州小鹏自动驾驶科技有限公司_202410630620.7

一种知识产权技术体系构建方法_中国航空工业集团公司西安飞机设计研究所_202410759848.6

一种钢结构建筑施工架_成都锡蓉新材料有限公司_202420235850.9

指令依赖构建方法、装置、设备及可读存储介质_北京开源芯片研究院_202411116818.X

一种钢结构建筑用支撑装置_成都锡蓉新材料有限公司_202420234310.9

一种VPN组网的构建方法及装置_新华三信息安全技术有限公司_202410895644.5

智能标识解析系统的构建方法及解析系统_哈尔滨工程大学_202410869805.3

语义地图的构建方法、装置、设备及存储介质_杭州萤石软件有限公司_202410683015.6

肠炎沙门菌mcpC基因缺失株的构建方法_河北科技师范学院_202410820117.8

使用折叠球囊组件构建止血装置的方法_泰尔茂株式会社_202080017753.7

学习相关技术

基于视觉提示的连续学习算法_江苏师范大学_202410784006.6

一种基于监督学习与强化学习的机动决策训练方法_中国航空研究院_202410654343.3

一种基于联邦学习与类增量学习的wifi人员身份识别方法_南华大学_202311763304.9

一种声乐学习辅助用隔音舱_河南嘉创智能设备制造有限公司_202420128942.7

一种自动调节式学习桌_南通双欧木业有限公司_202420256016.8

使用机器学习检验光罩的系统和方法_科磊股份有限公司_202410943696.5

一种基于增量学习的目标检测方法_中科苏州智能计算技术研究院_202110717472.9

基于元学习的电池SOC估算方法及装置_汉阳大学校产学协力团_202380019319.6

基于半监督迁移学习的焊缝缺陷检测方法_中国二十二冶集团有限公司_202410782139.X

机器学习训练数据调度方法及设备_贝格迈思(深圳)技术有限公司_202410155756.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于深度学习的对话模型构建方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务