买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:厦门快商通科技股份有限公司
摘要:本发明公开了一种对话系统语义分析方法、系统、电子装置及存储介质,所述方法包括步骤a.获取对话数据,并进行预处理得到待训练的语料信息;步骤b.采用所述待训练的语料信息训练word2vec模型;步骤c.基于所述word2vec模型构建语义分析模型;步骤d.将待分析语料信息输入至所述语义分析模型中,所述语义分析模型包括word2vec嵌入层、BiLSTM层、CDW层和线性分类层。本发明提供了一种对话系统语义分析方法、系统、电子装置及存储介质,能够简单高效地区分用户语义,提供准确语义信息,为智能对话系统的下一步行为提供可靠的指导。
主权项:1.一种对话系统语义分析方法,其特征在于,包括以下步骤:步骤a.获取对话数据,并进行预处理得到待训练的语料信息;步骤b.采用所述待训练的语料信息训练word2vec模型;步骤c.基于所述word2vec模型构建语义分析模型;步骤d.将待分析语料信息输入至所述语义分析模型中,所述语义分析模型包括word2vec嵌入层、BiLSTM层、CDW层和线性分类层;具体语义分析过程包括如下步骤:d1.所述word2vec嵌入层提取所述待分析语料信息的词向量信息,所述BiLSTM层用于获取待分析语料的上下文信息;d2.所述CDW层根据所述待分析语料的词向量信息和上下文信息获取所述待分析语料的语义信息;d3.所述线性分类层根据所述语义信息进行分类,得到二分类结果1或0作为语义分析结果,其中1代表主动问询,0代表被动回答;其中,所述步骤b包括如下步骤:b1.采用NER算法对预处理后的所述待训练的语料信息进行实体识别,确定所述待训练的语料信息中所包含的实体;b2.采用Jieba分词对预处理后的所述语料信息进行分词,并统计分词结果的词频T;b3.将分词结果中未识别出的实体进行手动合并,并保留;b4.采用Gensim包训练并保存word2vec模型;所述语义分析模型还包括Dropout层和LayerNorm层;所述待分析语料信息依次经过word2vec嵌入层、Dropout层、BiLSTM层、LayerNorm层、CDW层和线性分类层;所述步骤d2,具体包括如下步骤:d21.计算每个字的第一权重, ;其中,i表示第i句话,t表示第i句话中的第t个字符,为第i句话中的第t个字符经过所述LayerNorm层后的输出,为对应的权重,为对应的偏置;d22.计算每个字与中心词的距离关系, ;其中,为所述中心词的位置,所述中心词为第i句中所包含的症状、疾病或检查实体其中之一,m为阈值;d23.基于阈值参数和每个字与中心词的距离关系,得到每个字的第二权重, ;其中,n为第i句的句子长度;d24.计算整个句子的特征向量, 其中,为第i句话中的第t个字符对于语义信息的贡献程度;d25.根据所述整个句子的特征向量,得到二分类结果,1代表为主动问询,0代表被动回答。
全文数据:
权利要求:
百度查询: 厦门快商通科技股份有限公司 一种对话系统语义分析方法、系统、电子装置及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。