买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京富士通南大软件技术有限公司
摘要:本发明公开了一种ChatBot系统中用户日语会话意图识别方法,利用情感字典根据词性计算用户当前的情绪值,并根据不同的情绪作不同的处理,同时通过与FAQ文件进行相似度匹配,可直接返回FAQ中相近内容的回答,同时通过槽位记住用户之前的输入内容并识别用户的会话意图。当用户输入带有极度消极单词不开心、伤心,很难过等的情况下,自动切换到人工客服;用户输入某一机能模块的关键字时,会为用户提供进入该模块以及相近模块的快速入口;当用户输入与业务相关的语句时,会向用户显示在FAQ文件中相近问题的回答;当用户进入某一业务话题后,不用用户重复输入,即可根据用户之前的输入内容直接回复。
主权项:1.一种ChatBot系统中用户日语会话意图识别方法,其特征在于,包括以下步骤:S1:接受到来自客户端用户的输入时,判断用户当前的输入是否是初次会话,若是初次会话,则直接返回主菜单,若不是初次会话,则从数据库提取当前用户的会话记录,并进入步骤S2的处理;S2:对于非初次会话,判断用户的当前输入是针对前一次会话的选择还是全新的质问语句;若是选择,则直接返回选择的结果,若是全新质问,则进入步骤S3的处理;S3:对本次输入的语句通过自然语言处理的切词技术进行切割,得到一个切割后的单词组;然后对单词组进行数据清洗,删除对语义理解无关的内容,最终生成一个干净的、无噪音数据的单词组;S4:对数据清洗后的单词组中每个单词进行品词,识别每个单词的词性,并根据词性到不同的情感字典中寻找相近单词,并根据不同词性的权重进行加权平均,获得整个语句的情感得分,若是极度消极情绪,则切换到人工客服对应,否则进入步骤S5的处理;S6:对数据清洗后的单词组使用TF-IDF算法,将单词转换为词向量,并对FAQ文件中的所有问题进行TF-IDF算法进行向量化,生成FAQ文件的词向量库;S7:将单词组的词向量与词向量库中的每一个向量进行CosineSimilarity计算,得到当前单词组到FAQ词向量库的所有距离;S8:计算得到的当前单词组到FAQ词向量库的所有距离与设定的阈值1进行比较,若有距离大于设定的阈值1的结果,则直接返回该相似度最高结果对应的回答,否则,计算得到的当前单词组到FAQ词向量库的所有距离与阈值2继续比较,若有大于设定阈值2的结果,则返回所有结果的回答;若均没有,否则进入步骤S9的处理;S9:对于用户当前输入的内容根据关键字进行主题匹配,在主题内进行关键字匹配,通过槽位识别当前用户输入内容的意图,将匹配中的结果返回给用户,同时将本次会话的内容写到数据库中。
全文数据:
权利要求:
百度查询: 南京富士通南大软件技术有限公司 一种ChatBot系统中用户日语会话意图识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。