买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:创络(上海)数据科技有限公司
摘要:本发明提供一种基于情感分类的多层归因图谱构建方法,包括:步骤一、数据处理:步骤二、利用步骤一中处理后得到的样本,进行LSTM网络搭建,并训练得到如下两个模型:a情感倾向的极性分类预测模型,b负向内容倾向的方面级相关分类预测模型,步骤三、方面特征框架的形成:步骤四、将模型a和模型b训练建模后,对预测样本进行预测形成两种不同分类的预测结果标签,并对结果标签进行交叉,形成更细化的分类,最后提取其中的负向内容,结合上述模型的LSTM预测标签,形成方面级特征框架雏形;步骤五、对于方面级特征框架雏形中每个细分群进行进一步关注级细化分群。本发明对评论的归纳更方便用户针对性制定应对措施。
主权项:1.一种基于情感分类的多层归因图谱构建方法,其特征在于,包括如下步骤:步骤一、数据处理:对打好标签的辅助领域和源领域的样本,使用分词工具进行分词、对标点和停用词处理,并且将分词后的文本映射成向量;步骤二、利用步骤一中处理后得到的样本,进行LSTM网络搭建,并训练得到如下两个模型:a情感倾向的极性分类预测模型,b负向内容倾向的方面级相关分类预测模型,步骤三、方面特征框架的形成:利用上述训练好的模型a和模型b对新数据进行标签预测打标,根据模型a生成情感倾向的极性分类标签,根据模型b生成负向内容倾向的方面级相关分类标签,形成方面级大类框架;步骤四、将模型a和模型b训练建模后,对预测样本进行预测形成两种不同分类的预测结果标签,并对结果标签进行交叉,形成更细化的分类,最后提取其中的负向内容,结合上述模型的LSTM预测标签,形成方面级特征框架雏形;步骤五、对于方面级特征框架雏形中每个细分群进行进一步关注级细化分群,方式如下:再次通过框架内聚类分群对关键词进行不同粒度的多层细分,形成可供专家自由选择的分合弹性归纳空间,然后结合业务归纳及可辨识度,进一步根据交互观测图谱确定合适的细分粒度,通过这种交互归纳提炼出可理解、可操作的多项关注级细化关注点,并提取其中的特征关键词,补充到层级特征关键词映射表中;清晰化聚焦分群:在不影响清晰化也不影响操作针对性,且可控的前提下,对于每个关注级细化分群覆盖到尽可能多的评论样本,对于需要引入的类群,提取其中对应层级特征关键词增入到层级特征关键词映射表中;对方面级特征框架雏形中的每个细分群均作上述处理,逐步形成基于评论内容的多层归因图谱;步骤五中,在步骤四搭建形成的方面级特征框架雏形范围内,针对其中的每个细分评论群,根据业务视角分群的交互图谱和经无监督模型分类后的类群对应的交互图谱之间的清晰度和区分程度穿插构建聚焦分群;步骤五中,还包括形成补充细分群的步骤:形成补充细分群:若在无监督分类模型中有出现,但前期业务关键词梳理中未包含的细分群,根据观测到的图谱内容,补充层级特征关键词到映射表中;步骤二中,情感倾向的极性分类预测模型,第一层采用bi-LSTM最后的1个输出单元经sigmoid函数计算,得到最终的分类值;负向内容倾向的方面级相关分类预测模型采用标准的LSTM神经网络,之后形成多个输出单元由softmax层计算得出对应的分类值。
全文数据:
权利要求:
百度查询: 创络(上海)数据科技有限公司 一种基于情感分类的多层归因图谱构建方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。