买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广州启辰电子科技有限公司;华南理工大学
摘要:本发明公开了一种面向试题知识点分类的层次化语义匹配方法。本发明方法首先构建了试题知识点层次化结构,将试题文本语义和知识点层次化语义映射到两者的联合空间中,使用语义匹配方法建模试题文本语义与不同试题知识点层次化结构的匹配关系。该匹配关系由试题知识点层次化结构所决定。具体而言,试题文本语义与试题核心考察的知识点语义是较为匹配的,与无关的知识点语义是不匹配的。在试题知识点分类应用时,本发明方法可以根据试题文本语义与知识点文本语义的匹配距离远近,获得层次化感知的知识点分类结果,该发明方法分类效果较好,具有一定的解释性。
主权项:1.一种面向试题知识点分类的层次化语义匹配方法,该方法包括以下步骤:S1、根据试题知识点的层次化结构,将知识点标签l=l1,l2,...lK构建为试题知识点层次化结构,K为知识点标签的数量;标签与标签间的连边值表示为e=el1-l2,el1-l3,...el1-lK,若在试题知识点层次化结构中,两个知识点标签存在联系,则连边值为1,不存在联系则连边值为0;S2、将试题文本切分为句子s=s1,s2,...sT,T为分句后的句子数量,每个句子切分为词w=w1,w2,...wS,S为每个句子的词语数量;将文本句子输入特征提取器BERTm1中,提取试题文本的向量表示为特征向量,上标i为向量维度;S3、基于S1中的知识点标签l和标签间连边e,构建描述层次化结构的有向图G=V,E;其中有向图G的结点为V,由知识点标签l构建,有向图G的结点连边E由标签间连边e构建;为了提取体现层次化结构的特征向量,首先将知识点标签l的文本转换为向量表示,然后将有向图G输入特征提取器GCNm2中,提取知识点层次化语义向量表示为特征向量,上标j为向量维度;S4、基于试题文本的向量表示Ht和知识点层次化语义向量Hl,使用MLP神经网络将Ht和Hl映射到联合空间中;联合空间中,试题文本的向量表示为知识点层次化语义向量为上标k为联合空间中的向量维度;S5、基于S4中获得的联合空间向量表示,结合知识点层次化结构特定进行匹配学习;首先,使用联合空间损失函数对联合空间向量表示进行约束;其次,使用边缘损失函数建模试题文本向量表示与其他知识点向量表示的关系;其中,联合空间损失函数过程如下: ;损失函数的形式是L2范数的平方差,其中g表示与该试题最切合的知识点;边缘损失函数过程如下: ;其中,D为语义距离度量函数L2范数,n表示与该试题不完全切合的知识点,γ表示损失函数惩罚的权重;S6、在神经网络训练时,基于所述联合空间损失函数、边缘损失函数进行梯度反向传播训练,获得一个知识点分类模型;S7、基于以上方法训练神经网络模型后,在进行试题知识点分类时,在联合空间中搜索与试题文本语义最相近的若干个知识点标签语义,获得试题知识点分类标签,具体形式如下: ;其中,Ylabel为试题知识点分类标签,表示试题文本语义与知识点标签的语义距离,ξ表示分类阈值,若试题文本语义与特定知识点标签的语义距离小于该阈值,则视为可归类为该标签。
全文数据:
权利要求:
百度查询: 广州启辰电子科技有限公司 华南理工大学 一种面向试题知识点分类的层次化语义匹配方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。