买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华中师范大学
摘要:本发明属于知识追踪技术领域,提供一种基于学习过程片段的时空注意力知识追踪方法,包括以下步骤:1知识跟踪问题定义和数据预处理;2时空注意力模型的构建;3模型的训练与预测。本发明方法从学习过程片段的角度建模知识追踪问题,使得模型可以同时建模答题者学习速率和知识状态,可适应不同答题者之间的差异,并加入基于时序注意力的遗忘机制,考虑答题者学习过程中的遗忘过程,更加符合人类的学习规律,对学习过程更好的建模。
主权项:1.一种基于学习过程片段的时空注意力知识追踪方法,其特征在于该方法包括以下步骤:1知识跟踪问题定义和数据预处理;1-1问题定义:给定一个学生包括T个学习交互的学习序列IT=i1,i2,…,it,评估学生每次学习交互后的知识状态;在学习序列中,it是一个有序数对{et,at},代表一次学习交互,其中et表示在第t个练习,at∈{0,1}用来表示练习et答对或答错,其中,1表示答对,0表示答错;知识追踪表示为如下公式:pt=fhtht=ght-1其中pt∈{0,1},即通过模型g·以及t-1时刻的知识状态ht-1得到答题者后一个时刻t知识状态ht,再通过f·以及ht预测该题答对的概率pt;1-2数据采集:数据来源包含了答题者历史答题记录,每个答题者的答题记录包括练习的编号、该练习包含的技能编号信息以及答题者对该练习的答题结果信息;1-3数据预处理:将每一位答题者历史记录处理成三行数据,第一行是该答题者的编号和答题数量,第二行是该答题者的答题历史记录中题目的编号,第三行为对应题目的答题结果,其长度与第二行一致,即答题结果与练习编号一一对应;2时空注意力模型的构建;模型分为四个模块:编码器、片段特征提取模块、空间注意力模块、输出模块,其中,片段特征提取模块和编码器模块中均存在时序注意力模块,时序注意力模块与空间注意力模块共同构成时空注意力;各个模块具体如下:编码器:编码器由3个时序多头注意力模块组合而成;将练习序列E={e1,e2,…,et}首先进行Embedding得到Ee,然后输入到其中一个时序多头注意力模块T,得到Encodere=MultiHeadAttentionEe,Ee,Ee;将答题序列A={a1,a2,…,at}首先进行Embedding得到Ae,然后输入另一个时序多头注意力模块T,得到Encodera=MultiHeadAttentionAe,Ae,Ae;最后将得到的Encodere和Encodera作为第三个时序多头注意力模块T的输入,得到最后的输出X={x1,x2,…,xt},即有:X=MultiHeadAttentionEncodere,Encodere,Encodera,此时X同时包含了练习和答题信息;片段特征提取模块:该模块由N×M个基于片段的时序注意力模块组合而成,基于片段的时序注意力模块由深度因果卷积网络C和时序多头注意力T组成;因果卷积网络层数为M,每一层有N个不同卷积核大小的C,每一个C连接着一个T,组成C-T模块;编码器输出的练习-答题结果表示X将会首先输入到第一层的N个C中,每个C计算完成后除了将计算后的数据传递给下一层的C,还会作为T的输入;令每一个C的输出为Cij,则每个C-T的输出sij=MutiHeadAttentionCij,Cij,Cij,i∈N,j∈M;空间注意力模块:将片段特征提取模块输出sij进行压栈操作得到高维向量U,然后将U作为输入依次通过全局池化层、全连接层、ReLU激活层、全连接层、Sigmoid激活函数层得到每个sij的权重W,其中W={w11,w12,…,wij},然后通过将其加权求和得到最终的输出Sout;输出模块:将空间注意力模块输出Sout通过一个前馈传播网络得到最后的输出Hout,前馈传播网络由3个全连接网络组成,Hout={h1,h2,…,ht},ht表示t时刻答题者的知识状态;3模型的训练与预测;数据输入通过模型获得答题者的t时刻的学习状态ht,下一题的预测值用公式表示为:pt=σht-1·εt,其中εt为et的独热编码,pt为下一题即et答对的概率,σ为Sigmoid函数,使得pt∈{0,1},损失函数为二元交叉熵损失函数,优化器使用Adam,学习率选择{0.001,0.0003,0.00001}。
全文数据:
权利要求:
百度查询: 华中师范大学 一种基于学习过程片段的时空注意力知识追踪方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。