Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于自监督学习的职位推荐方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:职多多(山东)智能科技集团有限公司

摘要:本发明提供了一种基于自监督学习的职位推荐方法,属于基于计算机数据处理的职位推荐技术领域。本发明获取求职者简历数据和公司招聘信息数据,对数据进行匿名化处理、数据清洗和数据增强;新设计职位推荐模型,基于预处理后数据,对模型进行无监督的强化学习训练与优化,模型可提取语义特征并进行交互融合,得到匹配评分;设计语义匹配策略,度量求职者简历和公司招聘信息之间的语义相似度,利用余弦相似度原理计算两种特征表示的语义相似分数,优化匹配分数,基于优化后的分数进行职位推荐。本发明创新性地提出了一种融合卷积神经网络、双向长短期记忆网络和多头注意力机制的架构,全方位挖掘文本的丰富语义信息,可精准推荐职位并可不断优化。

主权项:1.一种基于自监督学习的职位推荐方法,其特征在于,包括以下过程:S1,获取求职者简历数据;S2,对求职者简历数据进行预处理;S3,基于预处理后的求职者简历数据和公司招聘信息数据,调用自监督策略训练的职位推荐模型,提取语义特征并进行交互融合,得到匹配评分;所述职位推荐模型包括语义特征提取模块、多头注意力机制层、残差模块和预测输出模块;所述语义特征提取模块用于从求职者简历数据和公司招聘信息数据分别提取对应的语义特征表示,即求职者简历语义特征和公司招聘信息语义特征;所述多头注意力机制层,基于输入的语义特征表示捕捉两者之间的复杂交互关系;所述残差模块将多头注意力机制得到的交互特征和求职者简历语义特征和公司招聘信息语义特征进行残差连接,得到加权融合特征;所述预测输出模块将加权融合特征,添加全连接层输出最终的预测评分;所述语义特征提取模块采用卷积神经网络CNN和双向长短期记忆网络Bi-LSTM的融合架构,以充分挖掘文本的局部语义、全局语义和跨语义依赖关系;所述卷积神经网络包括卷积层、归一化层、ReLU激活函数层和最大池化层;所述卷积层通过应用滑动卷积核在输入的求职者简历数据上进行卷积运算,生成新的特征映射序列: ;其中,为经过卷积层得到的特征序列;为卷积核,为卷积核宽度,为输入\输出通道数;为输入求职者简历序列在位置的维词向量窗口;为卷积运算符;为偏置项;为激活函数;所述归一化层对卷积层的输出进行标准化处理;所述ReLU激活函数层引入非线性激活,赋予模型提取高阶特征的能力;所述最大池化层对ReLU激活函数层输出的特征序列进行下采样,保留局部最显著特征最终得到求职者简历数据的特征语义表示以及公司招聘信息数据的特征语义表示;所述Bi-LSTM将得到的求职者简历特征语义表示以及公司招聘信息特征语义数据连接到具有128个隐藏单元的Bi-LSTM层,传入的数据通过前向和后向隐藏状态进行传播,从而产生由双向时间操作派生的隐藏层输出;前向LSTM和后向LSTM隐藏层的状态更新以及Bi-LSTM的最终输出过程为: ; ; ;其中,表示时刻对应的输入数据;分别表示LSTM对应前向迭代的隐藏状态;和分别表示LSTM对应的后向迭代的隐藏状态;和表示时刻对应的输出数据;为各层的权重;和分别为不同层之间的激活函数;最后将输出的数据进行时间堆叠得到最终的Bi-LSTM输出: ;将公司招聘信息特征语义数据以同样的处理过程得到对应的输出;所述多头注意力机制层将求职者简历语义特征视为查询Q;同时,将公司招聘信息语义特征视为键K和值V: ;其中,为自注意力机制函数,为激活函数,为求职者简历语义特征,为公司招聘信息语义特征,为键向量的维度;通过计算求职者简历查询Q和公司招聘信息键K的相关性分数,动态调节对不同特征的关注程度,自动学习两者之间的内在映射关系;通过多头注意力从不同子空间提取交互信息: ; ;其中,为多头注意力机制的输出,在该机制中,每个头head都会生成一个输出向量,然后将这些输出向量连接起来,为连接操作,在连接之后,将得到的向量乘以一个权重矩阵进行线性变换,将其映射到期望的输出维度上,分别为第i个注意力头的线性投影,将查询、键和值映射到对应子空间;S4,采用语义匹配策略,将求职者简历语义特征作为查询向量,公司招聘信息语义特征作为参考向量,利用余弦相似度原理计算两者的语义相似分数,优化匹配分数;具体为设计一种无标签的语义匹配计算方法:首先,将求职者简历语义特征和公司招聘信息语义特征拼接为单一序列:输入序列=[CLS]++[SEP]++[SEP]其中,[CLS]和[SEP]分别为序列起始和分隔标记;将拼接的输入序列传入语义特征提取模块的多头注意力机制,提取[CLS]标记对应的输出向量,作为整个序列的语义表示;同时,对于和的每个token,提取其与的注意力权重,作为该token对序列语义的重要程度: ; ;其中,和分别为求职者简历和公司招聘信息的第个token对序列语义的重要程度,和分别为求职者简历和公司招聘信息中的第个token,则该token对最终语义表示的重要性为: ; ;将求职者简历和公司招聘信息中所有token的重要性求和,分别得到: ; ;其中,和为求职者简历和公司招聘信息的语义表示向量;计算其的余弦相似度作为语义相似度分数: ;其中,为余弦相似度函数,该分数越接近1,表明求职者简历和公司招聘信息的语义越相似;S5,将输出的相似度语义分数按照分数高低进行排序,将得分最高的N个公司招聘信息推送给对应的求职者。

全文数据:

权利要求:

百度查询: 职多多(山东)智能科技集团有限公司 一种基于自监督学习的职位推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。