Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于自然语义分析的入职意愿评估方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:乐麦信息技术(杭州)有限公司

摘要:本发明提供一种基于自然语义分析的入职意愿评估方法及系统,涉及语义识别技术领域,包括基于历史求职者的文本信息和对应入职意愿标签,构建入职意愿评估语料库,提取入职意愿评估语料库的多粒度特征,动态调整多粒度特征的权重,确定多粒度细化特征;基于多粒度细化特征,得到序列化语义特征表示,基于求职者属性信息,提取属性特征表示,基于工作经历、教育经历和项目经验提取局部语义信息,得到字段语义特征表示;通过特征融合算法进行特征融合,形成多粒度特征表示向量;将多粒度特征表示向量输入入职意愿评估模型,通过多层双向门控循环单元网络进行深层特征提取,并引入层注意力机制自适应调整各层特征的权重,进行入职意愿强度概率预测。

主权项:1.基于自然语义分析的入职意愿评估方法,其特征在于,包括:基于历史求职者的文本信息和对应入职意愿标签,构建入职意愿评估语料库,提取所述入职意愿评估语料库的多粒度特征,动态调整所述多粒度特征的权重,确定多粒度细化特征,其中所述文本信息包括求职者属性信息、工作经历、教育经历、项目经验;基于所述多粒度细化特征,提取全局语义信息和长距离依赖关系,结合注意力机制动态聚合关键语义信息,得到序列化语义特征表示,基于所述求职者属性信息,提取属性特征表示,基于所述工作经历、所述教育经历和所述项目经验提取局部语义信息,并构建字段交互关联,得到字段语义特征表示;将所述序列化语义特征表示、所述属性特征表示和所述字段语义特征表示通过特征融合算法进行特征融合,形成多粒度特征表示向量;将所述多粒度特征表示向量输入入职意愿评估模型,通过多层双向门控循环单元网络进行深层特征提取,并引入层注意力机制自适应调整各层特征的权重,进行入职意愿强度概率预测;基于历史求职者的文本信息和对应入职意愿标签,构建入职意愿评估语料库,提取所述入职意愿评估语料库的多粒度特征,动态调整所述多粒度特征的权重,确定多粒度细化特征包括:构建入职意愿评估语料库,所述语料库中的每条语料样本由求职者的文本信息和对应的入职意愿标签组成;对所述语料库中的文本信息进行预处理,包括中文分词、词性标注、命名实体识别和停用词过滤,并将预处理后的文本转化为词向量序列;基于所述词向量序列,通过关键词频次统计和情感极性计算,确定单个词语的重要性和情感属性,提取词汇级特征,通过捕捉局部词序模式以及挖掘依存关系,提取句法级特征,通过确定主题分布和语义向量,提取语义级特征;所述词汇级特征、所述句法级特征和所述语义级特征构成多粒度特征;基于所述多粒度特征分别计算各粒度内不同特征的注意力权重,通过加权求和得到聚合后的词汇级细化特征向量、句法级细化特征向量和语义级细化特征向量;将词汇级细化特征向量、句法级细化特征向量和语义级细化特征向量进行拼接,形成多粒度细化特征;基于所述词向量序列,通过关键词频次统计和情感极性计算,确定单个词语的重要性和情感属性,提取词汇级特征,通过捕捉局部词序模式以及挖掘依存关系,提取句法级特征,通过确定主题分布和语义向量,提取语义级特征包括:通过统计关键词出现次数,提取关键词频次,确定词语的重要性,基于预先设置的情感词典,计算每个词语的情感极性;将所述关键词频次和所述情感极性结合,生成每个词语对应的词汇级特征向量;通过构建滑动窗口,在每个窗口内捕获词语的顺序和组合,获得词语间的局部顺序关系,生成局部词序模式;基于预先构建的依存句法分析器,挖掘词语在句子中的语法角色和结构信息,获得依存关系,将所述局部词序模式和所述依存关系结合,生成句法级特征向量;利用预先构建的主题模型进行主题分析,确定每个词语属于不同主题的概率分布,获得主题分布;利用预训练的词嵌入模型将每个词语映射到低维稠密语义空间,捕捉词语间的语义相似性和关系,获得语义向量;将所述主题分布和所述语义向量结合,生成语义级特征向量;将所述序列化语义特征表示、所述属性特征表示和所述字段语义特征表示通过特征融合算法进行特征融合,形成多粒度特征表示向量包括:将所述序列化语义特征表示、所述属性特征表示和所述字段语义特征表示分别通过映射矩阵和偏置项映射到相同的维度,得到同维度映射特征表示;对聚类中心矩阵和归属概率矩阵进行初始化,开始迭代更新:基于所述同维度映射特征表示与所述聚类中心矩阵中每个聚类中心向量的相似度,更新所述归属概率矩阵,基于所述归属概率矩阵和所述同维度映射特征表示,更新所述聚类中心矩阵;直到达到预设的迭代次数,确定最终归属概率矩阵和最终聚类中心矩阵;根据所述同维度映射特征表示与最终聚类中心矩阵中各聚类中心向量的相似度,计算注意力权重矩阵;根据最终归属概率矩阵、注意力权重矩阵和同维度映射特征表示,通过加权求和的方式,得到多粒度特征表示向量;根据所述同维度映射特征表示与最终聚类中心矩阵中各聚类中心向量的相似度,计算注意力权重矩阵包括:计算注意力权重矩阵中的每个元素,其公式如下: ;其中,aij表示特征向量ui与聚类中心cj的注意力权重,waT表示注意力权重的参数向量的转置,ui表示第i特征向量,cj表示第j聚类中心,[ui;cj]表示特征向量ui和聚类中心cj连接成的向量,k表示聚类中心总数,j'表示进行累加计算的聚类中心序数,cj'表示当前累加的聚类中心;结合注意力权重矩阵,计算所述最终归属概率矩阵中的每个元素,其公式如下: ;其中,bij表示特征向量ui属于聚类中心cj的归属概率,uiT表示特征向量ui的转置;所述入职意愿评估模型包括:构建双向门控循环单元层,通过前向门控循环单元捕捉前向上下文信息,获得前向隐藏状态,并通过后向门控循环单元捕捉后向上下文信息,获得后向隐藏状态,通过拼接所述前向隐藏状态和所述后向隐藏状态,确定所述双向门控循环单元层的输出序列;堆叠多个所述双向门控循环单元层,构建多层双向门控循环单元网络,基于所述输出序列,通过注意力机制计算每一层所述双向门控循环单元层的权重系数,动态调整每一层的权重,将所述输出序列和所述权重系数进行加权求和,提取深层特征表示;将所述深层特征表示通过全连接层映射到预测入职意愿强度的概率空间,得到求职者入职意愿强度的预测概率值;通过注意力机制计算每一层所述双向门控循环单元层的权重系数,动态调整每一层的权重包括:计算每一层的注意力得分,其公式如下: ;其中,sm表示第m层的注意力得分,Wm表示第m层注意力机制的权重矩阵,Hm表示第m双向门控循环单元层的输出序列,bm表示第m层注意力机制的偏置向量,δm表示第m层注意力机制的门控系数,P表示输入的总时间步,p表示时间步序号,hpm表示第m层第p个时间步的隐藏状态;基于注意力得分计算注意力权重系数,其公式如下: ;其中,αm表示第m层的归一化注意力权重系数,βm表示第m层注意力得分的缩放因子,γm表示第m层注意力得分的偏置项,q表示层数序号,Q表示双向门控循环单元网络的总层数,βq表示第q层注意力得分的缩放因子,sq表示第q层的注意力得分,γq表示第q层注意力得分的偏置项。

全文数据:

权利要求:

百度查询: 乐麦信息技术(杭州)有限公司 基于自然语义分析的入职意愿评估方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。