首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

面向招聘领域的职位概念自动获取与图谱扩展的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:深圳今日人才信息科技有限公司;复旦大学

摘要:本发明公开一种面向招聘领域的职位概念自动获取与图谱扩展的方法,包括如下步骤:构建概念生成模型、层级文本分类模型;将岗位描述文本输入层级文本分类模型,输出与其对应的三级概念标签;判断该岗位描述文本是否属于现有的Taxonomy中的某个概念实体,若不属于,则调用概念生成模型生成与该岗位描述文本对应的新概念实体;在现有的Taxonomy中,寻找与该新概念实体对应的上位概念实体,并将该新概念实体作为上位概念实体的下位词。本发明设计了从概念生成到概念分类,再到概念扩展的完整自动化框架,整个框架流程和各模块的触发关系是具有独创性的,且在实际业务场景中验证了有效性。

主权项:1.一种面向招聘领域的职位概念自动获取与图谱扩展的方法,其特征在于,包括如下步骤:构建概念生成模型、层级文本分类模型;将岗位描述文本输入层级文本分类模型,输出与其对应的三级概念标签;基于三级概念标签,判断该岗位描述文本是否属于现有的Taxonomy中的某个概念实体,若不属于,则调用概念生成模型生成与该岗位描述文本对应的新概念实体;在现有的Taxonomy中,寻找与该新概念实体对应的上位概念实体,并将该新概念实体作为上位概念实体的下位词;所述层级文本分类模型包括文本嵌入、分类器,且采用交叉熵损失函数进行调优,其中,文本嵌入:在岗位描述文本di的前后加上特殊字符[CLS]和[SEP],处理成BERT模型的输入格式:“[CLS]di[SEP]”,随后,将其输入BERT模型,最后将输出层中[CLS]位置的嵌入作为岗位描述文本的最终嵌入;分类器:所述分类器为768,k的一个MLP模型,其中k代表分类类别数,将BERT模型输出的文本嵌入送入分类器,得到该岗位描述文本在各个类别上的概率分布;所述层级文本分类模型包括第一层级分类模型、第二层级分类模型、第三层级分类模型,以分别用于处理三个层级的概念分类任务,且在数据层方面,是基于招聘语料库中的弱标注数据,通过数据清洗和增强得到至少4000条带三级标签的样本,其中,每一级标签都对应现有Taxonomy中的一个节点;所述第一层级分类模型的分类器设定为768,19,其训练步骤包括:将岗位描述文本处理为BERT模型的输入格式后,输入至BERT模型,再使用交叉熵损失函数训练模型;所述第二层级分类模型的分类器设定为768,120,其训练步骤包括:根据岗位描述文本di对应的一级标签label_1得到Prompt,并添加到岗位描述文本di前,再将其处理为BERT模型的输入格式,并输入至BERT模型,使用交叉熵损失函数训练模型,其中,Prompt为:“第一层级概念为label_1”;所述第三层级分类模型的分类器设定为768,800,其训练步骤包括:根据岗位描述文本di对应的一级标签label_1和二级标签label_2,得到Prompt,并添加到岗位描述文本di前,再将其处理为BERT模型的输入格式,并输入至BERT模型,使用交叉熵损失函数训练模型,其中,Prompt为:“第一层级概念为label_1,第二层级概念为label_2”。

全文数据:

权利要求:

百度查询: 深圳今日人才信息科技有限公司 复旦大学 面向招聘领域的职位概念自动获取与图谱扩展的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。