一种推荐架构下的基于对比学习调优的论文作者消歧方法

导航：龙图腾网> 最新专利技术> 一种推荐架构下的基于对比学习调优的论文作者消歧方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：浙江大学

摘要：本发明公开了一种推荐架构下的基于对比学习调优的论文作者消歧方法。本发明将论文作者消歧任务抽象为单塔推荐架构下的推荐排序问题。提出基于WideDeep推荐架构的排序算法解决基于表示的深度学习模型的语义漂移问题，实现基于多字段多实例注意力机制的深度模型与基于特征工程的线性模型相结合，使模型同时具备较强的泛化能力与记忆能力。此外，注意到真实匹配对之间应存在一定潜在模式的数据特点，针对性提出一种对比学习调优算法，引入对比学习损失，构建对比学习的正负样本，促使模型学习区分真实匹配对的高层次特征。

主权项：1.一种推荐架构下的基于对比学习调优的论文作者消歧方法，其特征在于，包括以下步骤：步骤1：获取已有的专家档案库G＝E，P，EP，F，其中E是专家集合，ei表示第i个专家，P是已消歧论文集合，EP是专家与已消歧论文的著作权从属关系集合，定义为{epi,j∈EP|专家ei的j篇论文}，F是属性字段集合；步骤2：对于待消歧论文作者对＜p，a∈PA，其中PA是待消歧论文作者对集合，p，a分别是论文和作者姓名，首先根据作者姓名a在专家档案库G中找到相关的候选专家实体集合CN，最终的候选集合C＝CN∪NIL，其中CN为专家档案库中匹配到的专家实体集合，NIL为不可链接指称项，代指不存在于已有专家档案库中的专家实体；将真实匹配专家记为c*，则c*∈C；步骤3：对于每个候选专家c∈C，将其发表的论文信息与待消歧论文作者对信息分别通过Wide模型和Deep模型得到浅层特征与深层特征的相似度向量表示，并拼接获得最终的相似度向量表示Simc；所述的步骤3具体为：步骤3-1：对于Wide模型，首先利用其内的浅层特征构建模块构建简单的线性特征Xp，a，c＝[X1＜p，a，c，...，Xn＜p，a，c]，其中，n为Wide模型使用的浅层特征数；然后通过两层线性层MLP生成浅层相似度向量表示χp，a，c：χp，a，c＝MLPXp，a，c步骤3-2：Deep模型基于不同属性字段与不同论文对消歧结果的影响，分别建模全局相似度编码模块与局部相似度编码模块，分别获得全局相似度向量表示和局部相似度向量表示，并融合获得深层相似度向量表示所述的步骤3-2具体包括如下步骤：步骤3-2-1：全局相似度编码模块利用候选专家c的所有论文，根据属性字段f∈F分组进行相似度计算，并使用注意力机制体现不同字段对相似度向量表示的影响，计算全局相似度向量表示φ＜p，a，c；步骤3-2-2：局部相似度编码模块基于专家发表的论文有多个主题的假设，认为待消歧论文只与部分候选专家论文强相关，而剩余论文弱相关甚至不相关，因此单独对待消歧论文与候选专家每一篇论文进行相似度编码；最终同样使用注意力机制体现不同论文的影响，计算局部相似度向量表示ψ＜p，a，c；步骤3-2-3：获得全局相似度向量表示与局部相似度向量表示后，拼接并通过3层线性层获得深层相似度向量表示其中表示拼接操作：步骤3-3：获得浅层相似度向量表示χp，a，c与深层相似度向量表示后，拼接获得相似度向量表示Simc：步骤4：应用打分模块对每一个候选实体c与待消歧论文作者对之间的相似度进行打分，获得分数Sc：Sc＝FCSimc步骤5：分数Sc最高的候选实体c被认为是匹配实体；所述的方法在实际应用前还包括训练阶段，训练阶段通过训练集进行训练，训练完成后再应用于论文作者消歧；其中，在训练阶段，计算损失函数包括：排序损失与对比学习损失；计算对比学习损失：对每个batch构建对比学习使用的正负样本；以batch中某一query的真实匹配对的相似度向量为锚点，与另一query的构成正例对，而与同一query内所有的非真实匹配对的相似度向量构成负例对；使用L2距离公式计算对比学习损失计算排序损失：计算最终损失其中α是排序损失权重，||Θ||2是模型的L2正则化惩罚项，λ是对应的权重系数。

全文数据：

权利要求：

百度查询：浙江大学一种推荐架构下的基于对比学习调优的论文作者消歧方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于物联网的污染管控系统

下一篇：一种塑料粒子均匀进料加工装置

相关技术

一种基于物联网的污染管控系统

一种塑料粒子均匀进料加工装置

半导体器件及其制备方法

一种胶原蛋白肽饮品及生产工艺

一种网球训练测试装置和测试方法

巡更监测方法、装置、电子设备及存储介质

确定路损的方法和电子设备

一种高效不锈钢拉丝设备及拉丝工艺

一种高柔性高热稳定性的正温度系数复合材料的制备方法

一种常山酮乳酸盐对映异构体的检测方法

一种急诊抢救用移动输液推车

一种车载网络共享方法、装置、车机系统及车辆

论文相关技术

用于科研论文辅导的数据处理系统和方法、服务器及设备_广州科奥信息技术股份有限公司_202411214669.0

一种基于深度学习的学位论文同行评阅意见分析方法_大连海事大学_202410859901.X

一种论文作者姓名消歧的方法、设备及储存介质_浙江理工大学_202210446111.X

基于异质引文网络自动检测论文工厂论文的方法_北京邮电大学_202410911583.7

学术论文推荐方法、装置、电子设备及可读存储介质_北京工业大学_202311616745.6

评论文本的分析方法、装置、程序产品以及电子设备_中国工商银行股份有限公司_202410812326.8

一种KMeans-LSTM模型和评论文本特征提取与虚假评论识别方法_牡丹江师范学院_202410798646.2

一种学位论文评价方法、系统、介质及电子设备_山东师范大学_202111076357.4

一种基于PDF的论文解析方法及装置_武汉数博科技有限责任公司_202410813698.2

一种论文作者信息抽取方法及装置_北京国双科技有限公司_202310246486.6

优相关技术

基于试重寻优影响系数法的磨床砂轮主动平衡方法_友机技术(上海)有限公司_202410762734.7

杉木优树群体的多态性SSR引物及其应用_南京林业大学_202310659640.2

用于端到端目标检测算法的强化学习调优方法及装置_白杨未来(北京)科技有限公司_202410773374.0

一种推荐架构下的基于对比学习调优的论文作者消歧方法_浙江大学_202210060374.7

救护车多摄像头之间的资源配置寻优方法及系统_湖南天宇汽车制造有限公司_202411246532.3

一种基于遗传算法的水泥生产分解炉温度控制系统参数寻优方法_安徽商高大数据技术有限公司_202410956640.3

一种级联U-Cell STATCOM邻近矢量寻优预测控制方法_无锡军工智能电气股份有限公司_202010952152.7

一种基于数模成果的水井调优方法_山东云科汉威软件有限公司_202411231468.1

利用旌康优珍酿替代糠壳的机械化清香型白酒酿造工艺_四川省农业科学院水稻高粱研究所(四川省农业科学院德阳分院)_202410933811.0

一种基于蒙特卡洛模拟特征寻优的直流故障电弧检测方法及系统_上海电力大学_202410727096.5

作者相关技术

一种推荐架构下的基于对比学习调优的论文作者消歧方法_浙江大学_202210060374.7

一种论文作者姓名消歧的方法、设备及储存介质_浙江理工大学_202210446111.X

在线文档作者的画像更新方法及装置_北京明略软件系统有限公司_202110880729.2

一种作者流动数据驱动的科研表现测量方法_南京大学_202410700367.8

一种基于多特征融合的恶意代码作者识别与代码侵权检测方法_四川大学_202410452888.6

与加工设备的操作者交互的方法以及系统_罗伯特·博世有限公司_202080090505.5

受监督的部分自主车辆应用的基于车辆的操作者在场控制_通用汽车环球科技运作有限责任公司_202311360843.8

基于关系图卷积神经网络的中文作者姓名消歧方法及装置_北京语言大学_202410883010.8

基于操作者熟练度的基础设施制品_3M创新有限公司_202080034937.4

一种基于异构引文网络的作者分类方法_哈尔滨工程大学_202310359202.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种推荐架构下的基于对比学习调优的论文作者消歧方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务