首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于信息熵的引文推荐方法、装置及终端 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京朗拓科技投资有限公司

摘要:本发明实施例公开了一种基于信息熵的引文推荐方法、装置及终端,通过搜索模型结合用户的偏好信息从文献数据库中匹配出N个第一候选引文,然后基于第一候选引文生成特征集合,基于特征集合中的关键向量计算信息熵,基于信息熵得到各第一候选引文的局部活跃度,从而确定第二候选引文,最后利用多因子融合模型计算对应的第二候选引文与关键信息的匹配度,并基于匹配度确定目标引文。这样的方法使用信息熵来得到局部活跃度,提高了推荐的引文与用户的文本的关联性,同时也提高了引文搜索效率和匹配度。

主权项:1.一种基于信息熵的引文推荐方法,其特征在于,包括:获取用户输入的关键信息和用户信息;利用预设的搜索模型中的引擎搜索网络,基于所述关键信息从文献数据库中匹配出满足条件的引用文献集,以及利用所述搜索模型中的兴趣偏好网络确定所述用户信息对应的偏好信息;基于所述偏好信息对所述引用文献集中的各文献进行排序,并选择排序靠前的N个文献作为第一候选引文;利用自然语言处理算法,提取各所述第一候选引文的特征集合,其中所述特征集合包括多个不同维度的关键向量;以各所述第一候选引文的关键向量计算出各所述第一候选引文的信息熵,并基于所述信息熵从N个第一候选引文中确定至少两个第二候选引文;利用多因子融合模型,基于各所述关键向量计算出各个第二候选引文与所述关键信息的匹配度,并基于所述匹配度确定目标引文;所述用户信息表示用户对各技术领域中的技术文献的关注程度的信息;所述关键信息的获取方式包括:获取用户在文本数据库中的触控操作,以从多篇文本中选择目标文本,然后去除文本中无关的文本内容以及停用词,然后利用TF-IDF算法提取剩余的文本中所有语句中的关键词,对提取到的关键词中重复的词语进行去重操作,得到关键信息;或者,对研究论文或者技术中的语句进行解析,以得到对应的关键词,并基于关键词构建检索式,得到关键信息。

全文数据:

权利要求:

百度查询: 南京朗拓科技投资有限公司 基于信息熵的引文推荐方法、装置及终端

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。