中国移动通信有限公司政企客户分公司;中国移动通信集团有限公司彭怀瑾获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国移动通信有限公司政企客户分公司;中国移动通信集团有限公司申请的专利文档检索方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116975202B 。
龙图腾网通过国家知识产权局官网在2026-02-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310827625.4,技术领域涉及:G06F16/3331;该发明授权文档检索方法、装置、设备及存储介质是由彭怀瑾;王东;李洪菊;成龙;李志荣设计研发完成,并于2023-07-06向国家知识产权局提交的专利申请。
本文档检索方法、装置、设备及存储介质在说明书摘要公布了:本发明涉及数据查询技术领域,公开了一种文档检索方法、装置、设备及存储介质,该方法包括:获取用户输入的检索词条的目标词串,并确定目标词串的语义重要度;获取与目标词串相匹配的候选文档,并确定目标词串与候选文档之间的相关度;根据语义重要度对相关度进行优化,获得优化后相关度;通过优化后相关度对候选文档进行排序后展示。本发明通过确定所述目标词串的语义重要度,并根据语义重要度对目标词串与候选文档之间的相关度进行优化,避免了在候选文档为与重要度较低的词汇相匹配的文档时,若该候选文档的相关度较高,则该候选文档也会进行展示的情况,使检索结果更加符合用户需求,有效提高了用户体验。
本发明授权文档检索方法、装置、设备及存储介质在权利要求书中公布了:1.一种文档检索方法,其特征在于,所述文档检索方法应用于在线排序模型,所述方法包括以下步骤: 获取用户输入的检索词条的目标词串,并确定所述目标词串的语义重要度,所述语义重要度基于所述目标词串中各分词相对所述检索词条的原始词重要度以及分词后句子长度来确定; 获取与所述目标词串相匹配的候选文档,并确定所述目标词串与所述候选文档之间的相关度; 根据所述语义重要度对所述相关度进行优化,获得优化后相关度; 通过所述优化后相关度对所述候选文档进行排序后展示; 其中,所述根据所述语义重要度对所述相关度进行优化,获得优化后相关度的步骤,包括:将所述目标词串中各分词的语义重要度与各候选文档的相关度映射至同一纬度进行优化,获得所述各分词的优化后分词相关度;将所述各分词优化后的相关度进行叠加,获得所述目标词串的优化后相关度; 其中,所述在线排序模型的构建包括: 获取由预设文档构成的初始数据,若从预设文档中提取出预设行业关键词,则将对应的预设文档标注为1,若未从预设文档中提取出预设行业关键词,则将对应的预设文档标注为0,在标注完成时,将所有标注文档提取出来,获得标注数据; 通过所述标注数据对transformer模型进行训练,获得离线排序模型,其中,所述transformer模型包括第一层结构至第N层结构,所述transformer模型第N1层结构和所述transformer模型第N层结构的输出结果拼合后池化,并映射为单层transformer模型输出纬度进行输出; 基于所述离线排序模型对预设未标注文档数据进行预测,获得所述预设未标注文档数据的样本相关度结果;根据所述样本相关度结果对XGBoost模型进行训练,获得在线排序模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国移动通信有限公司政企客户分公司;中国移动通信集团有限公司,其通讯地址为:100010 北京市东城区后永康胡同17号106A室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励