买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:书行科技(北京)有限公司
摘要:本申请提供一种信息检索方法、装置、预测模型训练方法及设备,通过获取搜索词,以及所述搜索词关联的文本标题;获取各所述文本标题关联的参考搜索词簇,所述参考搜索词簇是根据历史浏览信息,以及每一个所述历史浏览信息对应的历史搜索词构建;根据所述搜索词,各所述文本标题,以及各所述文本标题对应的所述参考搜索词簇,确定所述搜索词对应的目标文本标题,并输出所述目标文本标题对应的目标推荐信息。通过构建文本标题对应的参考搜索词簇替代文本标题对应的文本与搜索词进行搜索信息分析,减少搜索词和推荐信息之间的信息分布空间差,保证目标推荐信息的准确性。
主权项:1.一种信息检索方法,其特征在于,包括:获取搜索词,以及所述搜索词关联的文本标题;获取各所述文本标题关联的参考搜索词簇,所述参考搜索词簇是根据历史浏览信息,以及每一个所述历史浏览信息对应的历史搜索词构建;根据所述搜索词,各所述文本标题,以及各所述文本标题对应的所述参考搜索词簇,确定所述搜索词对应的目标文本标题,并输出所述目标文本标题对应的目标推荐信息;所述参考搜索词簇的构建步骤包括:根据用户历史行为数据,获取用户浏览过的历史浏览信息;针对每一所述历史浏览信息,获取所述历史浏览信息对应的历史搜索词,统计各所述历史搜索词的重复频次,确定所述历史浏览信息对应的参考历史搜索词,根据所述参考历史搜索词构建所述历史浏览信息对应的参考搜索词簇;其中,所述重复频次,指示针对每一所述历史浏览信息,搜索过的所有所述历史搜索词中,相同的搜索词的相同数量;其中,所述统计各所述历史搜索词的重复频次,确定所述历史浏览信息对应的参考历史搜索词,根据所述参考历史搜索词构建所述历史浏览信息对应的参考搜索词簇,包括:将所述重复频次最多的前多个所述历史搜索词作为所述历史浏览信息的参考历史搜索词,将所述参考历史搜索词聚合为所述历史浏览信息对应的参考搜索词簇;其中,所述根据所述搜索词,各所述文本标题,以及各所述文本标题对应的所述参考搜索词簇,确定所述搜索词对应的目标文本标题,包括:通过预测模型中的特征提取模块对所述搜索词和所述参考搜索词簇中的各所述参考历史搜索词分别进行特征提取,得到搜索词特征和参考历史搜索词特征;通过所述预测模型中的计算模块对所述搜索词特征和所述参考历史搜索词特征进行向量距离计算得到向量距离,根据所述向量距离的大小,确定所述搜索词与所述参考搜索词簇之间的相关度;根据参考搜索词簇对应的相关度,从参考搜索词簇提取目标参考搜索词簇,并将目标参考搜索词簇对应文本标题,设置为所述搜索词对应的目标文本标题;其中,所述特征提取模块的训练包括步骤:针对每一文本标题,将所述文本标题关联的参考搜索词簇中各所述参考历史搜索词,输入所述预测模型中的特征提取模块,输出得到各所述参考历史搜索词对应的参考历史搜索词特征;计算所述参考搜索词簇对应的所述参考历史搜索词特征的特征均值,根据所述特征均值对所述特征提取模块的参数进行调整。
全文数据:
权利要求:
百度查询: 书行科技(北京)有限公司 信息检索方法、装置、预测模型训练方法及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。