买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国标准化研究院
摘要:本发明公开了一种基于大数据的标准智库知识推荐方法及系统,包括获取标准智库数据和用户的历史有效数据,历史有效数据包括用户的历史点击数据和对标准智库数据的历史评分;根据语义分析和数据类型对标准智库数据进行分类,得到第一分类结果和第二分类结果,基于时间衰减对第一分类结果进行数据筛选得到增量数据;根据历史有效数据对第一分类结果进行匹配得到第一数据,根据历史有效数据对第二分类结果进行匹配得到第二数据,基于第一数据和第二数据得到推荐类目;通过历史有效数据、增量数据和推荐类目建立推荐模型,将待推荐数据输入推荐模型输出推荐结果。本发明通过大数据技术,能够更准确地理解用户需求,提供更加个性化的知识推荐服务。
主权项:1.一种基于大数据的标准智库知识推荐方法,其特征在于,包括以下步骤:A获取标准智库数据和用户的历史有效数据,所述历史有效数据包括所述用户的历史点击数据和对所述标准智库数据的历史评分;B根据语义分析和数据类型对所述标准智库数据进行分类,得到第一分类结果和第二分类结果,使用TF-IDF将所述标准智库数据转换为数值向量,将所述数值向量归一化,作为数据点,将所述数据点作为初始簇,使用余弦相似度作为所述数据点的间距: 其中CSh,b为数据点h和b的所述余弦相似度,h和b为两个n维向量,hi表示向量h在第i维的分量,所述余弦相似度的值的范围为[-1,1],-1为完全不相似,1为完全相似,将所述初始簇中所述数据点的间距最小的两个簇合并,构建一个新簇,计算所述簇的簇间间距: 其中DUAm,An为Am和An的所述簇间间距,Am和An为不同的所述簇,x和y为不同的所述数据点,|Am|和|An|为Am和An包含的所述数据点的数量,合并最短的所述簇间间距对应的所述簇,重复计算所述簇间间距并进行合并,直到剩余的所述簇的数量和预设分类数量l相同,一个所述簇对应一个分类类别,得到所述第一分类结果;根据所述数据类型的特征,提取所述标准智库数据的特征向量,将所述特征向量归一化,使用欧氏距离计算所述特征向量之间的距离: 其中dp,q为所述特征向量p和q之间的距离,pk表示第k维的所述特征向量p的向量值,sk为第k维的标准差,同样将所述特征向量作为所述初始簇,重复合并最短的所述簇间间距对应的所述簇,直到剩余的所述簇的数量和预设分类数量η相同,得到所述第二分类结果,基于时间衰减对所述第一分类结果进行数据筛选得到增量数据,将所述标准智库数据根据时间排序得到时序数据,计算在所述第一分类结果下的时间权重: 其中wi为第i个数据点的时间权重,Bα,β为贝塔函数,Γ为伽马函数,α和β为形状参数,决定所述时间权重随时间变化的速率和形状,ti为第i个所述数据点的时间点,t0为参考时间点,为所述数据点所在类别最新的时间点,τ为时间尺度参数,去除所述时间权重小于预设阈值的所述时序数据得到所述增量数据,所述预设阈值根据不同类别的更新频率确定,为所述更新频率的时间权重;C根据所述历史有效数据对所述第一分类结果进行匹配得到第一数据,根据所述历史有效数据对所述第二分类结果进行匹配得到第二数据,基于所述第一数据和所述第二数据得到推荐类目;D通过所述历史有效数据、所述增量数据和所述推荐类目建立推荐模型,根据所述增量数据和所述推荐类目构建状态空间,将推荐数据作为行动空间,由所述状态空间映射所述行动空间,将所述推荐数据对应的所述历史有效数据的实际反馈作为奖励信号,建立所述推荐模型,所述推荐模型输出时去除所述推荐数据中的历史有效数据,根据所述奖励信号更新所述推荐模型,优化状态到行动的映射,价值函数的更新: 其中VαS是状态S的所述价值函数,μA|S是在状态S下选择行动A的策略,RS,A是执行行动A时立即获得的奖励,α是所述价值函数的折扣因子,用于调节未来奖励的当前价值,PSS′A是从状态S执行行动A转移到状态S′的概率,Q函数的更新: 其中QβS,A;φ是状态S和行动A的Q函数,为在状态S下采取行为A的期望估计,β为Q函数的折扣因子,φ是主网络用于参数化Q函数的参数,E为期望值,表示在概率分布下的平均值,更新φ的策略梯度公式: 其中Jφ是目标函数,为期望回报,B为当前选择的行动,γ表示策略梯度的折扣因子,πφB|S是参数化策略,目标Q函数: 其中QγS,B;θ是由神经网络近似的Q函数,为稳定估计,用于计算所述期望回报的未来奖励部分,C为下一个状态中的最佳行动,θ-表示目标网络的参数,定期从主网络参数θ更新,不断迭代优化直到策略收敛,所述推荐模型在所述用户初次登录时将所述用户自行填写的喜好类别作为所述推荐类目,将待推荐数据输入所述推荐模型输出推荐结果。
全文数据:
权利要求:
百度查询: 中国标准化研究院 一种基于大数据的标准智库知识推荐方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。