江苏新华报业传媒集团有限公司杭春燕获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江苏新华报业传媒集团有限公司申请的专利基于AI智能分析的关键词检索优化系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120849594B 。
龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511358228.2,技术领域涉及:G06F16/334;该发明授权基于AI智能分析的关键词检索优化系统及方法是由杭春燕;蒋志初;谢楠;冯恩达;殷琳设计研发完成,并于2025-09-23向国家知识产权局提交的专利申请。
本基于AI智能分析的关键词检索优化系统及方法在说明书摘要公布了:本发明公开了基于AI智能分析的关键词检索优化系统及方法,涉及关键词识别技术领域。本发明系统包括:数据库构建模块、第一候选集筛选模块、第二候选集筛选模块以及校验与检索应用模块;本发明通过采集新闻与检索数据建库,分析关键词组合冗余度筛选低冗余组合,再结合覆盖度与命中率选高评分组合,经一致性校验得优化集合。本发明以数据量化替代人工经验,降低检索冗余、平衡覆盖与精准度,简化技术实现,提升新闻检索效率与质量,适用于新闻检索场景,且检索关键词库定期更新,保障优化效果持续有效。
本发明授权基于AI智能分析的关键词检索优化系统及方法在权利要求书中公布了:1.基于AI智能分析的关键词检索优化方法,其特征在于:所述方法包括以下步骤: S1.采集目标新闻检索场景下的历史新闻数据及历史检索记录,从历史检索记录中提取已使用的所有关键词组合,整合关键词组合与对应的历史检索关联数据,建立关键词组合数据库; S2.对关键词组合数据库中的各关键词组合进行冗余度分析,通过AI智能模型分析各关键词组合包含的重复信息占比、组合内关键词间的语义重叠程度,构建冗余度评估指标;并计算各组合的冗余度值,将冗余度值与预设冗余度阈值进行对比,筛选出冗余度值低于预设冗余度阈值的关键词组合,形成第一候选集; 所述S2包括以下内容: 对关键词组合数据库中的每个关键词组合Ci,提取该组合包含的所有关键词kij,其中i取1到n,n为关键词组合总数;j取1到m,m为单个组合的关键词数量;针对每个关键词组合Ci,提取对应的所有关键词kij的领域标签Bi,遍历关键词组合数据库中其他所有关键词组合Cp,提取其包含的关键词kpq对应的领域标签Bp,同理p取1到n,且p≠i,q取1到m;计算Ci与Cp的领域标签重合率L,计算公式为:L=NBi∩BpNBi∪Bp,其中NBi∩Bp为关键词组合Ci与关键词组合Cp的相同领域标签数量;NBi∪Bp为关键词组合Ci与关键词组合Cp的总领域标签数量;当关键词组合Ci与关键词组合Cp的领域标签重合率L大于等于预设阈值L0时,判定关键词组合Ci与关键词组合Cp为语义相关的组合; 汇总与关键词组合Ci语义相关的所有关键词组合Cp,统计关键词组合Ci与关键词组合Cp的共同关键词数量tip,计算关键词组合Ci与每个关键词组合Cp的关键词重合率rip,且rip=tipmaxm,mp,其中mp为关键词组合Cp包含的关键词数量;取关键词组合Ci与所有相关关键词组合Cp的关键词重合率平均值作为重复信息占比Ri;通过AI智能模型获取每个关键词kij的语义向量Vij,计算组合内任意两个关键词kij与kiuj≠u的语义相似度sju=cosVij,Viu,其中cos为余弦相似度函数,取组合内所有关键词间语义相似度的平均值作为语义重叠程度Si; 根据重复信息占比Ri和语义重叠程度Si,构建冗余度评估指标Yi,且Yi=α×Ri+β×Si,其中α和β为权重系数,且α+β=1,α和β通过历史数据中冗余组合的检索效率损失率拟合确定;统计关键词组合数据库中所有关键词组合的冗余度评估指标Yi均值μ_Y及标准差σ_Y,计算对应的冗余度阈值Y0,且Y0=μ_Y-γ1×σ_Y,其中γ1为调节因子;将每个关键词组合Ci的冗余度评估指标Yi与冗余度阈值Y0进行对比,若Yi<Y0,则将关键词组合Ci纳入第一候选集,否则剔除; S3.对第一候选集中的关键词组合进行覆盖度与匹配命中率分析,通过AI智能模型分析历史新闻数据中各关键词对应的新闻数量、各关键词组合可覆盖的新闻范围,计算得到各组合的覆盖度;并从历史检索记录中提取各关键词组合对应的检索成功次数与总检索次数,计算得到各组合的匹配命中率;建立覆盖度-命中率综合评估体系,将各组合的覆盖度与匹配命中率代入评估体系进行综合评分,筛选出综合评分高于预设评分阈值的关键词组合,形成第二候选集; S4.对第二候选集中的关键词组合进行一致性校验,剔除因数据统计偏差导致综合评分异常的关键词组合,得到最终优化的关键词组合集合;将最终优化的关键词组合集合存储至检索关键词库,在后续新闻信息检索请求触发时,调用所述检索关键词库中的关键词组合执行检索匹配。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏新华报业传媒集团有限公司,其通讯地址为:210000 江苏省南京市鼓楼区管家桥65号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励