山东财经大学王亭雯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东财经大学申请的专利数字化图书馆的索引检索的优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119128045B 。
龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411259780.1,技术领域涉及:G06F16/31;该发明授权数字化图书馆的索引检索的优化方法是由王亭雯设计研发完成,并于2024-09-10向国家知识产权局提交的专利申请。
本数字化图书馆的索引检索的优化方法在说明书摘要公布了:本发明涉及检索的优化方法,具体的说是数字化图书馆的索引检索的优化方法,采用以下的技术方案包括:S1、动态分层索引构建技术:首先对图书馆中的数字资源进行多维度内容分析,包括主题、关键词、作者、出版时间信息;根据信息对文献进行分类,构建内容层次结构;S2、基于使用模式的索引优化策略:通过对用户的检索行为进行数据分析,监测用户在不同类别文献中的访问频率、查询类型以及访问路径,识别出典型的用户使用模式;S3、语义关联检索优化;S4、索引更新与资源分配优化:当新的文献资源被加入图书馆或已有资源被修改时,实时更新索引,同时根据内容分类和用户行为调整索引结构。
本发明授权数字化图书馆的索引检索的优化方法在权利要求书中公布了:1.数字化图书馆的索引检索的优化方法,其特征在于包括: S1、动态分层索引构建技术: S1.1、首先对图书馆中的数字资源进行多维度内容分析,包括主题、关键词、作者、出版时间信息;根据信息对文献进行分类,构建内容层次结构; S1.2、在分类基础上,针对包括主题、内容细节、语义关联的不同的文献层次构建动态索引,构建常用的高频内容被快速检索到,而细节内容保留在深层次索引中的模式; S1.3、根据用户的使用频率和检索习惯,定期调整索引结构,使常用信息靠近表层,优化检索速度; S2、基于使用模式的索引优化策略: S2.1、通过对用户的检索行为进行数据分析,监测用户在不同类别文献中的访问频率、查询类型以及访问路径,识别出典型的用户使用模式; S2.2、根据用户行为监测结果,动态调整不同索引项的优先级,将高频访问的文献或相关主题提升到检索结果的前列; S2.3、根据使用模式在本地缓存高频索引部分,快速返回结果,控制减少资源的占用; S3、语义关联检索优化: S3.1、引入自然语言处理技术,对用户的查询语句进行语义解析,识别关键词以及理解背后的语义意图,扩展索引范围; S3.2、基于语义分析,将用户的查询与文献内容的语义进行智能匹配,优化索引,使语义相近但关键词不同的文献也能被检索; S3.3、根据检索结果的点击率和用户停留时间反馈,优化语义匹配模型和索引结构; S4、索引更新与资源分配优化: S4.1、当新的文献资源被加入图书馆或已有资源被修改时,实时更新索引,同时根据内容分类和用户行为调整索引结构; S4.2、采用分布式数据库技术,将索引存储在多个节点上,支持大规模并行检索; S4.3、在检索过程中,根据当前的查询量和负载情况,动态分配资源,调度各个检索节点; 所述构建动态索引采用的方法包括: S1、首先利用内容分析与分类算法对图书馆中的数字资源进行多维度分析,包括主题、内容细节以及语义关联信息,建立基于文献层次的动态索引的初步结构,其中对于每个文献,其索引通过公式进行层次化计算: Sx=∫0 Tf1x+α·f2x·βtdt 其中,Sx表示文献的动态索引得分,是索引优化过程中用来衡量文献重要性的核心变量;f1x是文献的主题相关性函数,反映文献内容与特定主题的匹配程度;f2x为文献的内容细节函数,表示文献在细节层次上的描述丰富性;α是内容细节的调节系数,用于调整细节在整体索引中的权重;βt是与用户交互相关的时间动态调整系数,随时间变化动态调整索引结构;T为索引权重调整的时间段,用来表示优化过程中计算索引的时间窗口; S2、其次通过监测用户行为,包括查询频率、访问时间以及用户路径,利用频率感知模型动态调整文献的索引位置,索引的权重调整通过公式进行计算: 其中,Wu是用户行为导致的索引权重调整结果,表示在用户访问特定文献后的索引优先级;pi是第i个文献的访问频率,即文献被用户查询的次数;λ是控制用户行为频率敏感度的调节参数,决定访问频率对文献索引权重的影响强度;t表示当前的查询时间,随时间的推移调整对文献访问频率的感知度; S3、最后通过语义关联分析技术,对文献进行深度语义匹配,采用基于深度学习的语义向量模型,对不同的文献内容进行语义层次的动态优化匹配;语义层次通过公式来确定: 其中,Ls表示文献的语义层次得分,是通过语义分析对文献进行层次划分的结果;g1s是基础语义匹配函数,表示文献的基础语义关联度;g2s是语义扩展函数,负责在语义空间中进行文献匹配;γ是语义扩展系数,控制语义扩展对匹配结果的影响;n是文献的细节复杂度,用于衡量文献在语义层次上细节描述的复杂性; 所述识别出典型的用户使用模式采用方法包括: S1、首先采用日志追踪和Cookie技术,实时记录用户的检索行为数据,包括每次访问的文献类别、查询类型、访问路径及停留时间,使用公式对用户行为数据进行多维度建模与优化: Bx=∫0 Tω1·f1x+ω2·f2x·ψtdt 其中,Bx表示用户行为的综合得分;f1x是访问频率函数,表示用户访问某一文献的频次;f2x是停留时间函数,反映用户在文献中的停留时间长度;ω1和ω2分别为访问频率与停留时间的权重因子;ψt为行为动态调整函数,随时间变化影响索引优先级;T为实时监测的行为时间窗口; S2、接着基于采集的行为数据,采用包括K-Means或DBSCAN的聚类分析算法对用户进行分类,识别出典型的用户使用模式,包括频繁查询特定类别文献或经常遵循相似路径的用户,并对这些模式进行数学建模; 然后基于用户的历史行为数据,构建基于循环神经网络RNN的深度学习模型,通过下式预测用户未来的检索需求: 其中,Pu是对用户未来行为的预测;ui表示第i次检索行为,f3ui为用户行为序列特征函数,描述用户在过去的检索行为模式;λ是控制预测灵敏度的调节参数,ti表示行为发生的时间; 所述基于Pu预测结果,提前加载相关文献的索引,使用自适应预加载机制优化检索效率;然后根据用户行为的实际反馈,调整索引的显示顺序,利用公式优化索引的动态排序: 其中,Sy表示文献在索引中的优先级排序得分;r1yi和r2yi分别为用户在该文献的查询频率与路径点击率函数,γ1和γ2为调节系数,控制两者对优先级的影响。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东财经大学,其通讯地址为:250014 山东省济南市高新区伯乐路996-3-1-202;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励