西南交通大学李维炼获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西南交通大学申请的专利一种基于加权LDA算法的洪水态势感知方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119398038B 。
龙图腾网通过国家知识产权局官网在2025-12-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411199386.3,技术领域涉及:G06F40/279;该发明授权一种基于加权LDA算法的洪水态势感知方法及装置是由李维炼;吴鉴霖;朱军;朱庆设计研发完成,并于2024-08-29向国家知识产权局提交的专利申请。
本一种基于加权LDA算法的洪水态势感知方法及装置在说明书摘要公布了:本发明公开了一种基于加权LDA算法的洪水态势感知方法及装置,属于洪涝灾害风险管理技术领域。该方法包括:通过网络爬虫技术获取与洪水事件相关的贴文,并进行数据清洗和二次处理,得到多个目标词并存储到数据集中;利用词频‑逆向文档频率算法计算出各个目标词在贴文中的权重;利用困惑度、一致性指数和Jensen‑Shannon散度综合性确定洪水主题数量;将数据集中的各个目标词在贴文中的权重引入LDA模型中,利用加权吉布斯采样算法对LDA分布进行采样,估计出洪水贴文‑主题分布和主题‑词分布,以分析感知洪水发展态势。本发明能够提升主题识别的准确性和可解释性,从而实现对洪水态势的全面感知与准确理解。
本发明授权一种基于加权LDA算法的洪水态势感知方法及装置在权利要求书中公布了:1.一种基于加权LDA算法的洪水态势感知方法,其特征在于,包括以下步骤: S100:通过网络爬虫技术获取与洪水事件相关的贴文,并进行数据清洗和二次处理,得到多个目标词并存储到数据集中; S200:利用词频-逆向文档频率算法计算出各个目标词在贴文中的权重; 在所述步骤S200中,所述利用词频-逆向文档频率算法计算出各个目标词在贴文中的权重的步骤,具体包括: 计算目标词在贴文中出现的频率tfmn,计算公式为: 其中,cmn表示目标词在第m条洪水贴文中出现的次数,分母表示洪水贴文Tm中所有词出现次数求和; 计算目标词的逆向文档频率idfmn,计算公式为: 其中,|M|表示语料库中洪水贴文的总数,表示包含目标词的洪水贴文数量; 计算目标词的权重计算公式为: 其中,tfmn表示词频,idfmn表示逆向文档频率; S300:利用困惑度、一致性指数和Jensen-Shannon散度综合性确定洪水主题数量; 在所述步骤S300中,所述Jensen-Shannon散度中的JSD值的计算公式为: 其中,P和Q为两个概率分布,R是一个混合分布且等于12P+Q;D测量两个概率分布之间的KL散度; S400:将数据集中的各个目标词在贴文中的权重引入LDA模型中,利用加权吉布斯采样算法对LDA分布进行采样,估计出洪水贴文-主题分布和主题-词分布,以分析感知洪水发展态势; 所述步骤S400包括: 输入参数定义:输入洪水语料库主题数量K、贴文-主题权重矩阵累计权重矩阵δm、第k个主题-词权重矩阵和累计权重矩阵ηk以及迭代次数X,其中M为洪水贴文总数,N为贴文中词数;为目标词权重; 加权吉布斯采样迭代:对每个洪水贴文的每个目标词采样其主题分配时,结合目标词权重更新贴文-主题权重矩阵和第k个主题-词权重矩阵直至达到迭代次数X,更新方式如下: 通过更新后的权重矩阵和估计贴文主题分布θ和主题词分布
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西南交通大学,其通讯地址为:611756 四川省成都市郫都区犀安路999号西南交通大学犀浦校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励