Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜广东利通科技投资有限公司洪瑶获国家专利权

恭喜广东利通科技投资有限公司洪瑶获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜广东利通科技投资有限公司申请的专利一种基于大数据的高速公路机电运维知识库构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118211650B

龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410424405.1,技术领域涉及:G06N5/022;该发明授权一种基于大数据的高速公路机电运维知识库构建方法是由洪瑶;周玲;郉焱;石时需;陈洽尧;陈佳设计研发完成,并于2024-04-09向国家知识产权局提交的专利申请。

一种基于大数据的高速公路机电运维知识库构建方法在说明书摘要公布了:本发明提供了一种基于大数据的高速公路机电运维知识库构建方法,所述方法包括1采集高速公路机电运维文本数据;2对高速公路机电运维文本数据进行预处理;3处理后数据训练加权LDA模型,对文本库进行主题挖掘与分类;4构建高速公路机电运维知识库;5对高速公路机电运维知识库进行优化。本发明通过使用改进LDA模型,提供了高速公路运维知识库的构建方法,并保障了所构建知识库的系统性和准确性;采用数据索引、分类算法和知识推荐对知识库进行优化,进一步提高了查询效率。

本发明授权一种基于大数据的高速公路机电运维知识库构建方法在权利要求书中公布了:1.一种基于大数据的高速公路机电运维知识库构建方法,其特征在于,所述方法包括如下步骤:(1)采集高速公路机电运维文本数据;(2)对高速公路机电运维文本数据进行预处理;(3)处理后数据训练加权LDA模型,对文本库进行主题挖掘与分类;(3.1)根据词袋和语料库生成词汇矢量矩阵Corpus;(3.2)计算权重值,并将矩阵Corpus转化为整数型的词汇矢量矩阵Corpus_Weighted_Int;设定词汇在文档d中的权重为,所述权重由以下公式确定: ;其中,为词频,表示词汇i在文档d中出现的频率; 为逆文档频率,表示词汇i在整个语料库中的罕见程度;为均匀分布度,表示词汇i在文档d中各个句子或段落中的分布均匀性;作为归一化因子,确保所有词汇的权重之和为1;词频TF、逆文档频率IDF、均匀分布度UD以及归一化因子NF的计算公式如下; ;其中,是词汇在文档d中出现的次数,而分母是文档d中所有词汇出现次数的总和; ;其中,是语料库中的文档总数,而是包含词汇的文档总数; ;其中,是词汇在文档d中出现位置的方差; ;其中,是文档d中所有不同词汇的集合;(3.3)初始化模型参数,确定主题数K,设置超参数ɑ和β;(3.4)对每篇文档的每一个词汇,随机分配主题并吉布斯采样更新主题;(3.5)重复步骤(3.4)直至吉布斯采样收敛或达到预设的迭代次数;(3.6)统计最终的主题-词汇共现频率矩阵,即为训练得到的LDA模型;(3.7)使用P值对LDA模型进行主题挖掘后的数据进行语义扩充;通过计算两个有序词汇之间的共现概率,得出词汇之间的相关性;构建一个有序短语的出现概率P值,P值越大,所包含的词汇组成短语的确定性越高,P值的公式如下所示: ;其中,和表示两个不同的词汇,表示词汇1出现的概率,表示词汇2出现的概率;表示词汇1和词汇2按照从左往右的顺序连结组成的短语,为该短语出现的概率;抽取出共同出现频率高且重要的短语,按照P值降序排列,与原有主题词对比后替换,实现关键词组块对主题词扩充,实现语义可解释性上的较大提升;(4)构建高速公路机电运维知识库;(5)对高速公路机电运维知识库进行优化。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东利通科技投资有限公司,其通讯地址为:510000 广东省广州市萝岗区科学城科汇三街5号601房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。