买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及数据处理领域,具体为语义标签构建方法、基于语义标签构建的河湖水环境预警方法及系统。预警方法首先根据描述河湖问题的语料型原始数据,构建描述河湖问题的语义标签,获得语义标签样本集数据;通过设备采集数值型原始数据并进行处理,获得数值特征样本集数据;将语义标签样本集数据与数值特征样本集数据进行对齐融合处理,获得模型训练数据样本集;利用模型训练数据样本集对河湖水环境预警模型进行训练;利用训练好的河湖水环境预警模型对河湖水环境进行预警分析。本发明利用对水质情况描述的语料进行语义标签构建,解决了训练数据和模型表现受限于水质检测数据在时间粒度上粗糙和空间分布上稀疏的问题。
主权项:1.一种语义标签构建方法,其特征在于,包括以下步骤:收集描述河湖问题的语料型原始数据;对语料型原始数据进行预处理,得到语料样本集,利用语句嵌入模型对语料样本集中的语料样本进行向量化处理,生成语句向量,获得向量化的语料语义向量集合;利用语义主题建模技术,选取具有典型代表性的描述河湖问题的语料型原始数据,构建从河湖问题描述语料到河湖水环境预警级别的映射关系,给相应的语料型原始数据嵌入对应的河段水质风险等级标签,获得典型语义标签样例,即{问题描述语句:风险等级标签};根据典型语义标签样例,采用语义向量相似度检索,利用语句嵌入模型对典型语义标签样例的“问题描述语句”进行编码获得查询向量,通过查询向量对语料向量集合进行相似度搜索,将搜索到的结果用典型语义标签样例的标签对其标注,完成对语料语义向量集合中向量化后的语料样本进行标签赋值,获得语义标签样本集数据。
全文数据:
权利要求:
百度查询: 广东龙泉科技有限公司 广州市河涌监测中心 基于语义标签构建的河湖水环境预警方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。