买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西安石油大学
摘要:本申请涉及大数据技术领域,公开了一种高速公路不合格绿通车模式抽取方法,包括:A.数据获取并对所获取的数据进行预处理,以构建有效数据集;B.实体定义及标注;C.构建BERT‑BiLSTM‑CRF模型进行文本数据集的命名实体识别和关系抽取;D.知识融合;E.构建不合格绿通车模式知识图谱及可视化;F.计算知识图谱结构相似度、进行图聚类及可视化图聚类结果。本申请从文本数据和结构化数据中抽取不合格绿通车的模式,将模式和关系以知识图谱的形式呈现,采用图相似度、图聚类技术分析总结不合格绿通车的规律,得到不合格绿通车的行为特征。
主权项:1.一种高速公路不合格绿通车模式抽取方法,其特征在于,包括以下步骤:A.数据获取并对所获取的数据进行预处理,以构建有效数据集所述数据包括绿通查验过程中产生的查验业务数据和通过网络爬虫技术获取的文本数据,所述查验业务数据包括查验业务文本数据和结构化数据;将网络爬虫技术获取的文本数据和查验业务文本数据整合,得到文本数据集;B.实体定义及标注从人员、车辆和货物三个维度定义不合格绿通车行为特征的实体,使用BIO标记法标注文本数据集中的实体;C.构建BERT-BiLSTM-CRF模型进行文本数据集的命名实体识别和关系抽取;D.知识融合将文本数据集中抽取出的实体和结构化数据中已有的描述相同实体的信息进行匹配和关联,融合文本数据和结构化数据中的信息;E.构建不合格绿通车模式知识图谱及可视化将已得到的不合格绿通车的知识信息以知识图谱的形式整合及可视化,形成完整直观的不合格绿通车知识表示;F.基于知识图谱计算图相似度、并进行图聚类及可视化图聚类结果使用最大公共子图计算知识图谱结构相似度,采用谱聚类算法将相似度高的图分至同一聚类簇中,相似度低的图分至不同聚类簇;利用图数据库Neo4j存储和可视化图聚类结果,得到不合格绿通车的行为特征。
全文数据:
权利要求:
百度查询: 西安石油大学 一种高速公路不合格绿通车模式抽取方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。