首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于聚类算法和模式挖掘的船舶行为模式挖掘方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京工业大学

摘要:一种基于聚类算法和模式挖掘的船舶行为模式挖掘方法涉及船舶的模式挖掘领域。本发明主要通过获取船舶的轨迹数据库中存储的轨迹进行数据清洗和轨迹压缩两个过程的计算,将处理好的轨迹数据进行聚类产生簇,将簇作为频繁项集进行频繁序列的挖掘。本发明对其中的关键点聚类进行优化,能够有效的利用聚类算法进行多类船舶数据的挖掘,从而能够适应船舶大规模数据密度不均匀的特性,提高了行为模式挖掘的质量和准确性。

主权项:1.一种基于聚类算法和模式挖掘的船舶行为模式挖掘方法,其特征在于,包括以下步骤:1数据清洗、压缩:①由于采集到的原始数据可能会存在异常点,所以对数据集进行清洗是必要的;规则为:轨迹段的起始点和终点时间间隔大于24小时,则进行轨迹段划分;定义速度最大值vmax,设定最大的速度vmax为110公里小时;假设轨迹点plonp,latp,tp是轨迹点qlonq,latq,tq在轨迹段中的前一轨迹点,那么tptq,两点间的速度计算为: 其中,lonp为轨迹点p的经度值,latp为轨迹点p的纬度值,tp为轨迹点p产生的时间;同理,lonq为轨迹点q的经度值,latq为轨迹点q的纬度值,tq为轨迹点q产生的时间;Haversinelatp,lonp,latq,lonq为通过Haversine公式计算出的两个经纬度点间的距离;如果vpq≥vmax则表示q点产生的速度是异常的,则定义q点为异常点,将该点删除;②对轨迹数据进行压缩,为了达到一个计算时间和计算误差的平衡,将轨迹压缩阈值threshold设为0.8km;流程为:将轨迹段上所有的点按时间顺序排列;1在轨迹段首尾两点A,B之间连接一条直线AB,该直线为轨迹段的弦2得到轨迹段上离该直线段距离最大的点C,计算其与AB的距离d;3比较该距离与预先给定的阈值threshold的大小,如果小于threshold,则该直线段作为轨迹段的近似,该段轨迹处理完毕;4如果距离大于等于阈值threshold,则用C将轨迹段分为两子轨迹段AC和BC,并分别对两段取弦进行1~3的处理;当所有子轨迹段都处理完毕时,依次连接各个分割点形成的折线,即作为轨迹段的近似;2设计改进型DBSCAN聚类方法:①参数Eps邻域:一个对象p的Eps邻域是指以对象p为中心,以Eps为半径的区域内,即:Nepsp={q∈D|Distp,q≤Eps};2式中,D为数据集;Distp,q为对象p和对象q之间的距离;Nepsp指数据集D对象p以Eps为半径的d维超球体区域内包含的点的集合;利用核密度估计获取除第一个簇以外的邻域值Eps针对船舶轨迹数据集D,数据集中存在独立同分布的n个样本点x1,x2,x3,…,xn,设数据集D的概率密度函数为fx,fx的核密度估计形式如下: 其中,为核函数,核函数非负,积分为1,均值为0,i=1,2,…,n;是缩放核函数,由此,h为带宽,又称为窗口,n为样本数量;h0;对于h的选择,使用积分均方误差判断估计所得的概率密度函数和真实的概率密度函数fx两者存在的差异,表达式为 其中,E表示括号内变量的数学期望;在弱假设下 其中,o表示括号内变量的高阶无穷小;AMISE为渐进积分均方误差,而AMISE有 为了使MISEh最小,转化为求极点问题 因此最优带宽 在关于带宽h表达式中,存在概率密度函数fx的二阶导数f″x表示密度估计函数各点的凹凸程度,取高斯密度核函数为核函数进行核密度估计,h的最佳选择即使积分均方误差最小化的带宽为 其中,表示样本方差;针对数据集D,利用数据集样本个数求得核密度估计最佳带宽h,将h作为对数据集进行聚类的Eps初始值;②参数MinPts密度阈值描述了某一样本的距离为Eps的邻域中样本个数的阈值;针对数据集D,遍历数据集D,记录每个数据点在Eps邻域中的对象个数M,M值作为数据集密度分布的依据;选取数据集D中M值最大的数据点为第一个核心对象D1,获取D1的M值作为初始MinPts,对第一个簇聚类,结束后从未被聚类的数据对象中选取M值最大的数据对象作为核心对象,进行下一次聚类;动态更新获取除第一个簇以外的簇聚类的密度阈值MinPts 其中,Mn为当前核心对象的M值;Mmax记录D1的M值;表示的2次方的值;MinPts′为更新前的密度阈值;每聚类一次,密度阈值MinPts随着每一个簇聚类开始时第一个核心对象邻域的密度值M改变;3对频繁项集进行序列挖掘;经过对船舶数据集的聚类,最终生成聚类中心和类簇距离范围所代表轨迹的频繁项,以及由聚类中心组成的轨迹,从偏序现象中挖掘出经常出现的偏序规律,从而得到船舶的行为模式。

全文数据:

权利要求:

百度查询: 北京工业大学 一种基于聚类算法和模式挖掘的船舶行为模式挖掘方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。