首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于特征向量的分布式自适应地铁乘客轨迹相似性搜索方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:云南师范大学

摘要:本发明涉及一种基于特征向量的分布式自适应地铁乘客轨迹相似性搜索方法,属于轨迹相似性搜索领域。首先,从票卡记录抽取字段,转化为以OD序列表示的乘客轨迹。其次,构建OD‑分区‑存储节点的全局索引,在构建以空间和时间为基础的局部索引。接着,通过采样方式获取样本轨迹,计算轨迹分布特征,结合本地计算,网络换算等成本,计算出耗时最短搜索策略,形成特征向量到最优搜索策略的映射表。在轨迹相似性搜索过程中,一组交互规约指导参与者在分布式环境下完成任务调度,数据汇聚等功能。避免了传统搜索方法中汇聚节点存在的性能瓶颈。本发明能在大规模数据场景下执行轨迹相似性搜索,性能和处理能力明显优于现有方案。

主权项:1.一种基于特征向量的分布式自适应地铁轨迹乘客相似性搜索方法,其特征在于:包括如下步骤:Step1:收集所有轨道交通票卡采集系统产生的所有智能卡拍卡记录,智能卡拍卡记录是指乘客在地铁站进出闸机拍卡产生的票卡记录;Step2:将全部票卡记录按卡号进行分组,将每组内的票卡记录按时间排序,形成乘客轨迹,将乘客轨迹以OD序列形式保存,所有的乘客轨迹形成轨迹集合,OD,指的是乘客在地铁站内的一次行程;Step3:对所有乘客轨迹以OD为粒度进行划分,构建分布式二级索引中的全局索引,遍历每条轨迹,获取轨迹中的OD,所有轨迹中的OD构成OD集合;将OD集合划分为多个分区,每个分区内包含一个OD子集,每个分区被映射到唯一的存储节点;Step4:在每个存储节点上对分区中的OD子集构建局部索引,将每个OD拆分成O和D两个点,形成点集合,分别按照点集合中的地铁站名称,拍卡时间,进出站标记对点集合逐级进行更细粒度的划分;Step5:通过随机采样的方式获取一个轨迹子集合,分别计算轨迹子集合中每一条轨迹序列的特征向量,形成特征向量集合;Step6:针对每个特征向量,根据轨迹分布,综合考虑局部计算,数据汇聚,分布式同步的成本,计算耗时最短的最优搜索策略,形成特征向量映射到最优搜索策略的映射表;Step7:给定目标轨迹,计算目标轨迹及其对应的特征向量,根据目标轨迹对应的特征向量,在映射表中,查找并获取最优搜索策略;Step8:指定最优搜索策略、相似性度量函数、相似性阈值和过滤策略,调用轨迹相似性搜索接口;Step9:启动相似性搜索流程,分布式环境下各参与者按交互规约进行交互,执行最优搜索策略:调度器将最优搜索策略提交到分布式任务队列,分布式任务队列通知各节点获取最优搜索策略,各节点对最优搜索策略进行解析,获取涉及自身的任务清单;Step10:各节点根据任务清单,推断自己在网络数据流中的位置,连接后继节点,接受前驱节点的连接,节点之间的网络连接形成搜索策略对应的有向无环图,即DAG图;Step11:调度器按轮次执行最优搜索策略,每轮启动多个并行执行的任务,每个任务执行相同的功能,在每轮次的执行中,调度器协调各个参与者,执行数据汇聚,任务同步,中间结果汇聚,产生候选轨迹片段,上一轮产生的候选轨迹片段作为下一轮的输入;Step12:执行过滤策略:在最后一轮结束后,产生了一组候选轨迹集合,对候选轨迹集合执行过滤策略,删除不满足条件的轨迹,剩余的轨迹构成结果轨迹集合;Step13:返回Step12中的结果轨迹集合。

全文数据:

权利要求:

百度查询: 云南师范大学 一种基于特征向量的分布式自适应地铁乘客轨迹相似性搜索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术