首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于卡口与其相邻基站关系学习的车号伴随分析方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:电信科学技术第十研究所有限公司

摘要:本发明公开了一种基于卡口与其相邻基站关系学习的车号伴随分析方法,首先构建初始化高质量车号关系对样本,然后学习卡口与其相邻基站关系,接下来是车号伴随计算与推荐,之后是卡口与其相邻基站关系学习以及车号伴随TopK推荐效果评估,最终更新高质量的车号关系对样本。本发明提高了卡口与其相邻基站关系学习的鲁棒性和泛化能力,进而基于更新的卡口与其相邻基站关系表,进行车号伴随计算与推荐,从而形成闭环系统,为科学高效地解决大规模的车号伴随关系分析与深度挖掘提供了一种全新的解决方案。

主权项:1.一种基于卡口与其相邻基站关系学习的车号伴随分析方法,其特征在于,包括如下步骤:步骤1:构建初始化高质量车号关系对样本;将满足以下条件:基于多种不同种类数据源,且在相同的[StartTime,EndTime]时间范围区间,均共同出现的车号关系对{车辆号牌CarNumber,移动终端号码Msisdn};该车号关系对,称为初始化的高质量样本;将高质量样本数量记作CarNumberMsisdnPairSampleCnt;步骤2:学习卡口与其相邻基站关系;卡口的相邻基站定义为:基于车号关系对{CarNumber,Msisdn}样本的时序轨迹数据,当满足CarNumber的卡口抓拍时间ShotTime与Msisdn的信令事件发生时间EventTime相减的绝对值小于等于卡口采集系统与基站采集系统之间的时钟偏差量TimeSkew时,即|ShotTime-EventTime|=TimeSkew时,所间接关联的卡口唯一标识编号KaKouID与基站唯一标识编号BaseStationId关系对;将该关系对中的基站BaseStationId称为该卡口KaKouID的相邻基站;步骤2-1:基于高质量样本的车辆号牌CarNumber,在相同的始末日期[StartTime,EndTime]时间范围内,以自然天为单位,从卡口数据中萃取车辆号牌的时序轨迹数据,具体内容包括:车辆号牌CarNumber、卡口唯一标识编号KaKouId、车辆抓拍时间ShotTime;步骤2-2:基于高质量样本中的移动终端号码Msisdn,在相同的始末日期[StartTime,EndTime]时间范围内,以自然天为单位,从运营商的基站数据中萃取移动终端号码的时序轨迹数据,具体内容包括:移动终端号码Msisdn、基站唯一标识编号BaseStationId、信令事件发生时间EventTime;步骤2-3:基于步骤2-1和步骤2-2中每个样本的时序轨迹数据,萃取满足条件:CarNumber的卡口抓拍时间ShotTime与Msisdn的信令事件发生时间EventTime相减的绝对值小于等于卡口采集系统与基站采集系统之间的时钟偏差量TimeSkew时,即|ShotTime-EventTime|=TimeSkew时,对应的所有的卡口唯一标识编号KaKouID与基站唯一标识编号BaseStationId,从而得到间接关联的卡口与基站关系对{卡口唯一标识编号KaKouId,基站唯一标识编号BaseStationId}、卡口与基站关联频数RelatedFrequencyCnt,构建卡口与其相邻基站关系天表KaKouId_BaseStationId_Relation_ByDay,具体内容包括:卡口唯一标识编号KaKouId、车辆号牌CarNumber、车辆抓拍时间ShotTime、基站唯一标识编号BaseStationId、移动终端号码Msisdn、信令事件发生时间EventTime;步骤2-4:针对在始末日期[StartTime,EndTime]时间范围内,步骤2-3所构建的卡口与其相邻基站关系天表KaKouId_BaseStationId_Relation_ByDay,按卡口唯一标识编号KaKouId、运营商Carrier分组统计:每个KaKouId在相同运营商Carrier前提条件下,所关联的基站唯一标识编号BaseStationId的最大关联频数MaxRelatedFrequencyCnt,记作RelatedFrequencyCntMax、所关联的每个基站唯一标识编号BaseStationId的关联频数占比率RelatedFrequencyCntRelatedFrequencyCntMax,记作KBRelatedFrequencyRate;KBRelatedFrequencyRa为卡口相邻基站置信度,记作Confidence,用于表征基站BaseStationId与卡口KaKouId之间的相邻关系的可信程度,从而构建卡口与其相邻基站关系中间结果表KaKouId_BaseStationId_Relation_Middle,具体内容包括:卡口唯一标识编号KaKouId、运营商Carrier、基站唯一标识编号BaseStationId、卡口与其相邻基站关联频数RelatedFrequencyCnt、卡口与其相邻基站的最大关联频数RelatedFrequencyCntMax、卡口相邻基站置信度Confidence、在KaKouId、Carrier分组内按Confidence做DenseRank降序排列,记作Rank;步骤2-5:基于步骤2-4结果集,根据每个卡口KaKouId关联的不同运营商基站BaseStationId的最大关联频数RelatedFrequencyCntMax值不同,分段设置卡口相邻基站置信度Confidence的阈值参数ConfidenceThreshold,仅保留大于等于相应的卡口相邻基站置信度即Confidence=ConfidenceThreshold的基站BaseStationId,使得每个卡口关联不同运营商的相邻基站BaseStationId去重后的平均数量分别约为某个特定值CoreBaseStationIdAvgCnt,从而得到每个卡口的“核心”相邻基站唯一标识编号BaseStationId,即卡口与其相邻基站置信度Confidence做DenseRank降序排名靠前的基站唯一标识编号BaseStationId,构建卡口与其相邻基站关系表KaKouId_BaseStationId_Relation,具体内容包括:KaKouId、Carrier、BaseStationId、RelatedFrequencyCnt、RelatedFrequencyCntMax、Confidence、Rank;步骤3:车号伴随计算与推荐;所述车号伴随的具体定义为:基于步骤2-5所构建的卡口与其相邻基站关系表KaKouId_BaseStationId_Relation,结合卡口数据和运营商数据中的车辆号牌、移动终端号码的时序轨迹数据,在满足|车辆号牌抓拍时间ShotTime-移动终端号码信令事件发生时间EventTime|=卡口采集设备与基站采集设备之间的系统时钟偏差量TimeSkew条件下,根据KaKouId_BaseStationId_Relation关系表中的{卡口唯一标识编号KaKouId,卡口相邻基站唯一标识编号BaseStationId}关系对,分别对应关联出现的{车辆号牌CarNumber,移动终端号码Msisdn}关系对;此时,在该CarNumber与Msisdn之间就称为发生了车号伴随,其中,将CarNumber与Msisdn的关联频数,称为车号伴随频数,记作RelatedFrequencyCnt;步骤3-1:构建车号伴随天表;基于步骤2-5所构建的卡口与其相邻基站关系表KaKouId_BaseStationId_Relation,结合卡口数据和运营商数据中的车辆号牌、移动终端号码的时序轨迹数据,以天为单位,按CarNumber分组统计:车号伴随频数RelatedFrequencyCnt、车号伴随频数最大值MaxRelatedFrequencyCnt,记作RelatedFrequencyCntMax、车号伴随所关联的卡口相邻基站置信度Confidence,构建车号伴随天表CarNumberMsisdnRelatedByDay,具体内容包括:CarNumber、Msisdn、Carrier、Confidence、RelatedFrequencyCnt、RelatedFrequencyCntMax、Ymd;步骤3-2:车号伴随多维特征提取;基于步骤3-1所得到的车号伴随天表CarNumberMsisdnRelatedByDay结果集,在指定[StartTime,EndTime]时间范围内,按CarNumber分组统计:车号伴随频数累计之和SumRelatedFrequecnyCnt,记作RelatedFrequecnyCntSum、车号伴随日期的去重数量CountDistinctYmd,称为车号伴随天数累计之和,记作RelatedDayCntSum、车号伴随频数最大值累计之和SumRelatedFrequencyCntMax,记作RelatedFrequencyCntMaxSum、CarNumber与Msisdn每次发生车号伴随时关联的卡口相邻基站置信度Confidence累计之和SumConfidence,记作ConfidenceSum;同时基于步骤3-1所得到的车号伴随天表CarNumberMsisdnRelatedByDay结果集和卡口数据,在指定[StartTime,EndTime]时间范围内,按CarNumber分组统计:每个车辆号牌CarNumber的抓拍频数累计之和,记作CarNumberShotFrequcnyCntSum、每个车辆号牌CarNumber的抓拍天数累计之和,记作CarNumberShotDayCntSum、每个车辆号牌CarNumber在每次发生车号伴随时所关联的卡口相邻基站置信度的最大值累计之和SumMaxConfidence,记作ConfidenceMaxSum;步骤3-3:车号伴随多维特征融合;基于步骤3-2结果集,针对每个车辆号牌CarNumber,分别萃取:运营商Carrier、车号伴随的移动终端号码Msisdn、车号伴随频数累计之和RelatedFrequecnyCntSum、车号伴随频数最大值累计之和RelatedFrequencyCntMaxSum、RelatedFrequecnyCntSumRelatedFrequencyCntMaxSum,将其称为车号伴随频数特征,记作Feature1、车号伴随天数累计之和RelatedDayCntSum、车辆号牌抓拍天数累计之和CarNumberShotDayCntSum、RelatedDayCntSumCarNumberShotDayCntSum,将其称为车号伴随天数特征,记作Feature2、车号伴随关联的卡口相邻基站置信度累计之和ConfidenceSum、车号伴随关联的卡口相邻基站置信度最大值累计之和ConfidenceMaxSum,ConfidenceSumConfidenceMaxSum将其称为车号伴随关联相邻基站的置信度特征,记作Feature3;步骤3-4:车号伴随多维特征加权计算与推荐;基于步骤3-3结果集,根据每个CarNumber的车号伴随多维特征Feature1、Feature2、Feature3,结合每个特征的权重系数weight1、weight2、weight3,以及车号伴随推荐值的计算公式:Score=Feature1*Weight1+Feature2*Weight2+Feature3*Weight3,分别计算出CarNumber伴随的Msisdn推荐值Score,并且按Score进行DenseRank降序排列,记作Rank,同时生成序号RowNumber,构建车号伴随推荐结果表CarNumberMsisdnRelatedRecommend,包括内容有:RowNumber、CarNumber、Msisdn、Carrier、Feature1、Feature2、Feature3、Score、Rank;权重系数weight1、weight2、weight3分别取值为0.4、0.3、0.3;基于车号伴随推荐结果表CarNumberMsisdnRelatedRecommend,针对每个CarNumber,抽取RowNumber=K的结果记录,即用于车号伴随结果TopK推荐应用;步骤4:卡口与其相邻基站关系学习以及车号伴随TopK推荐效果评估;卡口与其相邻基站关系学习的效果评估方法、指标为:已学习的卡口覆盖率KaKouIdLearnedCoverageRate=KaKouIdLearnedCntKaKouIdTotalCnt;其中,KaKouIdLearnedCnt是在步骤2-5所构建的卡口与其相邻基站关系表KaKouId_BaseStationId_Relation中出现的卡口唯一标识编号KaKouId去重数量;KaKouIdTotalCnt是卡口数据中出现的所有卡口唯一标识编号KaKouId去重数量;KaKouIdLearnedCoverageRate是卡口与其相邻基站关系表中已学习的卡口唯一标识编号KaKouId的覆盖率;KaKouIdLearnedCoverageRate取值要求:初始化时设定为60%以上,在车号伴随推荐稳定后设定为90%以上,若未达标,则继续扩增高质量的车号关系对样本数量,重新学习更新卡口与其相邻基站关系库;若已达标,则基于当前的卡口与其相邻基站关系表,按天正常加工,构建车号伴随天表;车号伴随TopK推荐效果评估方法、指标为:车号伴随TopK推荐结果命中的样本重合度:SampleCoincidenceDegree=CarNumberMsisdnPairTopKRecommedCntCarNumberMsisdnPairSampleCnt;其中,CarNumberMsisdnPairTopKRecommedCnt是在车号伴随TopK推荐结果中出现的高质量样本去重数量;CarNumberMsisdnPairSampleCnt是学习卡口相邻基站关系表使用的高质量样本去重数量;SampleCoincidenceDegree是推荐结果TopK命中的样本重合度,其取值为推荐结果TopK命中的样本数量与学习卡口相邻基站关系表使用的样本数量的比值;SampleCoincidenceDegree,在初始化时其取值要求设定为60%以上,在车号伴随推荐稳定后将其取值要求设定为90%以上,若未达标,则继续扩增高质量的车号关系对样本数量,重新学习更新卡口与其相邻基站关系库;若已达标,则需要基于当前的车号伴随TopK推荐结果,更新高质量的车号关系对样本;步骤5:更新高质量的车号关系对样本;基于步骤3-4中的车号伴随推荐结果表CarNumberMsisdnRelatedRecommend,针对每个车辆号牌CarNumber的推荐结果记录,仅萃取满足条件:当Score1–Score2=ScoreBiasValue时Score1对应的车号关系对{CarNumber,Msisdn},作为新一轮的高质量样本;其中,Score1是车号伴随推荐排名第一,即Rank=1的Msisdn推荐值、Score2是车号伴随推荐排名第二,即Rank=2的Msisdn推荐值、ScoreBiasValue是推荐值偏差量。

全文数据:

权利要求:

百度查询: 电信科学技术第十研究所有限公司 一种基于卡口与其相邻基站关系学习的车号伴随分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。