买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
摘要:本发明公开了一种数据分析的方法和装置,涉及计算机技术领域。该方法的一个具体实施方式包括:获取每个被分析对象的访问历史路径,其中所述访问历史路径中包括多个历史页面;确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息;分析所述被分析对象与所述位置信息的对应关系。该实施方式提高数据分析的精确度,具有更高的可操作性和扩展性。
主权项:1.一种数据分析的方法,其特征在于,包括:获取每个被分析对象的访问历史路径,其中所述访问历史路径中包括多个历史页面;确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息;分析所述被分析对象与所述位置信息的对应关系,包括:根据所述位置信息统计所述历史页面中的位置对应的被分析对象的数量;其中,确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息之前,还包括:对所述历史页面进行筛选,选取符合预设条件的历史页面;根据筛选后的历史页面确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息。
全文数据:一种数据分析的方法和装置技术领域本发明涉及计算机技术领域,尤其涉及一种数据分析的方法、装置、电子设备和计算机可读介质。背景技术电商运营人员做促销活动时,促销活动链接可能会被投放在电商网站的不同页面上,点击这些促销活动链接最终会进入同一个页面如购买页面等,分析出不同页面所带来的促销成交情况,可以让运营人员清晰地了解到不同投放页面的营销效果,十分有利于下一阶段营销方案的策划和调整。在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有技术中对每个页面进行人工独立的埋点,埋点发生错误时,会影响统计数据的准确性。到达一个最终的页面之前可能有多级页面,如果一级页面和二级页面都有埋点,从二级页面进入最终页面时,历史页面记录的是二级页面在一级页面上的埋点信息,最后分析的结果就归属到二级页面上,造成覆盖,分析结果不准确。发明内容有鉴于此,本发明实施例提供一种数据分析的方法和装置,能够提高数据分析的精确度,具有更高的可操作性和扩展性。为实现上述目的,根据本发明实施例的一个方面,提供了一种数据分析的方法,包括:获取每个被分析对象的访问历史路径,其中所述访问历史路径中包括多个历史页面;确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息;确定所述被分析对象与所述位置信息的对应关系。可选地,确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息之前,所述方法还包括:对所述历史页面进行筛选,选取符合预设条件的历史页面;筛选之后,所述方法还包括:根据筛选后的历史页面确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息。可选地,确定所述被分析对象与所述位置信息的对应关系的方法包括:根据所述历史页面中对应的位置信息统计对应的被分析对象的数量。可选地,获取每个被分析对象的访问历史路径的方法还包括:根据预设标识获取每个被分析对象的访问历史路径,其中,所述历史页面中包括所述预设标识。为实现上述目的,根据本发明实施例的另一个方面,提供了一种数据分析的装置,包括:查询模块,用于获取每个被分析对象的访问历史路径,其中所述访问历史路径中包括多个历史页面;定位模块,用于确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息;分析模块,用于确定所述被分析对象与所述位置信息的对应关系。可选地,所述装置还包括:筛选模块,用于在所述定位模块确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息之前,对所述历史页面进行筛选,选取符合预设条件的历史页面;所述定位模块还用于,根据筛选后的历史页面确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息。可选地,所述分析模块还用于根据所述历史页面中对应的位置信息统计对应的被分析对象的数量。可选地,所述查询模块还用于根据预设标识获取每个被分析对象的访问历史路径,其中,所述历史页面中包括所述预设标识。为实现上述目的,根据本发明实施例的再一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现一种数据分析的方法中任一所述的方法。为实现上述目的,根据本发明实施例的再一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被一个或多个处理器执行时实现一种数据分析的方法中任一所述的方法。上述发明中的一个实施例具有如下优点或有益效果:因为采用通过确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息的技术手段,所以克服了数据分析不准确地技术问题,进而达到提高数据分析精确度的技术效果。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本发明,不构成对本发明的不当限定。其中:图1是根据本发明实施例的一种数据分析的方法的主要步骤的示意图;图2是根据本发明实施例的一个优选实施例;图3是根据本发明实施例的另一个优选实施例;图4是根据本发明实施例的一种数据分析的装置的主要部分的示意图;图5是本发明实施例可以应用于其中的示例性系统架构图;图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1是根据本发明实施例的一种数据分析的方法的主要步骤的示意图,如图1所示:步骤S101表示获取每个被分析对象的访问历史路径,其中所述访问历史路径中包括多个历史页面;此步骤的目的是在历史数据或历史记录中查找到每个被分析对象的历史页面。其中所述访问历史路径可表明用户的访问、浏览点击、或打开等行为对应历史页面的先后顺序。所述方法还可包括对获取到的历史页面按照浏览时间顺序进行排序,目的是便于后续的步骤的执行,提高效率。获取每个被分析对象的访问历史路径的方法还包括:根据预设标识获取每个被分析对象的访问历史路径,其中,所述历史页面中包括所述预设标识。此步骤的目的更精确地对历史页面进行查询,增加可操作性与扩展性。预设标识可用于对历史页面进行分类、检索等,还可根据需要进行统一管理与批量修改。例如在电商领域,为用户浏览的促销活动页面赋予一个唯一标识,使该用户的历史浏览记录中的历史页面中也携带该唯一标识,然后就可通过查询该唯一标识的方式查询出历史页面。步骤S102表示确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息;此步骤的目的是将数据分析的结果精确到每个历史页面中对应的位置上。确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息之前,所述方法还包括:对所述历史页面进行筛选,选取符合预设条件的历史页面;筛选之后,所述方法还包括:根据筛选后的历史页面确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息。此步骤的目的缩小查询范围,提高查询效率。例如在电商领域,历史页面中可能包括商品详情页面、促销页面和错误页面等,预设条件是选取促销页面,因此,可以制作一个页面类型维表,对相同类型的促销页面地址赋予一个相同页面类型值,用历史页面的地址和维表中的促销页面地址进行字符串匹配,筛选出匹配度高的历史页面作为促销页面。或者筛选保留含有用户点击促销按钮的历史页面。步骤S103表示分析所述被分析对象与所述位置信息的对应关系,提高数据分析的精确度。例如确定被分析对象与所述位置信息的关联度等。分析所述被分析对象与所述位置信息的对应关系的方法包括:根据所述位置信息统计所述历史页面中的位置对应的被分析对象的数量。例如,被统计对象A对应的位置信息为No.1、No.2、No.3;被统计对象B对应的位置信息为No.2、No.3;被统计对象C对应的位置信息为No.1、No.3;则位置No.1对应的被统计对象的数量为2;位置No.2对应的被统计对象的数量为2;位置No.3对应的被统计对象的数量为3。图2是根据本发明实施例的一个优选实施例,如图2所示:对于电商网站,每天定时启动Python一种面向对象的解释型计算机程序设计语言脚本,对所有用户的浏览记录进行分析处理,根据预设的页面分类维表对历史页面进行筛选,选取含有促销活动的历史页面,并按浏览时间排序。读取前一天下单用户下单商品的购买记录包括立即购买记录与加入购物车记录,通过购买记录里保存的页面信息,匹配到订单的历史页面记录。在该页面的同一个会话内,基于用户点击立即购买或加入购物车之前的历史浏览路径,统计出该页面在各个投放位置上的成交情况,统计结果以报表形式展现。图3是根据本发明实施例的另一个优选实施例,如图3所示:对于任意一个订单,首先根据它是加入购物车或是立即购买订单找到下单记录,然后根据下单记录中的预设标识查询到下单时的历史页面,筛选出浏览顺序在它之前的所有历史页面,在这些历史页面中再筛选出含有促销活动的历史页面。对筛选出含有促销活动的历史页面,根据用户浏览的时间顺序,从点击加入购物车或立即购买的页面开始往前追溯。在用户的浏览的历史页面里,如果追溯到的历史页面是促销活动首页或从外部入口进入的页面,则将该订单统计到该页面所属促销活动的投放位置上,该订单的成交统计结束。否则,将该笔订单统计到这个页面所属活动的投放位置上之后,再往前追溯一个页面,继续判断页面是否是活动首页或是从外部入口进入的页面。最终统计到所有活动在各个投放位置上的成交情况。图4是根据本发明实施例的一种数据分析的装置400的主要部分的示意图,如图4所示:查询模块401用于获取每个被分析对象的访问历史路径,其中所述访问历史路径中包括多个历史页面;目的是在历史数据或历史记录中查找到每个被分析对象的历史页面。其中所述访问历史路径可表明用户的浏览的历史页面的先后顺序。查询模块401还可用于对获取到的历史页面按照浏览时间顺序进行排序,目的是便于后续的步骤的执行,提高效率。查询模块401还用于根据预设标识获取每个被分析对象的访问历史路径,其中,所述历史页面中包括所述预设标识。目的更精确地对历史页面进行查询,增加可操作性与扩展性。预设标识可用于对历史页面进行分类、检索等,还可根据需要进行统一管理与批量修改。例如在电商领域,为用户浏览的促销活动页面赋予一个唯一标识,使该用户的历史浏览记录中的历史页面中也携带该唯一标识,然后就可通过查询该唯一标识的方式查询出历史页面。定位模块402用于用于确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息;目的是将数据分析的结果精确到每个历史页面中对应的位置上。分析模块403用于分析所述被分析对象与所述位置信息的对应关系,提高数据分析的精度。例如确定被分析对象与所述位置信息的关联度等。分析模块403还用于根据所述位置信息统计所述历史页面中的位置对应的被分析对象的数量。例如,被统计对象A对应的位置信息为No.1、No.2、No.3;被统计对象B对应的位置信息为No.2、No.3;被统计对象C对应的位置信息为No.1、No.3;则位置No.1对应的被统计对象的数量为2;位置No.2对应的被统计对象的数量为2;位置No.3对应的被统计对象的数量为3。装置400还包括:筛选模块,用于在定位模块402确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息之前,对所述历史页面进行筛选,选取符合预设条件的历史页面;目的缩小查询范围,提高查询效率。定位模块402还用于,根据筛选后的历史页面确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息。例如在电商领域,历史页面中可能包括商品详情页面、促销页面和错误页面等,预设条件是选取促销页面,因此,可以制作一个页面类型维表,对相同类型的促销页面地址赋予一个相同页面类型值,用历史页面的地址和维表中的促销页面地址进行字符串匹配,筛选出匹配度高的历史页面作为促销页面。或者筛选保留含有用户点击促销按钮的历史页面。图5示出了可以应用本发明实施例的AA方法或AA装置的示例性系统架构500。如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果例如目标推送信息、产品信息反馈给终端设备。需要说明的是,本发明实施例所提供的一种数据分析的方法一般由服务器505执行,相应地,一种数据分析的装置一般设置于服务器505中。应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。图6所示为适于用来实现本发明实施例的终端设备的计算机系统600的结构示意图。图6所示的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图6所示,计算机系统600包括中央处理单元CPU601,其可以根据存储在只读存储器ROM602中的程序或者从存储部分608加载到随机访问存储器RAM603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602以及RAM603通过总线604彼此相连。输入输出IO接口605也连接至总线604。以下部件连接至IO接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管CRT、液晶显示器LCD等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至IO接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。特别地,根据本发明公开的实施例,上文步骤图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行步骤图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和或从可拆卸介质611被安装。在该计算机程序被中央处理单元CPU601执行时,执行本发明的系统中限定的上述功能。需要说明的是,本发明所示的计算机可读介质包括计算机可读信号介质或计算机可读存储介质,或者是上述两者的任意组合。计算机可读存储介质包括但不限于电、磁、光、电磁、红外线、半导体的系统、装置或器件,或者上述内容的任意组合。计算机可读存储介质具体包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器RAM、只读存储器ROM、可擦式可编程只读存储器EPROM或闪存、光纤、便携式紧凑磁盘只读存储器CD-ROM、光存储器件、磁存储器件、或者上述内容的任意组合。在本发明中,计算机可读存储介质包括任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用;计算机可读的信号介质包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码,这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述信号的任意组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF射频等,或者上述介质的任意组合。附图中的步骤图或框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作,步骤图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以并行地执行,有时也可以按相反的顺序执行,其执行顺序依所涉及的功能而定。也要注意的是,框图或步骤图中的每个方框以及其组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。描述于本发明实施例中所涉及到的模块或单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块或单元也可以设置在处理器中,例如,可以描述为:一种处理器包括查询模块、定位模块和分析模块。其中,这些模块或单元的名称在某种情况下并不构成对该模块或单元本身的限定,例如,查询模块还可以被描述为“用于获取每个被分析对象的访问历史路径的模块”。另一方面,本发明实施例还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取每个被分析对象的访问历史路径,其中所述访问历史路径中包括多个历史页面;确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息;分析所述被分析对象与所述位置信息的对应关系。根据本发明实施例的技术方案,能够提高数据分析的精确度,具有更高的可操作性和扩展性。上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
权利要求:1.一种数据分析的方法,其特征在于,包括:获取每个被分析对象的访问历史路径,其中所述访问历史路径中包括多个历史页面;确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息;分析所述被分析对象与所述位置信息的对应关系。2.根据权利要求1所述的方法,其特征在于,确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息之前,所述方法还包括:对所述历史页面进行筛选,选取符合预设条件的历史页面;筛选之后,所述方法还包括:根据筛选后的历史页面确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息。3.根据权利要求1所述的方法,其特征在于,确定所述被分析对象与所述位置信息的对应关系的方法包括:根据所述位置信息统计所述历史页面中的位置对应的被分析对象的数量。4.根据权利要求1所述的方法,其特征在于,获取每个被分析对象的访问历史路径的方法还包括:根据预设标识获取每个被分析对象的访问历史路径,其中,所述历史页面中包括所述预设标识。5.一种数据分析的装置,其特征在于,包括:查询模块,用于获取每个被分析对象的访问历史路径,其中所述访问历史路径中包括多个历史页面;定位模块,用于确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息;分析模块,用于分析所述被分析对象与所述位置信息的对应关系。6.根据权利要求5所述的装置,其特征在于,所述装置还包括:筛选模块,用于在所述定位模块确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息之前,对所述历史页面进行筛选,选取符合预设条件的历史页面;所述定位模块还用于,根据筛选后的历史页面确定每个所述被分析对象在其访问历史路径的每个历史页面中对应的位置信息。7.根据权利要求5所述的装置,其特征在于,所述分析模块还用于根据所述位置信息统计所述历史页面中的位置对应的被分析对象的数量。8.根据权利要求5所述的装置,其特征在于,所述查询模块还用于根据预设标识获取每个被分析对象的访问历史路径,其中,所述历史页面中包括所述预设标识。9.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被一个或多个处理器执行时实现如权利要求1-4中任一所述的方法。
百度查询: 北京京东尚科信息技术有限公司 北京京东世纪贸易有限公司 一种数据分析的方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。