首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

推送展示信息的方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:腾讯科技(北京)有限公司

摘要:本发明提供了一种推送展示信息的方法和装置,属于计算机技术领域。所述方法包括:当接收到终端发送的展示信息的获取请求时,获取上下文信息和所述终端当前登录账户的账户信息,其中,所述账户信息包括账户的基本信息、在当前时间点之前预设时长内各启动方式的计数和浏览的展示信息,所述获取请求中携带有页面标识,所述上下文信息为所述页面标识对应的页面中除展示信息之外的其它内容;根据所述页面标识、所述上下文信息和所述账户信息,在存储的展示信息集合中,确定待展示的展示信息;向所述终端发送所述待展示的展示信息。采用本发明,可以提高展示信息的有效性。

主权项:1.一种推送展示信息的方法,其特征在于,所述方法包括:当接收到终端发送的新闻类应用程序对应的展示信息的获取请求时,获取上下文信息和所述终端当前登录账户的账户信息,其中,所述账户信息包括账户的基本信息、在当前时间点之前预设时长内所述新闻类应用程序各启动方式的计数和浏览的展示信息,所述获取请求中携带有所述新闻类应用程序中待展示页面的页面标识,所述上下文信息为所述页面标识对应的页面中除展示信息之外的其它内容,所述启动方式包括主动启动方式和被动启动方式,所述主动启动方式指通过触发所述新闻类应用程序的图标打开所述新闻类应用程序的方式,所述被动启动方式指通过触发链接打开所述新闻类应用程序的方式,所述被动启动方式包括通过触发所述新闻类应用程序的推送消息打开所述新闻类应用程序的方式、通过触发其它好友分享的新闻信息的链接打开所述新闻类应用程序的方式、通过其它好友分享的展示信息的链接打开所述新闻类应用程序的方式;根据所述页面标识与待展示的展示信息的数目的对应关系,确定所述页面标识对应的待展示的展示信息的第一数目;将所述上下文信息、所述账户信息、所述展示信息集合输入到点击率预估模型,得到所述展示信息集合中每个展示信息对应的点击率,其中,所述点击率预估模型是根据样本集合迭代训练得到的,所述样本集合中包括历史时段内的多个展示信息的内容、所述多个展示信息分别对应的账户信息、以及所述多个展示信息分别对应的上下文信息,所述多个展示信息分别对应的账户信息包括账户的基本信息、所述历史时段内所述新闻类应用程序各启动方式的计数和在所述历史时段内浏览的展示信息;根据预设的矫正模型,对所述每个展示信息对应的点击率分别进行矫正,得到所述每个展示信息的矫正后的点击率;对于所述每个展示信息,确定所述展示信息的矫正后的点击率与所述展示信息对应的单价的第二乘积;对于所述每个展示信息,确定所述展示信息的第二乘积与所述展示信息的预设质量系数的第三乘积;根据所述每个展示信息对应的第三乘积,在所述展示信息集合中,确定所述第一数目个展示信息,将所述第一数目个展示信息确定为待展示的展示信息;向所述终端发送所述待展示的展示信息。

全文数据:推送展示信息的方法和装置技术领域本发明涉及计算机技术领域,特别涉及一种推送展示信息的方法和装置。背景技术随着计算机技术和网络技术的发展,网络新闻业务得到了广泛的推广,用户可以在终端中安装新闻类的应用程序,通过该应用程序浏览各种频道的新闻信息,如体育新闻信息、娱乐新闻信息等。通常终端中新闻类的应用程序在显示新闻信息时,还会显示一些展示信息,如广告信息等,供用户浏览。相关技术中,一般终端检测到新闻类的应用程序开启后,终端会向展示信息的服务器发送展示信息的获取请求,该服务器可以从展示信息集合中,随机选择一些待展示的展示信息,推送给终端,终端可以在应用程序中显示服务器推送的展示信息。在实现本发明的过程中,发明人发现相关技术至少存在以下问题:由于服务器是随机向终端推送展示信息,这样,展示信息很可能不符合用户的实际需求,用户也不会去点击,从而会导致展示信息的点击率比较低。发明内容本发明实施例提供了一种推送展示信息的方法和装置,为了解决相关技术的问题,本发明的技术方案如下:一方面,提供了一种推送展示信息的方法,所述方法包括:当接收到终端发送的展示信息的获取请求时,获取上下文信息和所述终端当前登录账户的账户信息,其中,所述账户信息包括账户的基本信息、在当前时间点之前预设时长内各启动方式的计数和浏览的展示信息,所述获取请求中携带有页面标识,所述上下文信息为所述页面标识对应的页面中除展示信息之外的其它内容;根据所述页面标识、所述上下文信息和所述账户信息,在存储的展示信息集合中,确定待展示的展示信息;向所述终端发送所述待展示的展示信息。一方面,提供了一种确定点击率的方法,所述方法包括:获取页面标识、上下文信息、账户信息和展示信息集合,所述账户信息包括账户的基本信息、在当前时间点之前预设时长内各启动方式的计数和浏览的展示信息,所述上下文信息为所述页面标识对应的页面中除展示信息之外的其它内容;将所述账户信息、所述上下文信息和所述展示信息集合输入预设的点击率预估模型,得到所述展示信息集合中每个展示信息的点击率。一方面,提供了一种推送展示信息的装置,所述装置包括:获取模块,用于当接收到终端发送的展示信息的获取请求时,获取上下文信息和所述终端当前登录账户的账户信息,其中,所述账户信息包括账户的基本信息、在当前时间点之前预设时长内各启动方式的计数和浏览的展示信息,所述获取请求中携带有页面标识,所述上下文信息为所述页面标识对应的页面中除展示信息之外的其它内容;确定模块,用于根据所述页面标识、所述上下文信息和所述账户信息,在存储的展示信息集合中,确定待展示的展示信息;发送模块,用于向所述终端发送所述待展示的展示信息。一方面,提供了一种确定点击率的装置,所述装置包括:获取模块,用于获取页面标识、上下文信息、账户信息和展示信息集合,所述账户信息包括账户的基本信息、在当前时间点之前预设时长内各启动方式的计数和浏览的展示信息,所述上下文信息为所述页面标识对应的页面中除展示信息之外的其它内容;确定模块,用于将所述账户信息、所述上下文信息和所述展示信息集合输入预设的点击率预估模型,得到所述展示信息集合中每个展示信息的点击率。一方面,提供了一种服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现推送展示信息的方法和确定点击率的方法。一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现推送展示信息的方法和确定点击率的方法。本发明实施例中,在确定待展示的展示信息时,是结合账户的账户信息和上下文信息确定的,相对要符合用户的需求,提高了用户点击展示信息的概率,从而会使展示信息展示的有效性比较高。附图说明为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1a是本发明实施例提供的一种推送展示信息的应用场景的示意图;图1b是本发明实施例提供的一种推送展示信息的方法的流程示意图;图2是本发明实施例提供的一种展示信息的显示示意图;图3是本发明实施例提供的一种训练点击率预估模型的示意图;图4是本发明实施例提供的一种数据处理的方法示意图;图5是本发明实施例提供的一种最小描述原理切分示意图;图6是本发明实施例提供的一种点击率预估的流程示意图;图7是本发明实施例提供的一种推送展示信息的装置的结构示意图;图8是本发明实施例提供的一种推送展示信息的装置的结构示意图;图9是本发明实施例提供的一种确定点击率的装置的结构示意图;图10是本发明实施例提供的一种服务器的结构示意图。具体实施方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。相关技术中,用户在打开新闻类的应用程序后,终端会向该新闻信息的服务器发送新闻信息的获取请求,并且同时向展示信息的服务器发送展示信息的获取请求。新闻信息的服务器在接收到新闻信息的获取请求后,可以获取新闻信息,然后向终端发送新闻信息。展示信息的服务器接收到终端发送的展示信息的获取请求后,展示信息的服务器可以获取预先存储的展示信息集合,从该展示信息集合中,随机确定出待展示的展示信息,然后向终端发送待展示的展示信息。终端接收到待展示的展示信息后,可以显示待展示的展示信息。这样,待展示的展示信息是展示信息的服务器随机确定的,有可能不符合用户的需求,用户也不太可能去点击,从而导致展示信息展示的有效性比较低。本发明实施例提供的方案中,展示信息的服务器在接收到终端发送的展示信息的获取请求后,可以获取上下文信息、终端当前登录账户的账户信息和预设的展示信息集合,该账户信息包括账户的基本信息、预设时长内各启动方式的计数和浏览的展示信息,然后根据获取请求中携带的页面标识、上下文信息、账户信息、展示信息集合以及预设的点击率预估模型,在展示信息集合中,确定待展示的展示信息,向终端发送待展示的展示信息。这样,待展示的展示信息是结合账户的账户信息和上下文信息确定的,相对要符合用户的需求,提高了用户点击展示信息的概率,从而会使展示信息展示的有效性比较高。在进行实施前,首先介绍一下本发明实施例中的场景,如图1a所示,终端可以向展示信息的服务器发送展示信息的获取请求,并且向新闻信息的服务器发送新闻信息的获取请求,新闻信息的服务器可以确定待展示的新闻信息,向终端发送待展示的新闻信息,展示信息的服务器可以确定待展示的展示信息,向终端发送待展示的展示信息,终端可以对待展示的新闻信息和待展示的展示信息进行显示。本发明实施例提供了一种推送展示信息的方法,该方法的执行主体为服务器。服务器可以是新闻类的应用程序对应的展示信息的服务器,服务器中可以设置有处理器、接发器和存储器,处理器可以用于处理推送展示信息过程中的相关处理,接发器可以用于接收以及发送消息,存储器可以用于存储推送展示信息过程中需要的数据以及产生的数据。如图1b所示,该方法的处理流程可以如下:步骤101,当接收到终端发送的展示信息的获取请求时,获取上下文信息和终端当前登录账户的账户信息。在实施中,用户想要在终端中看新闻时,可以在终端上安装新闻类的应用程序,然后操作开启该应用程序,终端则会显示该应用程序的登录界面,用户可以使用自己申请的账户和密码进行登录,在登录成功后,终端可以确定待展示页面,然后确定出待展示页面的页面标识,然后可以向新闻信息的服务器发送新闻信息的获取请求,并且同时向展示信息的服务器发送展示信息的获取请求,两个获取请求中均携带有页面标识,用于指示展示信息所要显示的页面。新闻信息的服务器可以基于页面标识,向终端发送待展示的新闻信息。展示信息的服务器接收到终端发送的展示信息的获取请求时,可以获取当前的上下文信息和终端当前登录账户的账户信息。其中,上下文信息指终端请求显示的页面中包括的内容、该页面所属的频道等,频道有军事新闻频道、社会新闻频道等,另外,为了方便理解,上下文信息也可以理解为展示信息所要展示的页面中除展示信息之外的其它内容。展示信息的服务器可以基于展示信息的获取请求中携带的页面标识,确定终端请求显示的页面中包括的内容。账户信息中包括账户的基本信息、在当前时间点之前预设时长内各启动方式的计数和浏览的展示信息,账户的基本信息包括用户在注册该账户时输入的年龄、性别、兴趣等、地理位置信息、终端的型号、连接的网络等。预设时长可以由技术人员预设,并且存储至服务器中,如1个月、1周等。启动方式包括主动启动方式和被动启动方式两大类,主动启动方式指通过触发新闻类的应用程序的图标,打开应用程序的方式,被动启动方式为通过触发链接打开应用程序的方式。通过不同种类的链接,被动启动方式具体又可以分为以下几类:通过触发新闻类的应用程序的推送消息打开应用程序的方式、通过触发其它好友分享的新闻信息的链接打开应用程序的方式、通过其它好友分享的展示信息的链接打开应用程序的方式等。某种启动方式的计数也就是指使用该种启动方式,启动应用程序的次数。步骤102,根据页面标识、上下文信息和账户信息,在展示信息集合中,确定待展示的展示信息。在实施中,展示信息的服务器获取到当前登录账户的账户信息和上下文信息后,可以获取存储的展示信息的集合,然后获取预设的点击率预估模型,将上下文信息、账户信息、展示信息集合输入到点击率预估模型,得到展示信息集合中每个展示信息对应的点击率,从获取请求中解析得到其中携带的页面标识,然后使用解析得到的页面标识和每个展示信息对应的点击率,从展示信息集合中,确定待展示的展示信息。其中,点击率指展示信息被点击次数与被显示次数的比值,可以用于反映该展示信息的受关注程度。需要说明的是,上述存储的展示信息集合中包括展示信息运营商在展示信息的服务器中存储的展示信息,展示信息可以是广告信息等,展示信息的数据一般包括展示信息的图片、链接以及文本等。另外,由于展示信息的服务器中存储的展示集合会随着信息的投放一直更新,所以存储的展示信息集合还可以是周期性变化的周期可以是一分钟、两分钟等,那么展示信息的服务器获取的展示信息集合是接收到展示信息的获取请求时存储的展示信息集合。可选的,展示信息的服务器可以根据获取到的浏览的展示信息,确定出浏览的展示信息对应的分类信息,例如,浏览的展示信息为电子产品类展示信息,分类信息则为电子产品。展示信息的服务器可以将上下文信息、账户信息中的基本信息、各种启动方式的计数、浏览的展示信息的分类信息、展示信息集合输入到点击率预估模型,得到展示信息集合中每个展示信息对应的点击率。可选的,展示信息的服务器可以根据获取请求中携带的页面标识,确定出待展示的展示信息的数目,进而确定出待展示的展示信息,相应的步骤102的处理可以如下:根据上下文信息、账户信息、展示信息集合以及预设的点击率预估模型,在展示信息集合中,选择第一数目个展示信息,将第一数目个展示信息确定为待展示的展示信息。在实施中,展示信息的服务器可以根据页面标识与待展示的展示信息的数目的对应关系该对应关系可以由技术人员预先存储至展示信息的服务器中,确定出接收到的获取请求中携带的页面标识对应的待展示的展示信息的第一数目。然后将上下文信息、账户信息、展示信息集合输入到点击率预估模型,得到展示信息集合中,每个展示信息对应的点击率,然后使用每个展示信息对应的点击率,从展示信息集合中,选择第一数目个展示信息,将第一数目个展示信息,确定为待展示的展示信息。可选的,展示信息的服务器可以使用展示信息对应的点击单价,确定待展示的展示信息,相应的步骤102的处理可以如下:根据上下文信息和账户信息,确定存储的展示信息集合中每个展示信息对应的点击率;根据每个展示信息对应的点击率、每个展示信息对应的点击单价和页面标识,确定待展示的展示信息。在实施中,展示信息的服务器获取到当前登录账户的账户信息和存储的展示信息集合后,可以获取预设的点击率预估模型,然后将上下文信息、账户信息和展示信息集合输入到点击率预估模型,得到展示信息集合中,每个展示信息对应的点击率。展示信息的运营商在展示信息的服务器中存储展示信息时,为每个展示信息都标定了对应的点击单价。展示信息的点击单价表示展示信息被点击一次时,展示信息的投放者为运营商所付的金额。展示信息的服务器可以获取每个展示信息的点击单价,根据每个展示信息的对应的点击率、每个展示信息对应的点击单价和页面标识,确定待展示的展示信息。可选的,可以使用每个展示信息对应的点击率与点击单价的乘积,确定待展示的展示信息,相应的处理可以如下:对于每个展示信息,确定展示信息对应的点击率与展示信息对应的点击单价的第一乘积;根据页面标识和每个展示信息对应的第一乘积,确定待展示的展示信息。在实施中,对于每个展示信息,展示信息的服务器可以将确定出的点击率、和点击单价进行相乘,得到第一乘积,这样,对于每个展示信息,都对应有一个第一乘积。展示信息的服务器可以根据页面标识与待展示的展示信息的数目的对应关系,确定出接收到的获取请求中携带的页面标识对应的第二数目该对应关系可以由技术人员预先存储至展示信息的服务器中,然后将展示信息集合中每个展示信息对应的第一乘积,从大到小进行排序,从最大的乘积开始选取第二数目个第一乘积,将这第二数目个第一乘积分别对应的展示信息,确定为待展示的展示信息。这样,可以结合点击单价,确定待展示的展示信息,所以确定的待展示的展示信息相对更准确。可选的,为了使确定出的待展示的展示信息更准确,还可以首先对展示信息对应的点击率进行矫正,相应的处理可以如下:根据预设的矫正模型,对每个展示信息对应的点击率分别进行矫正,得到每个展示信息的矫正后的点击率;对于每个展示信息,确定展示信息的矫正后的点击率与展示信息对应的单价的第二乘积;根据页面标识和每个展示信息对应的第二乘积,确定待展示的展示信息。在实施中,展示信息的服务器获取到当前登录账户的账户信息和存储的展示信息集合后,可以获取预设的点击率预估模型,然后将上下文信息、账户信息和展示信息集合输入到点击率预估模型,得到展示信息集合中,每个展示信息对应的点击率。展示信息的服务器可以获取预设的矫正模型,将每个展示信息对应的点击率,作为矫正模型的输入,得到每个展示信息的矫正后的点击率。展示信息的服务器可以获取每个展示信息的点击单价,对于每个展示信息,展示信息的服务器可以将确定出的矫正后的点击率和点击单价相乘,得到第二乘积,这样,对于每个展示信息,都对应有一个第二乘积。展示信息的服务器可以根据页面标识与待展示的展示信息的数目的对应关系,确定出接收到的获取请求中携带的页面标识对应的第二数目该对应关系可以由技术人员预先存储至展示信息的服务器中,然后将展示信息集合中每个展示信息对应的第二乘积,从大到小进行排序,从最大的乘积开始选取第二数目个第二乘积,将这第二数目个第二乘积分别对应的展示信息,确定为待展示的展示信息。这样,由于点击率经过了矫正,所以确定出的点击率更准确,进而确定出的展示信息更准确。可选的,为了使确定出的展示信息更准确,还可以考虑展示信息的预设质量系数,相应的处理可以如下:对于每个展示信息,确定展示信息的第二乘积与展示信息的预设质量系数的第三乘积;根据页面标识和每个展示信息对应的第三乘积,确定待展示的展示信息。在实施中,展示信息的运营商在展示信息的服务器中存储展示信息时,为每个展示信息都标定了对应的预设质量系数,预设质量系数代表了该展示信息的质量高低程度,一般属于0,1,展示信息的预设质量系数越大,表示质量越高,反之,展示信息的预设质量系数越小,表示质量越低,如广告用语不健康的广告预设质量系数较小,广告用语健康的广告的预设质量系数较高。对于每个展示信息,展示信息的服务器可以将展示信息的预设质量系数与第二乘积相乘,得到第三乘积,这样每个展示信息都对应一个第三乘积。展示信息的服务器可以将展示信息集合中每个展示信息对应的第三乘积,从大到小进行排序,从最大的乘积开始选取第二数目个第三乘积,将这第二数目个第三乘积分别对应的展示信息,确定为待展示的展示信息。这样,由于考虑了质量系数,所以确定出的展示信息更准确。可选的,使用矫正模型进行矫正的方法可以如下:根据预设的矫正模型中点击率范围与矫正值的对应关系,确定每个展示信息对应的点击率所属的点击率范围对应的矫正值,根据每个展示信息对应的矫正值,分别对每个展示信息对应的点击率分别进行矫正,得到每个展示信息的矫正后的点击率。在实施中,预设的矫正模型中设置有点击率范围与矫正值的对应关系,该对应关系的确定过程在后面详细说明。展示信息的服务器确定每个展示信息对应的点击率后,可以确定出每个展示信息的点击率所属的点击率范围,然后使用点击率范围与矫正值的对应关系,确定每个展示信息对应的点击率所属的点击率范围分别对应的矫正值。矫正值可的形式可以是数值偏差值,也可以是系数,对于任一展示信息,如果矫正值是一个偏差值,展示信息服务器可以将该展示信息对应的点击率与矫正值相加,得到该展示信息对应的矫正后的点击率。如果矫正值是一个矫正系数,对于任一展示信息,展示信息服务器可以将该展示信息对应的点击率与矫正值相乘,得到该展示信息对应的矫正后的点击率,这样,可以得到每个展示信息对应的矫正后的点击率。步骤103,向终端发送待展示的展示信息。在实施中,如图2所示,展示信息的服务器确定待展示的展示信息后,可以向终端发送待展示的展示信息。对于每个待展示的展示信息,投放者都设置有对应的显示位置,终端接收到待展示的展示信息后,可以确定待展示的展示信息的显示位置,在当前显示的界面的显示位置处显示待展示的展示信息。可选的,如图3所示,本发明实施例中,还给出了确定点击率预估模型的方法,相应的处理过程可以如下:步骤301,获取样本集合。在实施中,展示信息的服务器可以获取记录的点击日志和曝光日志,终端每次检测到点击展示信息,都会向展示信息的服务器发送点击日志,展示信息的服务器会记录点击日志,进而可以记录每个被点击的展示信息的账户信息,如果某个展示信息未被点击,则该展示信息对应的账户信息为0。另外,展示信息的服务器上还记录有曝光日志,曝光日志用于记录展示信息被显示次数,被显示时间等。展示信息的服务器可以通过点击日志和曝光日志,获取到一个样本集合,样本集合中包括一段时间内的多个展示信息的内容、以及每个展示信息分别对应的账户信息、以及每个展示信息对应的上下文信息。账户信息中包括年龄、性别、兴趣、历史浏览的展示信息、以及浏览展示信息的时间也就是点击展示信息的时间、各种启动方式的计数、位置信息等。上下文信息指展示信息所在的页面中的其它内容和页面所属的频道,上述提到的每一种信息年龄、性别等,都可以称为是展示信息对应的每一维特征。另外,对于每个展示信息,都对应计算实际点击率,也就是使用被点击次数除以显示次数。这样,对于每个展示信息,都标定有展示信息的内容、点击展示信息的用户的账户信息、以及上下文信息、实际点击率实际点击率是展示信息的标签,不是特征。另外,在执行后续步骤302之前,还可以对获取到的数据进行过滤,如果同一展示信息被同一个用户两次点击的时长小于预设时长如2秒等,则认为是恶意点击,可以将这两次的点击记录删除。用表格的形式表示每个展示信息的特征以及标签点击率,可以如表一所示:表一步骤302,根据样本集合,迭代训练得到点击率预估模型。在实施中,展示信息的服务器在获取到样本集合后,由于确定点击率属于两分类问题即输出只有两种,分别代表两个类别,点击类别1和不点击类别0,可以使用逻辑回归算法,进行训练,具体是通过Sigmoid函数,将点击率转化为0~1,公式表示可以如下:假设样本集合中每个展示信息对应的特征满足线性边界的情况,对于线性边界的情况,边界形式如下:式2中xi表示每一维特征,θi表示每一维特征对应的待训练的参数,T表示转置,上述的θ、x为向量,θ=[θ0,θ1,θ2,......,θn]T。构造预测函数为:对于输入的样本集合,分类结果为类别1和类别0的概率也就是展示信息被点击的概率与不被点击的概率分别为:Py=1|x,θ=hθx,Py=0|x,θ=1-hθx4基于式4将概率综合起来得到:Py|x,θ=hθxy1-hθx1-y5对式5取似然函数为:式6中,m表示样本集合中展示信息的数目,每个展示信息有n个特征。对式6中Lθ为取对数得到:然后对式7进行最大似然估计,使得lθ取最大值,得到θ,θ即为最佳值。其中,在进行最大似然估计时,本发明实施例还提供了θ的迭代更新过程:假设损失函数为Jθ,将损失函数Jθ取为:因为乘了一个负的系数-1m,所以取Jθ的最小值时,即为lθ的最大值,也就得到了θ的最佳值。后续使用梯度下降法来求Jθ的最小值。以下给出了θ的更新过程:其中,式9中,j表示迭代的次数。这样,结合式10,式9可以表示为:这样,基于上述的多次迭代,得到Jθ的最小值,也就得到θ的最佳值,将θ的最佳值代入到预测函数也就得到了点击率预估模型,后续可以用于对展示信息的点击率进行预测。可选的,由于本发明实施例中,样本集合中某些特征的数据的格式有可能不是训练数据的格式,所以还可以首先对样本集合中,各种格式的数据,进行处理,得到模型训练可用的格式,相应的处理可以如下:对样本集合中的数据进行处理,得到可用于训练的数据;根据可用于训练的数据,迭代训练得到点击率预估模型。在实施中,展示信息的服务器可以对多个展示信息的数据进行处理,并对每个展示信息分别对应的账户信息的数据进行处理,并且对每个展示信息分别对应的上下文信息的数据进行处理,得到处理后的数据。然后使用处理后的数据,进行迭代训练,得到点击率预估模型,如何训练得到点击率预估模型在前面已经详细说明,此处不再赘述。可选的,对各种特征的数据的处理方式如下:根据每个特征分别对应的处理方式,对每个特征的数据进行处理。在实施中,如图4所示,一般特征的数据可以分为无序型、连续型和文本型等,对于无序型,有以下几种处理方式:特征域限定数据的数值范围,异常值处理将异常值标定为空值或标定为未检测到的特征,向量化可以进行分类处理、聚类处理等,哈希策略哈希策略可以有哈希空间和哈希函数的选择,哈希函数的选择有多种,如MurMuHash32、MD5SUM等,哈希空间有全局哈希与局部哈希,特征生效频率通过控制特征的出现频率进行初步选择,也就是说出现一定次数才进行统计。如图4所示,对于连续型,有以下几种处理方式:异常值处理将异常值标定为空值或标定为未检测到的特征,特征值上下界确定特征值的上界与下界,特征离散化等频离散化、等距离散化、基于熵的划分等,特征归一化极值偏移量和相对宽度。多个展示信息的数据一般是图片和文本等,所以属于无序型的数据和文本型的数据,可以按照无序型的几种处理方式中任一种进行处理。上下文信息一般是包括页面中显示的内容,一般也是图片和文本,也是属于无序型的数据和文本型的数据。对于每个展示信息分别对应的账户信息的数据,由于账户信息包括年龄、性别、兴趣、地理位置信息、终端的型号、各种启动方式的计数、点击展示信息的时间、历史浏览的展示信息等。所以账户信息的数据中既有无序型的数据,也有连续型的数据,所以都分别采用自身所对应的处理进行处理。以下以各启动方式的计数的处理方式进行说明:按照最小描述长度原理,对各启动方式的计数进行处理。一般各启动方式的计数是独热编码的,独热编码为一位有效编码,例如,一共有三种颜色,黄色、绿色和红色,黄色为0,绿色为1,红色为2,经过独热编码后,黄色可以表示为1,0,0,绿色可以表示为0,1,0,红色可以表示为0,0,1。由于每进行启动一次,对应的向量就增加一维,这样,会使得向量冗长,所以需要对这类特征的特征值进行处理,此处采用最小描述长度原理进行处理,进行切分处理。如图5所示,将待切分的特征值添加至待切分队列,首先查看待切分队列是否为空,如果是空则结束,如果非空,则从中获取特征值,进行切分,进行第一次切分,计算切分前的特征值的熵,E=SUMpi*logpi,在切分后计算切分后的熵,SplitE=|S1|*E1+|S2|*E2|S|,S1表示切分后的第一段的长度,S2表示切分后的第二段的长度,S表示切分前的总长度,E1表示切分后的第一段的熵,E2表示切分后的第二段的熵。然后计算信息增益E-SplitE,如果信息增益大于预设数值预设数值可以由技术人员预设,并且存储至展示信息的服务器中,则将切分后的特征值放入待切分队列,继续进行切分,直到第N次切分后的信息增益小于预设数值,将第N-1次的切分确定为最佳切分,然后重新判断待切分队列是否为空,如果信息增益小于预设数值,则重新判断待切分队列是否为空。例如,如果主动启动一次的计数为1,主动启动方式的总和为100,那么进行独热编码后主动启动一次的向量为100维的向量,假如进行切分后,主动启动方式的分段结果为0,2,6,12,34,100,也就是将100分成了5段,即0,2],2,6],6,12],12,34],34,100],这样,主动启动一次的向量为1,0,0,0,0,主动启动5次的维度为0,1,0,0,0,这样向量的维度会降低。另外,本发明实施例中,还提供了完整的训练和使用流程图,如图6所示,可以分为数据处理平台、机器学习平台、展示信息推送平台,数据处理平台中用于收集样本集合,机器学习平台用于训练数据,得到点击率的预估模型,展示信息推送平台用于基于点击率的预估模型推送展示信息。具体的:展示信息的服务器通过数据处理平台中获取点击日志、曝光日志和多个展示信息以及每个展示信息对应的账户信息,然后将获取到的数据进行标注,也就是标注出多个展示信息中每个展示信息对应的账户信息、点击率和上下文信息。展示信息的服务器通过数据处理处理平台,将上述样本集合传输至机器学习平台,通过机器学习平台可以对获取到的样本集合中的数据进行处理,得到可用于训练的数据,也就是得到规范化的训练日志,然后进行训练得到点击率预估模型。将点击率预估模型发送至展示信息推送平台,通过展示信息推送平台中的点击率预估模型,可以对展示信息进行推送。另外,在机器学习平台中还设置有矫正模型,矫正模型的确定方式可以如下:机器学习平台通过点击率预估模型对样本集合中的展示信息的点击率进行预估,得到预估的点击率,与实际的点击率进行对比,然后将实际点击率按照聚类的方法划分为多个点击率范围,将某个点击率范围中包含的实际点击率分别与对应的预估的点击率做差值,将得到的多个差值取平均值,得到的平均值即为该点击率范围对应的矫正值,基于相同的方法可以得到每个点击率范围分别对应的矫正值。这样,就得到了矫正模型中点击率范围与矫正值的对应关系。另外,在确定出矫正模型之后,通过机器学习平台可以将矫正模型发送至展示信息推送平台。需要说明的是,本发明实施例中,获取到样本集合中的数据都使用分布式进行记录。还需要说明的是,本发明实施例中,提到的新闻信息的服务器和展示信息的服务器还可以是同一服务器。另外,由于在训练点击率预估模型时,添加了启动方式,所以可以使训练出的点击率预估模型对应的AUCAreaundercurve,曲线下的面积增大。一般AUC的数值越大,分类器越好,所以结合启动方式,可以使点击率预估模型越准确。本发明实施例中,在确定待展示的展示信息时,是结合账户的账户信息和上下文信息确定的,相对要符合用户的需求,提高了用户点击展示信息的概率,从而会使展示信息展示的有效性比较高。另外,本发明实施例中,还提供了一种基于点击率预估模型,确定点击率的方法具体方法可以如下:获取页面标识、上下文信息、账户信息和展示信息集合,账户信息包括账户的基本信息、在当前时间点之前预设时长内各启动方式的计数和浏览的展示信息,上下文信息为页面标识对应的页面中除展示信息之外的其它内容;将账户信息、上下文信息和展示信息集合输入预设的点击率预估模型,得到展示信息集合中每个展示信息的点击率。具体处理过程可以参见前面实施例中描述的确定点击率的过程,此处不再赘述。本发明实施例中,由于结合了启动方式来计算点击率,所述可以使计算出的点击率更准确。基于相同的技术构思,本发明实施例还提供了一种推送展示信息的装置,如图7所示,该装置包括:获取模块710,用于当接收到终端发送的展示信息的获取请求时,获取上下文信息和所述终端当前登录账户的账户信息,其中,所述账户信息包括账户的基本信息、在当前时间点之前预设时长内各启动方式的计数和浏览的展示信息,所述获取请求中携带有页面标识,所述上下文信息为所述页面标识对应的页面中除展示信息之外的其它内容;确定模块720,用于根据所述页面标识、所述上下文信息和所述账户信息,在存储的展示信息集合中,确定待展示的展示信息;发送模块730,用于向所述终端发送所述待展示的展示信息。可选的,所述确定模块720,用于:根据所述上下文信息和所述账户信息,确定存储的展示信息集合中每个展示信息对应的点击率;根据所述每个展示信息对应的点击率、所述每个展示信息对应的点击单价和所述页面标识,确定待展示的展示信息。可选的,所述确定模块720,用于:对于所述每个展示信息,确定所述展示信息对应的点击率与所述展示信息对应的点击单价的第一乘积;根据所述页面标识和所述每个展示信息对应的第一乘积,确定待展示的展示信息。可选的,所述确定模块720,用于:根据预设的矫正模型,对所述每个展示信息对应的点击率分别进行矫正,得到所述每个展示信息的矫正后的点击率;对于所述每个展示信息,确定所述展示信息的矫正后的点击率与所述展示信息对应的单价的第二乘积;根据所述页面标识和所述每个展示信息对应的第二乘积,确定待展示的展示信息。可选的,所述确定模块720,用于:对于所述每个展示信息,确定所述展示信息的第二乘积与所述展示信息的预设质量系数的第三乘积;根据所述页面标识和所述每个展示信息对应的第三乘积,确定待展示的展示信息。可选的,所述确定模块720,用于:根据预设的矫正模型中点击率范围与矫正值的对应关系,确定所述每个展示信息对应的点击率所属的点击率范围对应的矫正值;根据所述每个展示信息对应的矫正值,对所述每个展示信息对应的点击率分别进行矫正,得到所述每个展示信息的矫正后的点击率。可选的,所述确定模块720,用于:根据所述页面标识,确定待展示的展示信息的第一数目;根据所述上下文信息和所述账户信息,在所述展示信息集合中,选择所述第一数目个展示信息,将所述第一数目个展示信息确定为待展示的展示信息。可选的,所述确定模块720,用于:将所述页面标识、所述上下文信息、所述账户信息和存储的展示信息集合输入到预设的点击率预估模型,得到待展示的展示信息。所述获取模块710,还用于:获取样本集合,其中,所述样本集合中包括多个展示信息、以及所述多个展示信息中每个展示信息分别对应的账户信息、上下文信息、被显示次数;如图8所示,所述装置还包括:训练模块740,用于根据所述样本集合,迭代训练得到所述点击率预估模型。可选的,所述训练模块740,用于:对所述样本集合中的数据进行处理,得到可用于训练的数据;根据所述可用于训练的数据,迭代训练得到所述点击率预估模型。本发明实施例中,在确定待展示的展示信息时,是结合账户的账户信息和上下文信息确定的,相对要符合用户的需求,提高了用户点击展示信息的概率,从而会使展示信息展示的有效性比较高。需要说明的是:上述实施例提供的推送展示信息的装置在推送展示信息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的推送展示信息的装置与推送展示信息的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。基于相同的技术构思,本发明实施例还提供了一种确定点击率的装置,如图9所示,该装置包括:获取模块910,用于获取页面标识、上下文信息、账户信息和展示信息集合,所述账户信息包括账户的基本信息、在当前时间点之前预设时长内各启动方式的计数和浏览的展示信息,所述上下文信息为所述页面标识对应的页面中除展示信息之外的其它内容;确定模块920,用于将所述账户信息、所述上下文信息和所述展示信息集合输入预设的点击率预估模型,得到所述展示信息集合中每个展示信息的点击率。本发明实施例中,由于结合了启动方式来计算点击率,所述可以使计算出的点击率更准确。需要说明的是:上述实施例提供的确定点击率的装置在确定点击率时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的确定点击率的装置与确定点击率的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。请参考图10,其示出了本发明实施例所涉及的服务器的结构示意图,该服务器可以用于实施上述实施例中提供的推送展示信息的方法。具体来讲:该服务器1000可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器centralprocessingunits,CPU1022例如,一个或一个以上处理器和存储器1032,一个或一个以上存储应用程序1042或数据1044的存储介质1030例如一个或一个以上海量存储设备。其中,存储器1032和存储介质1030可以是短暂存储或持久存储。存储在存储介质1030的程序可以包括一个或一个以上模块图示没标出,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1022可以设置为与存储介质1030通信,在服务器1000上执行存储介质1030中的一系列指令操作。服务器1000还可以包括一个或一个以上电源1026,一个或一个以上有线或无线网络接口1050,一个或一个以上输入输出接口1058,一个或一个以上键盘1056,和或,一个或一个以上操作系统1041,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM等等。服务器1000可以包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行上述推送展示信息和确定点击率的方法。本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现上述的推送展示信息的方法和确定点击率的方法。本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

权利要求:1.一种推送展示信息的方法,其特征在于,所述方法包括:当接收到终端发送的展示信息的获取请求时,获取上下文信息和所述终端当前登录账户的账户信息,其中,所述账户信息包括账户的基本信息、在当前时间点之前预设时长内各启动方式的计数和浏览的展示信息,所述获取请求中携带有页面标识,所述上下文信息为所述页面标识对应的页面中除展示信息之外的其它内容;根据所述页面标识、所述上下文信息和所述账户信息,在存储的展示信息集合中,确定待展示的展示信息;向所述终端发送所述待展示的展示信息。2.根据权利要求1所述的方法,其特征在于,所述根据所述页面标识、所述上下文信息和所述账户信息,在存储的展示信息集合中,确定待展示的展示信息,包括:根据所述上下文信息和所述账户信息,确定存储的展示信息集合中每个展示信息对应的点击率;根据所述每个展示信息对应的点击率、所述每个展示信息对应的点击单价和所述页面标识,确定待展示的展示信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述每个展示信息对应的点击率、所述每个展示信息对应的点击单价和所述页面标识,确定待展示的展示信息,包括:对于所述每个展示信息,确定所述展示信息对应的点击率与所述展示信息对应的点击单价的第一乘积;根据所述页面标识和所述每个展示信息对应的第一乘积,确定待展示的展示信息。4.根据权利要求2所述的方法,其特征在于,所述根据所述每个展示信息对应的点击率、所述每个展示信息对应的点击单价和所述页面标识,确定待展示的展示信息,包括:根据预设的矫正模型,对所述每个展示信息对应的点击率分别进行矫正,得到所述每个展示信息的矫正后的点击率;对于所述每个展示信息,确定所述展示信息的矫正后的点击率与所述展示信息对应的单价的第二乘积;根据所述页面标识和所述每个展示信息对应的第二乘积,确定待展示的展示信息。5.根据权利要求4所述的方法,其特征在于,所述根据所述页面标识和所述每个展示信息对应的第二乘积,确定待展示的展示信息,包括:对于所述每个展示信息,确定所述展示信息的第二乘积与所述展示信息的预设质量系数的第三乘积;根据所述页面标识和所述每个展示信息对应的第三乘积,确定待展示的展示信息。6.根据权利要求3所述的方法,其特征在于,所述根据预设的矫正模型,对所述每个展示信息对应的点击率分别进行矫正,得到所述每个展示信息的矫正后的点击率,包括:根据预设的矫正模型中点击率范围与矫正值的对应关系,确定所述每个展示信息对应的点击率所属的点击率范围对应的矫正值;根据所述每个展示信息对应的矫正值,对所述每个展示信息对应的点击率分别进行矫正,得到所述每个展示信息的矫正后的点击率。7.根据权利要求1所述的方法,其特征在于,所述根据所述页面标识、所述上下文信息和所述账户信息,在存储的展示信息集合中,确定待展示的展示信息,包括:根据所述页面标识,确定待展示的展示信息的第一数目;根据所述上下文信息和所述账户信息,在所述展示信息集合中,选择所述第一数目个展示信息,将所述第一数目个展示信息确定为待展示的展示信息。8.根据权利要求1所述的方法,其特征在于,所述根据所述页面标识、所述上下文信息和所述账户信息,在存储的展示信息集合中,确定待展示的展示信息,包括:将所述页面标识、所述上下文信息、所述账户信息和存储的展示信息集合输入到预设的点击率预估模型,得到待展示的展示信息。9.根据权利要求8所述的方法,其特征在于,所述方法还包括:获取样本集合,其中,所述样本集合中包括多个展示信息、以及所述多个展示信息中每个展示信息分别对应的账户信息、上下文信息、被显示次数;根据所述样本集合,迭代训练得到所述点击率预估模型。10.根据权利要求9所述的方法,其特征在于,所述根据所述样本集合,迭代训练得到所述点击率预估模型,包括:对所述样本集合中的数据进行处理,得到可用于训练的数据;根据所述可用于训练的数据,迭代训练得到所述点击率预估模型。11.一种确定点击率的方法,其特征在于,所述方法包括:获取页面标识、上下文信息、账户信息和展示信息集合,所述账户信息包括账户的基本信息、在当前时间点之前预设时长内各启动方式的计数和浏览的展示信息,所述上下文信息为所述页面标识对应的页面中除展示信息之外的其它内容;将所述账户信息、所述上下文信息和所述展示信息集合输入预设的点击率预估模型,得到所述展示信息集合中每个展示信息的点击率。12.一种推送展示信息的装置,其特征在于,所述装置包括:获取模块,用于当接收到终端发送的展示信息的获取请求时,获取上下文信息和所述终端当前登录账户的账户信息,其中,所述账户信息包括账户的基本信息、在当前时间点之前预设时长内各启动方式的计数和浏览的展示信息,所述获取请求中携带有页面标识,所述上下文信息为所述页面标识对应的页面中除展示信息之外的其它内容;确定模块,用于根据所述页面标识、所述上下文信息和所述账户信息,在存储的展示信息集合中,确定待展示的展示信息;发送模块,用于向所述终端发送所述待展示的展示信息。13.一种确定点击率的装置,其特征在于,所述方法包括:获取模块,用于获取页面标识、上下文信息、账户信息和展示信息集合,所述账户信息包括账户的基本信息、在当前时间点之前预设时长内各启动方式的计数和浏览的展示信息,所述上下文信息为所述页面标识对应的页面中除展示信息之外的其它内容;确定模块,用于将所述账户信息、所述上下文信息和所述展示信息集合输入预设的点击率预估模型,得到所述展示信息集合中每个展示信息的点击率。14.一种服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如权利要求1至10任一所述的推送展示信息的方法以及如权利要求11所述的确定点击率的方法。15.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如权利要求1至10任一所述的推送展示信息的方法以及如权利要求11所述的确定点击率的方法。

百度查询: 腾讯科技(北京)有限公司 推送展示信息的方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。