首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于机器学习的热度预测方法、装置、设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:腾讯科技(深圳)有限公司

摘要:本发明涉及一种基于机器学习的热度预测方法、设备及系统,包括:通过获取目标视频播放时产生的目标对象;根据所述相关信息确定所述目标视频中目标对象感兴趣的对象信息;基于热度预测模型对所述对象信息进行热度预测,得到所述目标视频中的热度对象信息,更精确地挖掘视频周边商品,通过模型预测替代反馈统计,能够大大提升对视频中热点对象的预测时效性,缩短了商品的生产上架流程。

主权项:1.一种基于机器学习的热度预测方法,其特征在于,所述方法包括:获取目标视频播放时产生的用户行为信息;根据所述用户行为信息确定所述目标视频中用户感兴趣的对象信息;基于热度预测模型对所述对象信息进行热度预测,得到所述目标视频中的热度对象信息;获取所述目标视频播放时,多个用户行为信息对应的热度对象信息;基于所述多个用户行为信息对应的热度对象信息确定所述目标视频中热度对象信息的热度参数;基于所述热度参数确定出不同热度的目标热度对象;所述热度预测模型的训练过程包括:获取训练视频播放时产生的用户行为信息;利用统计模型获取与所述训练视频播放时产生的用户行为信息对应的热度对象信息,所述统计模型基于用户的历史行为及人工经验,标识用户的兴趣;基于所述用户行为信息和所述热度对象信息对预设机器学习模型进行训练,得到所述热度预测模型,包括:在所述统计模型的基础上,引入预测模型,基于所述统计模型的结果作为训练样本,结合用户标签数据及视频标签数据,训练所述预测模型得到所述热度预测模型。

全文数据:一种基于机器学习的热度预测方法、装置、设备及存储介质技术领域本公开涉及机器学习技术领域,具体涉及一种基于机器学习的热度预测方法、装置、设备及存储介质。背景技术观看在线视频已经成为一种普遍的日常娱乐方式,在热门影视节目中出现的一些道具、衣物、配件等物品随着影视节目的热播常常会受到消费者的热捧。在线视频服务商也先后上线了与影视节目相结合的在线商城服务,用于向视频用户出售与影视内容相关的周边商品。目前,对于发掘影视剧节目的周边商品,主要依靠后反馈机制:通过收集与影视剧相关的微博、微信朋友圈、视频评论等消息进行分析,识别出用户热评热议的视频话题,然后生产与视频热门话题相关的周边商品。但现有的发掘视频相关商品热度的方案中是通过收集影视剧播出后的相关消息进行数据挖掘分析得到相关热门商品,导致对热门商品的预测的时效性差。发明内容本公开提出了一种基于机器学习的热度预测方法、装置、设备及存储介质,能够大大提升对视频中热点对象的预测时效性。本公开具体是以如下技术方案实现的:一方面,本公开提供了一种基于机器学习的热度预测方法,包括:获取目标视频播放时产生的用户行为信息;根据所述用户行为信息确定所述目标视频中用户感兴趣的对象信息;基于训练视频播放时产生的用户行为信息及所述训练视频播放时产生的用户行为信息对应的热度对象信息对预设及其学习模型进行训练得到的热度预测模型对所述对象信息进行热度预测,得到所述目标视频中的热度对象信息。另一方面,本公开提供了一种基于机器学习的热度预测装置,包括:第一获取模块,用于获取目标视频播放时产生的用户行为信息;第一确定模块,用于根据所述用户行为信息确定所述目标视频中用户感兴趣的对象信息;预测模块,用于基于训练视频播放时产生的用户行为信息及所述训练视频播放时产生的用户行为信息对应的热度对象信息对预设及其学习模型进行训练得到的热度预测模型对所述对象信息进行热度预测,得到所述目标视频中的热度对象信息。另一方面,本公开提供了一种基于机器学习的热度预测设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如前述的基于机器学习的热度预测方法。另一方面,本公开提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如前述的基于机器学习的热度预测方法。本公开提供了一种基于机器学习的热度预测方法、装置、设备及存储介质,通过收集用户观看视频时的场景信息,预测用户对视频内出现的相应对象的兴趣度,通过对同一视频的用户在观看视频时的场景信息分析,利用基于训练视频播放时产生的用户行为信息及所述训练视频播放时产生的用户行为信息对应的热度对象信息对预设及其学习模型进行训练得到的热度预测模型预测对应视频中相应对象的热度。利用本申请实施例提供的技术方案可以更精确地挖掘视频周边商品,通过模型预测替代反馈统计,能够大大提升对视频中热点对象的预测时效性,缩短了商品的生产上架流程。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。图1是本发明实施例提供的一种基于机器学习的热度预测方法的系统架构示意图;图2是本发明实施例提供的一种基于机器学习的热度预测方法的系统架构细节示意图;图3是本发明实施例提供的一种基于机器学习的热度预测方法的流程示意图;图4是本发明实施例提供的一种热度预测模型的建立方法的流程示意图;图5是本发明实施例提供的一种统计模型与预测模型结合的热度预测方法的流程示意图;图6是本发明实施例提供的一种确定目标视频红用户感兴趣的对象信息的方法的流程示意图;图7是本发明实施例提供的另一种确定目标视频红用户感兴趣的对象信息的方法的流程示意图;图8是本发明实施例提供的一种基于多个热度对象信息确定目标对象的方法的流程示意图;图9是本发明实施例提供的一种在播放视频时获取用户行为信息的应用场景示意图;图10是本发明实施例提供的一种基于机器学习的热度预测装置的结构示意图;图11是本申请实施例提供的一种热度预测方法的服务器的硬件结构框图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。以下介绍本发明基于机器学习的热度预测方法,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行例如并行处理器或者多线程处理的环境。图1是本发明实施例提供的一种基于机器学习的热度预测方法的系统架构示意图,如图1所示,该场景包括:客户端01、后台服务器02、大数据服务器03、分析结果数据库04和生产运营商05。图2是本发明实施例提供的一种基于机器学习的热度预测方法的系统架构细节示意图。具体的,所述客户端01为常用的视频播放设备,用于向用户提供在线视频播放服务以及收集上报用户的输入信号。所述客户端01可以包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备等类型的实体设备,也可以包括运行于实体设备中的软体,例如一些服务商提供给用户的网页页面,也可以为该些服务商提供给用户的应用。。在本说明书的实施例中,所述客户端01需要包含视频APP应用程序、麦克风、数据上报Agent代理、语音Agent四个模块。其中视频APP主要为用户提供在线视频的播放服务;麦克风用于接收用户的近场及远场语音信号;数据上报Agent用于收集用户在观看视频过程中的相关播放信息数据及操控行为数据,并发送给后端服务;语音Agent用于接收麦克风采集到的音频数据,进行编码转换端点检测、压缩、分片便于音频传输。具体的,所述后台服务器02主要接收客户端上传的数据。对于语音数据进行语音识别转换及自然语言处理。同时整理汇合用户的播放操控数据及语音数据,上报给底层的数据仓库进行存储。所述后台服务器02可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。服务器01可以包括有网络通信单元、处理器和存储器等等。在本说明书实施例中,后台服务包含ASR自动语音识别服务、NLP自然语言处理服务以及数据上报服务。其中ASR服务用于接收客户端语音agent上报的音频数据,对音频数据进行解码、语言模型、声学模型以及特征提取处理,中转转化为标准的文本。NLP服务接收ASR服务处理后的文本信息,基于规则模板匹配及深度学习模型理解用户语音的意图,识别出与视频中商品评论相关的语音信息。其中,规则模板是预定义的文本解析规则,基于规则模板理解用户语音的意图是通过对输入的文本信息按照预定义的规则进行解析,提取文本的意图。数据上报服务用于标准化客户端数据上报agent上报的数据以及NLP服务输出的语音评论信息,进行相关信息的扩展如相关剧的剧名、演员等信息,将数据传输后底层进行存储。其中,输入信息可能仅仅只是观看视频中的局部信息,为了后续的数据挖掘结果更精准,需要提供更丰富全面的资料信息,而为了节省网络带宽及降低数据上报的复杂度,客户端上报媒资信息时,一般仅会上报主要的id信息,比如视频的id,因此,在这里需要进行信息扩展。具体的,所述大数据服务器03负责存储海量的上报数据以及对数据进行挖掘分析,基于机器学习算法训练商品热度预测模型。所述大数据服务器03可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。服务器01可以包括有网络通信单元、处理器和存储器等等。具体的,所述服务器01可以用于进行用户分桶间的关联训练学习。本说明书实施例中所述大数据服务器03主要包含三部分:数据仓库主要用于海量数据存储例如基于Hadoop一种分布式系统基础架构搭建的数据仓库;爬虫服务主要用于外部数据爬取爬取外部网站上关于影片中物品的评论信息等,用于进一步丰富相关数据;数据分析服务基于采集的数据,结合机器学习算法,对视频中出现的商品的热度进行预测,预测结果输出到分析结果数据库。其中,所述大数据服务器03和所述后台服务器02的功能可以继承在同一个服务器中。具体的,所述分析结果数据库04主要用于存储所述大数据服务器03输出的分析预测结果,并将所述分析预测结果上报给所述生产运营商05。具体的,所述生产运营商05用于接收所述分析结果数据库04上报的分析预测结果,并基于所述分析预测结果确定生产运营方案。图3是本发明实施例提供的一种基于机器学习的热度预测方法的流程示意图,如图3所示,所述方法具体包括:S301:获取目标视频播放时产生的用户行为信息。在本说明书实施例中,所述获取目标视频播放时产生的用户行为信息,具体包括:语音信息、操作信息。其中,语音信息是指在视频播放过程中产生的声音信息被客户端处理成语音数据的信息。具体的,可以是在观看视频过程中用户进行语音搜索时获得的语音信息,也可以是客户端采集用户与网络中的好友语音聊天时用户发出的话音信息或用户在家庭环境中与亲朋好友聊天时产生的话音信息后生成的语音信息。操作信息是指在视频播放过程中用户对视频播放软件的操作信息。具体的,可以是在观看视频过程中对视频播放进度进行慢播、回看、暂停等的操作信息,也可以是在观看视频过程中的截图操作,也可以是在观看视频过程中的发送弹幕等操作信息。S303:根据所述用户行为信息确定所述目标视频中用户感兴趣的对象信息。具体的,对象信息可以是道具、衣服、配件等物品的信息,也可以是图像、符号等元素的信息。考虑到用户在观看目标视频时,若在目标视频中发现自己感兴趣的对象时,经常会对视频播放软件执行回看或暂停等操作,以便用户更清楚地看清自己感兴趣的对象,因此,可以根据用户在观看视频时产生的特定行为确定用户所感兴趣的对象。同样的,例如用户在与朋友一起观看目标视频时,遇到感兴趣的对象出现的画面时,常常会一起讨论交流该对象,因此,获取用户观看视频过程中产生的语音信息可以用于确定用户感兴趣的对象信息。如图4所示,提供了一种热度预测模型的建立方法的流程示意图,具体包括:S401:获取训练视频播放时产生的用户行为信息。S403:获取与所述训练视频播放时产生的用户行为信息对应的热度对象信息。本说明书实施例中,训练视频播放时产生的用户行为信息及其对应的热度对象信息作为训练数据,其来源可以是各大视频应用软件或视频网站的数据库,具体可以利用统计模型得出。参照图5,其提供了一种统计模型与预测模型结合的热度预测方法的流程示意图。具体的,通过定义人工经验规则,结合用户标签数据,对用户的行为数据进行归纳统计,综合考虑用户行为的场景、频次、强度等因素,量化描述用户的行为分布,计算出用户对于某个对象的兴趣强度。统计模型基于用户的历史行为及人工经验,标识用户的兴趣。具体的,人工经验规则是根据运营经验,针对数据统计结果的特征,提炼出的对象热度预测方案。比如:通过收集用户的评论信息,对于某个对象出现正面评价出现“漂亮”“喜欢”“想要”等词汇占比达到40%,则标示为喜欢。具体的,用户标签数据即用户画像比如用户年龄、学历、性别、住址、消费能力、收入等级等信息。一般地,用户喜欢观看的视频以及视频中感兴趣的对象与用户画像关系比较密切。例如,很多消费能力较高的用户会对影视剧中出现的奢侈品包包、服装、化妆品等感兴趣,很多年龄在二十几岁的消费者更热衷于影视剧中的动漫元素。具体的,用户的行为数据为可直接用于统计的用户操作,比如用户正向评论、快进、搜索等操作。具体的,对于具体对象的确定方法,一方面,评论信息中包含明显的商品名称的,可以直接提取对象;另一方面,可以根据用户评论时的视频画面,结合图像分析识别算法,提取出具体对象。S405:基于所述用户行为信息和所述热度对象信息对预设机器学习模型进行训练,得到热度预测模型。在统计模型的基础上,引入预测模型,基于统计模型的结果作为训练样本,结合用户标签数据及视频标签数据如古装剧、都市剧、惊悚、青年等标签数据,训练预设预测模型得到热度预测模型,针对用户行为数据预测每个用户在视频中可能感兴趣的对象。其中,预测模型可以是支持向量机、K近邻等机器学习模型。当获取的目标视频播放时产生的用户行为信息为语音信息时,根据所述用户行为信息确定所述目标视频中用户感兴趣的对象信息,如图6提供的一种确定目标视频红用户感兴趣的对象信息的方法的流程示意图所示,具体包括:S601:对所述语音信息进行语义分析,得到所述语音信息中与对象有关的信息。本领域技术人员可以理解的,可以通过语音识别等核心技术将非结构化的语音信息转换为结构化的索引,从而实现对音频文件中特定对象的挖掘和快速检索,得到语音信息中与对象有关的信息。S603:统计所述与对象有关的信息的出现频次。具体的,某对象出现频次越高,说明用户对其的感兴趣程度越高,出现频次越低,用户感兴趣程度越低。S605:基于所述出现频次确定所述目标视频中用户感兴趣的对象信息。当获取的目标视频播放时产生的用户行为信息为操作信息时,根据所述用户行为信息确定所述目标视频中用户感兴趣的对象信息,如图7提供的另一种确定目标视频红用户感兴趣的对象信息的方法的流程示意图所示,具体包括:S701:识别所述操作信息的类型。本领域技术人员可以理解的,对视频的操作根据类型不同可以分为发弹幕、回看、慢播、截图等。客户端在用户观看视频过程中,获取用户对视频软件的操作信息,进而识别出不同操作信息的类型。S703:根据所述操作信息的类型统计不同类型的操作信息的操作频次。其中,根据操作方式的不同可以将操作信息分为不同类型,并分别统计不同类型的操作信息的操作频次。例如,对于用户发弹幕的操作信息,统计用户发弹幕的频率;对于用户回放视频内容的操作信息,统计回放频率。具体的,某对象出现频次越高,说明用户对其的感兴趣程度越高,出现频次越低,用户感兴趣程度越低。S705:基于所述不同类型的操作信息的操作频次确定目标视频中用户感兴趣的对象信息。可以理解的,用户发弹幕的频率越高,用户越有可能在那段时间内播放的视频中存在感兴趣的对象,具体的,可以根据对弹幕内容的语义识别,进一步确定用户感兴趣的对象信息。S305:基于热度预测模型对所述对象信息进行热度预测,得到所述目标视频中的热度对象信息;所述热度预测模型为基于训练视频播放时产生的用户行为信息及所述训练视频播放时产生的用户行为信息对应的热度对象信息对预设机器学习模型进行训练得到的。通过步骤S301-S305得到的是一个用户观看目标视频时的热度对象信息,一般而言,一个用户的信息可能会比较不准确,或者不具有很高的参考价值。因此,可以获取多个用户的热度对象信息,以提高确定目标视频中热度对象的准确性,如图8所示,提供了一种基于多个热度对象信息确定目标对象的方法的流程示意图。S801:获取所述目标视频播放时,多个用户行为信息对应的热度对象信息。利用如步骤S301-S305得到一个用户在目标视频中的热度对象信息,获取多个用户在所述目标视频中的多个热度对象信息。其中,多个的数量越大对预测结果越准确。S803:基于所述多个用户行为信息对应的热度对象信息确定所述目标视频中热度对象信息的热度参数。具体的,所述热度参数可以是反映所述目标视频中热度对象在多个用户中的受欢迎程度的参数信息,可以是具体数量,也可以是比例。例如,获取到3个用户观看视频时的热度对象信息,分别是ABC、ACDE、AB,那么A出现的次数3次,B、C出现的次数为2次,D、E出现的次数为1次,则A的参数热度B、C的参数热度D、E的参数热度。S805:基于所述热度参数确定所述热度参数对应的热度对象信息的目标对象。具体的,可以设置一个或多个热度参数阈值,通过热度参数与热度参数阈值的比较,可以得出不同热度火爆、较热、次热等的目标对象。进一步的,举步骤S803中的例子,当热度参数=3时,对象A为火爆对象,当3热度参数=2时,对象B为较热对象。在确定出不同热度的目标对象时,将该目标热度对象及其相应的热度信息发送给商品生产运营商,以便商品生产运营商根据目标热度对象的不同热度设计和生产相适应数量的商品,以供用户选择和购买。本说明书的实施例,在获取到每个用户可能感兴趣的视频中的物品后,进行分布统计,获取可能最受欢迎的物品,作为最终的预测结果,提高了预测准确性。本发明实施例还提供了一种在播放视频时获取用户行为信息的应用场景。用户正在通过移动终端中的某视频软件播放动画片“小猪和小兔”,如图9所示,该动画片总时长为1小时,当用户看到底36分钟时,出现了小兔和小猪的画面。此时,用户如果对小猪比较感兴趣,用户可能会情不自禁地喊一声“啊,好喜欢这个小猪”,则移动终端可以对其进行收音,并将语音信息发送给后台服务器;用户还可以通过点击“暂停”按钮或拖动进度条进行回看等实现再次或多次仔细查看有小猪存在的画面,这些操作均被客户端捕捉到,并发送给后台服务器;同样地,当弹幕开启时,用户还可以通过输入字符“小猪好可爱”图中未示出等来表达自己对画面中小猪的感兴趣的情感,后台通过对弹幕中字符的语义识别,可以分析出用户感兴趣的对象“小猪”。将多个用户感兴趣的对象信息通过大数据服务器进行预测得到“小猪”的热度参数,例如100个样本用户中,对“小猪”感兴趣的用户为40个,那么生产运营商获得该信息后,会根据该小猪图案设计具有小猪元素的商品,例如T恤、存钱罐、玩具等,并根据该数量结合实际人群数量订制生产适量的商品。从而,等该动画片上线时,相应的小猪元素商品也上架了,实现了热门商品的准确预测,提高了用户满意度。本发明实施例还提供了一种基于机器学习的热度预测装置,如图10所示,所述装置包括:第一获取模块1001,用于获取目标视频播放时产生的用户行为信息;第一确定模块1003,用于根据所述用户行为信息确定所述目标视频中用户感兴趣的对象信息;预测模块1005,用于热度预测模型对所述对象信息进行热度预测,得到所述目标视频中的热度对象信息;所述热度预测模型为基于训练视频播放时产生的用户行为信息及所述训练视频播放时产生的用户行为信息对应的热度对象信息对预设机器学习模型进行训练得到的。获取训练视频播放时产生的用户行为信息。在一些实施例中,所述预测模块中的热度预测模型通过以下方式建立:获取与所述训练视频播放时产生的用户行为信息对应的热度对象信息;基于所述用户行为信息和所述热度对象信息对预设机器学习模型进行训练,得到热度预测模型。在一些实施例中,当所述用户行为信息为语音信息时,所述第一确定模块包括:语义分析单元,用于对所述语音信息进行语义分析,得到所述语音信息中与对象有关的信息;第一统计单元,用于统计所述与对象有关的信息的出现频次;第一确定单元,用于基于所述出现频次确定所述目标视频中用户感兴趣的对象信息。在一些实施例中,当所述用户行为信息为操作信息时,所述第一确定模块包括:识别单元,用于识别所述操作信息的类型;第二统计单元,用于根据所述操作信息的类型统计不同类型的操作信息的操作频次;第二确定单元,用于基于所述不同类型的操作信息的操作频次确定目标视频中用户感兴趣的对象信息。在一些实施例中,所述装置还包括:第二获取模块,用于获取所述目标视频播放时,多个用户行为信息对应的热度对象信息;第二确定模块,用于基于所述多个用户行为信息对应的热度对象信息确定所述目标视频中热度对象信息的热度参数。在一些实施例中,所述装置还包括:第三确定模块,用于基于所述热度参数确定所述热度参数对应的热度对象信息的目标对象。所述的装置实施例中的装置与方法实施例基于同样的发明构思。本发明还提供了一种基于机器学习的热度预测设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如前述的基于机器学习的热度预测方法。本发明还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如前述的基于机器学习的热度预测方法。可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器ROM,Read-OnlyMemory、随机存取存储器RAM,RandomAccessMemory、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。本说明书实施例中,所述存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。本申请实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例,图11是本申请实施例提供的一种热度预测方法的服务器的硬件结构框图。如图11所示,该服务器1100可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器CentralProcessingUnits,CPU1110处理器1110可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置、用于存储数据的存储器1130,一个或一个以上存储应用程序1123或数据1122的存储介质1120例如一个或一个以上海量存储设备。其中,存储器1130和存储介质1120可以是短暂存储或持久存储。存储在存储介质1120的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1110可以设置为与存储介质1120通信,在服务器1100上执行存储介质1120中的一系列指令操作。服务器1100还可以包括一个或一个以上电源1160,一个或一个以上有线或无线网络接口1150,一个或一个以上输入输出接口1140,和或,一个或一个以上操作系统1121,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM等等。输入输出接口1140可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器1100的通信供应商提供的无线网络。在一个实例中,输入输出接口1140包括一个网络适配器NetworkInterfaceController,NIC,其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,输入输出接口1140可以为射频RadioFrequency,RF模块,其用于通过无线方式与互联网进行通讯。本领域普通技术人员可以理解,图11所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器1100还可包括比图11中所示更多或者更少的组件,或者具有与图11所示不同的配置。由上述本发明提供的基于机器学习的热度预测方法、装置、设备及存储介质的实施例可见,本说明书实施例基于用户视频观看场景信息分析实现的视频相关商品热度预测的系统及方案,通过收集用户观看视频时的场景信息语音信息、操作信息等,结合机器学习算法及大数据挖掘技术,预测用户对视频内出现的相应物品的兴趣度,从而预测对应影视剧相应物品的热度。通过这种方式,可以更精确地挖掘视频周边商品,通过模型预测替代反馈统计,大大缩短商品的生产上架流程,可以更好地结合视频的热度,提升对应周边商品的关注度。此外,挖掘商品的准确度依赖于对应话题热度,对于小众的剧集,很难发掘对应的周边商品。本发明提供的基于机器学习的热度预测方法也能够对消肿的影视剧作品进行周边商品热度预测,满足小众群体的购物需求。需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、系统和服务器实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

权利要求:1.一种基于机器学习的热度预测方法,其特征在于,所述方法包括:获取目标视频播放时产生的用户行为信息;根据所述用户行为信息确定所述目标视频中用户感兴趣的对象信息;基于热度预测模型对所述对象信息进行热度预测,得到所述目标视频中的热度对象信息;所述热度预测模型为基于训练视频播放时产生的用户行为信息及所述训练视频播放时产生的用户行为信息对应的热度对象信息对预设机器学习模型进行训练得到的。2.根据权利要求1所述的方法,其特征在于,当所述用户行为信息为语音信息时,所述根据所述用户行为信息确定所述目标视频中用户感兴趣的对象信息包括:对所述语音信息进行语义分析,得到所述语音信息中与对象有关的信息;统计所述与对象有关的信息的出现频次;基于所述出现频次确定所述目标视频中用户感兴趣的对象信息。3.根据权利要求1所述的方法,其特征在于,当所述用户行为信息为操作信息时,所述根据所述用户行为信息确定所述目标视频中用户感兴趣的对象信息包括:识别所述操作信息的类型;根据所述操作信息的类型统计不同类型的操作信息的操作频次;基于所述不同类型的操作信息的操作频次确定目标视频中用户感兴趣的对象信息。4.根据权利要求1所述的方法,其特征在于,在所述基于热度预测模型对所述对象信息进行热度预测,得到所述目标视频中的热度对象信息之后,所述方法还包括:获取所述目标视频播放时,多个用户行为信息对应的热度对象信息;基于所述多个用户行为信息对应的热度对象信息确定所述目标视频中热度对象信息的热度参数。5.根据权利要求4所述的方法,其特征在于,在所述基于所述多个用户行为信息对应的热度对象信息确定所述目标视频中热度对象信息的热度参数之后,所述方法还包括:基于所述热度参数确定所述热度参数对应的热度对象信息的目标对象。6.一种基于机器学习的热度预测装置,其特征在于,所述装置包括:第一获取模块,用于获取目标视频播放时产生的用户行为信息;第一确定模块,用于根据所述用户行为信息确定所述目标视频中用户感兴趣的对象信息;预测模块,用于热度预测模型对所述对象信息进行热度预测,得到所述目标视频中的热度对象信息;所述热度预测模型为基于训练视频播放时产生的用户行为信息及所述训练视频播放时产生的用户行为信息对应的热度对象信息对预设机器学习模型进行训练得到的。7.根据权利要求6所述的装置,其特征在于,当所述用户行为信息为语音信息时,所述第一确定模块包括:语义分析单元,用于对所述语音信息进行语义分析,得到所述语音信息中与对象有关的信息;第一统计单元,用于统计所述与对象有关的信息的出现频次;第一确定单元,用于基于所述出现频次确定所述目标视频中用户感兴趣的对象信息。8.根据权利要求6所述的装置,其特征在于,当所述用户行为信息为操作信息时,所述第一确定模块包括:识别单元,用于识别所述操作信息的类型;第二统计单元,用于根据所述操作信息的类型统计不同类型的操作信息的操作频次;第二确定单元,用于基于所述不同类型的操作信息的操作频次确定目标视频中用户感兴趣的对象信息。9.根据权利要求6所述的装置,其特征在于,所述装置还包括:第二获取模块,用于获取所述目标视频播放时,多个用户行为信息对应的热度对象信息;第二确定模块,用于基于所述多个用户行为信息对应的热度对象信息确定所述目标视频中热度对象信息的热度参数。10.根据权利要求9所述的装置,其特征在于,所述装置还包括:第三确定模块,用于基于所述热度参数确定所述热度参数对应的热度对象信息的目标对象。11.一种基于机器学习的热度预测设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至5中任一权利要求所述的基于机器学习的热度预测方法。12.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至5中任一权利要求所述的基于机器学习的热度预测方法。

百度查询: 腾讯科技(深圳)有限公司 一种基于机器学习的热度预测方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。