Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 荆门汇易佳信息科技有限公司刘文平获国家专利权

荆门汇易佳信息科技有限公司刘文平获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉荆门汇易佳信息科技有限公司申请的专利互联网用户的知识与兴趣个性化描摹系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN112733021B

龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202011641277.4,技术领域涉及:G06F16/9535;该发明授权互联网用户的知识与兴趣个性化描摹系统是由刘文平;王辉设计研发完成,并于2020-12-31向国家知识产权局提交的专利申请。

互联网用户的知识与兴趣个性化描摹系统在说明书摘要公布了:本发明基于对互联网用户微博数据的解析,提出一种基于LDA改进模型的互联网用户知识与兴趣描摹系统,在LDA改进模型对用户的兴趣进行解析的基础上,对用户的知识分布进行进一步的描摹,从用户兴趣描述层面进行扩展,提出根据知识与兴趣两个方面的描摹方式进行用户描述的方法,精准对用户进行个性化刻画;加入互联网用户知识层级的概念,将知识层级融合进LDA改进模型当中,用户兴趣建模主要采用关键词模型对用户兴趣进行建模,用户知识建模将知识层级这纳入用户的知识描摹模型当中来,以有向连通图对用户知识建模。能够精准快速的对用户进行特征描摹,有较高的可行性与准确性。

本发明授权互联网用户的知识与兴趣个性化描摹系统在权利要求书中公布了:1.互联网用户的知识与兴趣个性化描摹系统,其特征在于,通过网络用户的个人已有知识体系的解析获取用户特征,基于对互联网用户数据的解析,提出一种基于LDA改进模型的互联网用户知识与兴趣描摹系统,在LDA改进模型对用户的兴趣进行解析的基础上,对用户的知识分布进行进一步的描摹; 从用户兴趣描述层面进行扩展,提出根据知识与兴趣两个方面的描摹方式进行用户描述的方法,精准对用户进行个性化刻画;加入互联网用户知识层级的概念,将知识层级融合进LDA改进模型当中,提出互联网用户的知识与兴趣个性化描摹系统;用户兴趣建模中,采用关键词模型对用户兴趣进行建模,在用户知识建模中,将知识层级这纳入用户的知识描摹模型当中来,以有向连通图对用户知识建模; 用户兴趣模型表达:反映用户的兴趣、爱好方面的信息,采用关键词用户兴趣表达模型,用一个关键词列表来呈现一个用户的兴趣,通过挖掘技术或机器学习的方式获取一个用户的关键词集合; 互联网用户知识层级结构:基于主体需求知识的层级角度,将知识划分为四个层级:生存知识、技能知识、精神知识、自我实现知识,针对客观知识的无序化状态实施一系列有序化组织活动; 知识的结构为一种网状结构,由众多知识因子的节点和知识关联的节点联系两要素构成,知识因子为元知识,表达元知识之间关联关系的结构成为知识链,元知识是组成知识网络的最基本单位,每个单独存在的元知识通过知识链关联,不断将元知识间的关联表达出来; 主体循序渐进发现元知识及关联关系,根据具体的客观环境进行知识组织,将发现的元知识通过知识表达、知识重组、知识存检、知识聚类、知识布局、知识编辑和知识监控方法,最终提高知识的有序化程度; 用户知识层级表达:互联网用户的知识层面呈现为网状结构,同时在网状结构中也具有明确的层级关系,采用有向连通图的方式表示这个网状结构,根据不同的方面划分为许多不同的领域,设置一个超根root根节点,将不同的领域连接起来,这些领域的节点从超根发散出来,在这些不同的领域下面,细分子领域,只拓展到子领域下一层节点,在第四层的词则同样会同时隶属于不同的子领域之内,构成一个由超跟-领域-子领域-词构成的四层的有向连通图表示用户的知识层级结构; 在这个层级结构里,用户所涵盖的知识领域越趋向于这个知识层级图的底层,这个用户在这个领域越趋近于专家级别,通过这个方式表示出一个用户的知识深度; 用户描摹模型:互联网平台用户解析是对互联网用户的上网和使用移动APP所产生的文本痕迹进行深度数据挖掘,获得对用户的客观个性化了解,通过解析得到的数据针对性的进行数据和应用推送、知识传播、网络营销,采用新浪微博的移动APP产生的文本数据作为数据集来进行解析; 用户描述归纳为用户客观描述和用户主观描述两个类别,用户客观性描述包括用户的性别、年龄、身高、籍贯、学历、婚姻状况客观实在的描述,用户主观性描述包括用户兴趣、已有知识分布、行为模式的内在表达,其中深度挖掘用户兴趣和用户知识两个领域,用户同时对应用户兴趣向量和已有知识向量,且这两个向量对应的属性维相同,每一个属性维表示同一事件类或话题,用户兴趣向量和已有知识向量中每一维对应的值表示用户对于该维所表示的事件类或话题的兴趣度和理解深度; 以词袋的方式表示文本生成,主题或话题有一定的概率分布,在此基础上,通过概率模型重现文本的生成方法,然后结合参数估计获取主题,当指定主题个数为一个值M时,经过主题模型的不断监督或无监督训练学习,得到M个主题,结合互联网用户平台的特点,采用以话题模型为基础进行整个模型的构建; 互联网用户兴趣描摹架构: 层级一,对于每一个用户v,对应多个主题和兴趣,生成主题分布x,用户-兴趣分布j; 层级二,对于每一条微博q,对应一个主题兴趣度量方面,将生成兴趣-微博分布ej; 层级三,对于每一个词k,它对应主题会生成主题-词分布s; 互联网用户的兴趣描摹概率图模型的生成过程为: 第一,采样分布:Gv,x-Dirichlet(B),Fv,j-Dirichlet(E); 第二,对于每一个用户v=1,2,...,V, 采样分布:Hv-DirichletAv,H-Binomialπ; 采样分布:jv-DirichletFv; 第三,对于每一条微博q=1,2,...,Q, 采样主题:x-MultinomialHv; 第四,对于每一个词k=1,2,...,K, 采样词:kn,m-MultinomialGv,x; 用户兴趣描摹模型参数说明:Av,B,E为超参数和Dirichlet先验分布;π为超参数和Binomial先验分布;H为|V|*|X|维矩阵,表示用户-话题分布;G为|V|*|X|*|K|维矩阵,表示用户-话题-词分布;F为|V|*|X|*|J|维矩阵,表示用户-话题-兴趣分布;v,j,x,k为变量实例:用户v,用户兴趣j,话题x,词k;V,J,X,K分别表示用户集合,兴趣集合,话题集合,词集合; 互联网用户知识描摹架构: 第一层次,对于每个用户v,对应多个主题和相关的已有知识,生成主题分布x,用户-知识分布w; 第二层次,对于每条微博q,对应一个主题已有知识程度量方面,生成知识-微博分布ew; 第三层次,对于每个词k,对应多个主题和事件类,生成主题词分布s; 互联网用户知识描摹解析概率模型的生成过程为: 步骤一,采样分布:Gv,x-Dirichlet(B),Lv,w-Dirichlet(T),Rv,w-Dirichlet(S); 步骤二,对于每一个用户v=1,2,...,V, 采样分布:Hv-DirichletAv,H-Binomialπ; 采样分布:jv-DirichletRv; 步骤三,对于每一条微博q=1,2,...,Q, 采样主题:x-MultinomialHv; 采样微博描述话题的深度类型z-Multinomialwv; 步骤四,对于每一个词k=1,2,...,K, 采样词:kn,m-MultinomialGv,x 用户知识描摹模型参数说明:Av,B,T,S为超参数和Dirichlet先验分布;π为超参数和Binomial先验分布;H为|V|*|X|维矩阵,表示用户-话题分布;G为|V|*|X|*|K|维矩阵,表示用户-话题-词分布;R为|V|*|X|*|J|维矩阵,表示用户-话题-知识分布;L为|V|*|W|*|Z|维矩阵,表示用户-知识-层级分布;v,x,w,z,k为变量实例:用户v,话题x,已有知识w,知识层次z,词k;V,X,W,Z,K分别表示用户集合,话题集合,知识集合,层级集合,词集合; 用户知识深度层级描摹改进:用户个性化描摹模型对常见事件进行分类,并且对用户感兴趣的日常生活话题进行总结,将用户描摹的领域分为事件分类和话题集合,表示为特征集:{{事件类集}n1,{话题集}n2}其中,n1+n2=n,对一个具体的用户,用户兴趣和已有知识均对应为以特征集为特征维的n维向量,特征集体现互联网用户群体的一般性,具体的特征向量反映互联网用户个体的特殊性; 用户已有知识的解析,结合用户自我标签性描述与先验知识和用户对事件或话题观点和评述性内容描述的深度解析进一步判断,具体观点和评述深度根据用户发布文本中有关话题和事件的内容深度进行判断,对事件描述词和术语进行层级分类;采用概率图模型对用户兴趣和用户已有知识进行解析,主题模型中加入一个二项分布的变量π对二者进行区分;其次,对用户文本中所使用领域词在知识领域树中的层级对于事件解析深度进行区分,以助于对用户已有知识的研究,将领域词对于事件或主题的深度划分为五层,引入多项分布变量z用于标识主题-词深度层级分布和事件类-词深度层级分布; 互联网用户知识与兴趣个性化描摹模型的用户解析有如下三个层级: 第一层级,对于每个用户v,对应多个主题的兴趣和已有知识,生成主题分布x,用户-兴趣分布j和用户-知识分布w; 第二层级,对于每条微博q,对应一个主题的兴趣度量和已有知识程度量两方面,生成兴趣-微博分布ej,知识-微博分布ew; 第三层级,对于每个词k,对应多个主题,生成主题-词分布s; 互联网用户的知识与兴趣个性化描摹解析概率模型的生成过程为: 过程一,采样分布:Gv,x-Dirichlet(B),Lv,w-Dirichlet(T),Fv,j-Dirichlet(E), Rv,w-Dirichlet(S); 过程二,对于每一个用户v=1,2,...,V, 采样分布:Hv-DirichletAv,H-Binomialπ; 采样分布:jv-DirichletFv; 采样分布:wv-DirichletRv; 过程三,对于每一条微博q=1,2,...,Q, 采样主题:x-MultinomialHv; 采样微博描述话题的深度类型z-Multinomialwv; 过程四,对于每一个词k=1,2,...,K, 采样词:kn,m-MultinomialGv,x; 用户知识与兴趣描摹模型参数说明:Av,B,T,E,S为超参数和Dirichlet先验分布;π为超参数和Binomial先验分布;H为|V|*|X|维矩阵,表示用户-话题分布;G为|V|*|X|*|K|维矩阵,表示用户-话题-词分布;R为|V|*|X|*|W|维矩阵,表示用户-话题-知识分布;F为|V|*|X|*|J|维矩阵,表示用户-话题-兴趣分布;L为|V|*|W|*|Z|维矩阵,表示用户-知识-层级分布;v,j,x,w,z,k为变量实例:用户v,用户兴趣j,话题x,已有知识w,知识层次z,词k;V,J,X,W,Z,K分别表示用户集合,兴趣集合,话题集合,知识集合,层级集合,词集合; 知识与兴趣计算描摹模型:模型中输入的分析数据是用户的微博数据,同时每个用户都对应着该用户本身的微博文本集,将M个用户的微博文本作为模型的输入数据集,结果有两部分,一部分是用户兴趣,另一部分是用户知识,用户兴趣方面,模型得出用户的每个微博文本和兴趣的向量矩阵,计算出每个用户对于每个兴趣领域的权重,计算式为: 式中,xv,j表示用户v对第j个兴趣的权重,N表示文本集中用户v的微博文本集数量,kv,w,j表示用户v的第w个微博文本中对第j个兴趣的权重,对于N个用户,计算得到其相应的兴趣权重,每一个用户的兴趣向量表示为{xv,1,xv,2,xv,3,…,xv,j,…}; 用户知识方面,将用户的所有微博经过模型划分为四类:超根、超话题、子话题、词,超根表示所有超话题的根,超话题包括用户的兴趣层面领域,子话题是连接超话题和词之间的纽带,是超话题细分下的结果,最底层的词是用户微博中分词出来的,模型中设定超话题个数为1,子话题个数为10,每一个子话题下词汇个数为5,这一个层次数最底层有50个词,用户知识层次图在所有数据集的基础上产生,不针对具体的用户,在得到用户的兴趣分布基础上,将用户的微博中的词与知识层次分布结合,得到用户知识程度刻画,用户v对某一特定兴趣领域下的知识深度,具体通过下式计算: depwv表示的是用户v的知识深度,Z表示的是知识层次的深度,根据以上模型,Z=4;weightj表示的是第j层的节点的权重,给权重赋值为:weightj=ej−1;N表示用户所有微博的个数;fj表示的是第j层的词或者话题有出现在用户v的微博文本集当中的个数,对于重复出现的词或话题也只算作一次;showj,i表示层次结构中第j层的词或话题是否出现在用户v的微博文本集中,如果出现值为1,未出现值为0。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人荆门汇易佳信息科技有限公司,其通讯地址为:448000 湖北省荆门市高新区龙井大道238号(九派通创业园);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。