恭喜北京市燃气集团有限责任公司王铁强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京市燃气集团有限责任公司申请的专利一种抽取式摘要自动生成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117216244B 。
龙图腾网通过国家知识产权局官网在2025-04-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311296990.3,技术领域涉及:G06F16/34;该发明授权一种抽取式摘要自动生成方法及装置是由王铁强;王勋;刘宗奇;杨琳琳;王倩微;蔡昊;王馨培设计研发完成,并于2023-10-09向国家知识产权局提交的专利申请。
本一种抽取式摘要自动生成方法及装置在说明书摘要公布了:本发明提供一种抽取式摘要自动生成方法及装置。所述方法包括:获取当前时刻i加入的由mi个文档组成的文档集合Di,得到文档集合流DLi;将Di的每个文档的每个句子表示成维度相等的向量,并通过对句子向量加权求和得到Di的每个文档的向量表示,进而得到Di和DLi的向量表示;基于所述向量表示对Di的每个句子的重要性打分,并基于所述打分对上一时刻的文档集合流DLi‑1的摘要进行更新,生成DLi的摘要。本发明在新增文档时,可以仅通过处理新增文档实现摘要自动更新;本发明通过将每个文档、每个文档集合和文档集合流表示成一个相同维度的向量,可以消除因文档容量不同对摘要生成造成的不良影响。
本发明授权一种抽取式摘要自动生成方法及装置在权利要求书中公布了:1.一种抽取式摘要自动生成方法,其特征在于,包括以下步骤:获取当前时刻i加入的由mi个文档组成的文档集合Di,得到文档集合流DLi={Dr},r=1,2,…,i;将Di的每个文档的每个句子表示成维度相等的向量,并通过对句子向量加权求和得到Di的每个文档的向量表示,进而得到Di和DLi的向量表示;基于Di的向量表示对Di的每个句子的重要性打分,并基于所述打分对上一时刻的文档集合流DLi-1的摘要进行更新,生成DLi的摘要;采用开源的句向量工具模型CoSENT,将Di的第j个文档表示为句向量集合所述句向量均为768维的列向量;其中,j=1,2,…,mi,k=1,2,…,mij,为中第k个句子的向量表示,mij为中句子的数量;Di中的第j个文档的向量表示为: 式中,为基于已知量和可学习参数计算得到的标量,wα、bα为可学习参数,其中,wα为768维的行向量,bα为标量;Di的向量表示方法包括:对Di中的每个文档的每个句子进行分词处理得到为第q个词,q=1,2,…,Q,Q为词的总数;计算每个词的得分: 式中,为的得分,为在Di中的出现次数,NWDi为Di中的全部词出现的次数之和,为Di中含有的文档数量;Di的向量表示为: 式中,Vi为Di的向量表示;DLi的向量表示为: 或: 式中,Ei为当前时刻i文档集合流DLi={Dr}的向量表示,其中,r=1,2,…,i,i≥2;对Di的每个句子的重要性打分的方法包括:按下式计算Di的第j个文档的第k个句子的得分: 式中,和分别为文档级重要性得分、句子级重要性得分和词级重要性得分,计算公式如下: 式中,“●”表示计算向量点积,“||”表示向量求模。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京市燃气集团有限责任公司,其通讯地址为:100035 北京市西城区西直门南小街22号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。