广东工业大学;广州凡沙智能科技有限公司肖红获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东工业大学;广州凡沙智能科技有限公司申请的专利一种基于扩张卷积的主题感知抽取式文本摘要生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116860961B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310845489.1,技术领域涉及:G06F16/34;该发明授权一种基于扩张卷积的主题感知抽取式文本摘要生成方法及系统是由肖红;李泽霖;姜文超;黄子豪设计研发完成,并于2023-07-10向国家知识产权局提交的专利申请。
本一种基于扩张卷积的主题感知抽取式文本摘要生成方法及系统在说明书摘要公布了:本发明涉及自然语言处理技术领域,提出一种基于扩张卷积的主题感知抽取式文本摘要生成方法,包括以下步骤:S1:获取文档D中的文本数据进行预处理,得到文本编码x;S2:把所述文本编码x输入扩张卷积主题抽取模型中,获得主题分布θt以及候选句集C;S3:将所述候选句集C输入BERT模型,对所述候选句集C中的句子进行编码,获得包含语义特征的句子级向量;S4:将所述句子级向量输入到融合有所述主题分布θt的文档级解码器,获得包含隐藏状态的候选句子si;S5:对所述候选句子si进行评分,根据分值对句子进行降序排序,选择前S个句子用于生成摘要。
本发明授权一种基于扩张卷积的主题感知抽取式文本摘要生成方法及系统在权利要求书中公布了:1.一种基于扩张卷积的主题感知抽取式文本摘要生成方法,其特征在于,包括以下步骤: S1:获取文档D中的文本数据进行预处理,得到文本编码x; S2:把所述文本编码x输入扩张卷积主题抽取模型中,获得主题分布以及候选句集C; S3:将所述候选句集C输入BERT模型,对所述候选句集C中的句子进行编码,获得包含语义特征的句子级向量; S4:将所述句子级向量输入到融合有所述主题分布的文档级解码器,获得包含隐藏状态的候选句子; S5:对所述候选句子进行评分,根据分值对句子进行降序排序,选择前S个句子用于生成摘要; 所述扩张卷积主题抽取模型包括基于扩张卷积的半监督变分自动编码器结构;所述半监督变分自动编码器结构中的编码器包括长短期记忆人工神经网络编码器,所述半监督变分自动编码器结构中的解码器包括扩张的卷积神经网络解码器; 所述扩张的卷积神经网络解码器中包括残差连接的三个卷积层,在残差连接时,使用ReLU作为激活函数,所述卷积层中的滤波器大小分别为1×1、1×n、1×1; 所述S2步骤包括: S2.1:将所述文本编码x输入所述扩张卷积主题抽取模型中的编码器,从标准多元高斯先验分布中采样,获得后验分布的均值和方差,以及潜在向量z: 其中,是从标准正态分布N0,1中采样得到的参数; S2.2:将所述潜在向量z输入所述扩张卷积主题抽取模型中的解码器,从条件概率分布|z中采样,获得重构文本编码; S2.3:利用文本编码x和重构文本编码确定训练损失,并通过优化所述训练损失对所述扩张卷积主题抽取模型中的编码器和解码器的参数进行更新,获得更新后的潜在向量;其中,所述训练损失的表达式包括: 式中,表示重建误差,表示KL散度; S2.4:对所述潜在向量进行MLP转换,获得主题分布: 式中,表示MLP转换矩阵;分别表示1~t个主题; S2.5:对主题分布进行归一化处理,获得每个主题对应的主题权重w: ; S2.6:对文档D中的句子的主题权重w进行加权计算,根据加权后的权重值对所述文档D中的句子进行降序排序,选择前n个句子作为候选句集C;其中n为正整数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东工业大学;广州凡沙智能科技有限公司,其通讯地址为:510080 广东省广州市越秀区东风东路729号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励