Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜东南大学杨鹏获国家专利权

恭喜东南大学杨鹏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜东南大学申请的专利一种融合句法结构信息的关键词生成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114692605B

龙图腾网通过国家知识产权局官网在2025-05-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210415569.9,技术领域涉及:G06F40/284;该发明授权一种融合句法结构信息的关键词生成方法及装置是由杨鹏;戈妍妍;方海生;于晓潭设计研发完成,并于2022-04-20向国家知识产权局提交的专利申请。

一种融合句法结构信息的关键词生成方法及装置在说明书摘要公布了:本发明公开了一种融合句法结构信息的关键词生成方法及装置,能够为新闻文章自动地生成关键词。本发明首先使用爬虫工具采集新闻文章,并采取人工标注参考关键词构造出新闻文章数据集;然后对文本进行预处理,依存句法分析和过滤停用词;接着基于循环神经网络的顺序编码器和基于图卷积网络的图编码器分别获取文章的上下文语义和结构特征,并利用聚类方法将文本分为包含不同子主题部分,并利用多个基于注意力机制的解码器并行生成关键词;采样交叉熵损失进行模型参数优化;最后基于训练后的模型对待处理的新闻文章进行自动关键词生成。本发明通过句法结构信息弥补顺序编码存在的长距离单词依赖信息损失问题,从而提高生成关键词的质量。

本发明授权一种融合句法结构信息的关键词生成方法及装置在权利要求书中公布了:1.一种融合句法结构信息的关键词生成方法,其特征在于,包括如下步骤:步骤1:新闻文章采集通过爬虫工具收集多个媒体平台的新闻文章,积累样本数据集,然后对样本数据集进行过滤以减少样本重复率;对样本集中每一个样本采用人工标注构造训练样例:新闻文章和标准关键词;步骤2:文本预处理对文章进行分句、分词,利用句法依存分析工具得到句法分析结果;其次根据句法分析结构构造句法图,将文本单词映射为图中节点,单词之间的关系通过边体现;步骤3:训练基于句法结构信息融合的关键词生成模型首先通过顺序编码和结构编码双编码方式学习单词表示;然后子图聚类网络根据整个文本的含义,对文本内容进行划分,从而为每个解码器构建独特的子主题表示;之后带注意力机制的顺序解码器根据生成的子主题表示生成相应的关键词;最后利用交叉熵作为损失函数对模型参数进行优化;包括如下子步骤:子步骤3-1,构建输入层;子步骤3-2,构建文本编码层;子步骤3-3,构建子图生成层,在文本图基础上,对文本图进行拆分聚类,得到多个包含文章不同方面的子图;对于每个节点,利用下式计算节点属于每个子图的概率:assigments=softmaxWaHL+ba其中,HL表示GCN最后一层的输出,Wa、ba是可学习参数,a表示计算注意力权重的网络,softmax是归一化函数;之后,对节点表示加权求和可获得子图的表示: 子步骤3-4,构建关键词解码层;子步骤3-5,构建损失函数层;子步骤3-6,训练所述模型;步骤4:对待处理的新闻文章生成关键词对于需预测关键词的新闻文章,首先用句法依存分析工具分析句法,再构建文本句法图,将新闻文章原文与句法图输入到步骤3中训练好的关键词生成模型中,生成该新闻文章的关键词。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211189 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。