Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国人民解放军军事科学院系统工程研究院焦逊获国家专利权

中国人民解放军军事科学院系统工程研究院焦逊获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国人民解放军军事科学院系统工程研究院申请的专利一种异构BERT和半监督SVM模型的情报标签提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119829763B

龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411829368.9,技术领域涉及:G06F16/35;该发明授权一种异构BERT和半监督SVM模型的情报标签提取方法是由焦逊;廖东升;孔维思;姚赞;张华淇设计研发完成,并于2024-12-12向国家知识产权局提交的专利申请。

一种异构BERT和半监督SVM模型的情报标签提取方法在说明书摘要公布了:本发明公开了一种异构BERT和半监督SVM模型的情报标签提取方法,包括:获取原始非结构化情报文本数据集,并对其进行文本预处理和数据增强操作;基于BTM短文本和LDA长文本主题模型对情报文本进行主题词的提取,得到情报文本的主题词向量;基于Doc2Vec模型对情报文档进行句向量表示;将主题词向量和句向量输入BERT模型中进行预训练,以获得带有主题信息的特征向量;使用少量有标签数据和大量无标签数据对半监督SVM模型进行训练调参;将带有主题信息的特征向量输入半监督SVM二分类算法模型中进行训练,得到数据标签的提取结果。本发明能够有效地提取出情报文本的数据标签,充分利用无标签数据信息,提高数据标签提取系统的准确性和泛化能力。

本发明授权一种异构BERT和半监督SVM模型的情报标签提取方法在权利要求书中公布了:1.一种异构BERT和半监督SVM模型的情报标签提取方法,其特征在于,包括以下步骤: 步骤S101:获取原始非结构化情报文本数据集,对其进行数据清洗、文本分词、去除停用词的数据预处理操作,得到预处理情报文本数据集,之后通过同义词替换、随机插入、随机交换、随机删除、反译的方式进行数据增强,得到增强情报文本数据集; 步骤S102:对情报文本进行词袋模型编码得到主题词编码向量,输入到BTM短文本主题提取模型和LDA长文本主题提取模型中,使用吉布斯采样法获得每条情报的主题分布概率和每个主题词分布概率;所有主题词分布概率组成主题词分布矩阵,对主题词分布矩阵设置合适的阈值,筛选出超过阈值的词作为初选主题词; 步骤S103:将情报文本输入到Doc2Vec模型中,采用PV-DM技术将上下文单词和句向量作为输入,使用神经网络训练预测目标单词,捕捉情报文本的语义信息,获得文本的句向量表示形式; 步骤S104:将步骤S102中经过主题提取模型得到的初选主题词的编码向量与步骤S103中经过Doc2Vec模型得到的句向量进行拼接,得到合并向量其中dk为向量的特征维度,m为初选主题词编码向量的长度,n为句向量编码长度,合并向量输入到BERT模型中进行掩码语言建模预训练,得到包含情报主题信息的主题词特征向量 步骤S105:将步骤104得到的主题词特征向量输入到半监督SVM模型,基于人工交互的方法进行半监督训练; 步骤S106:以步骤S104中得到的包含情报主题信息的主题词特征向量作为输入,输入到步骤S105中训练完成的半监督SVM模型中,利用二分类算法进行概率预测,得到标签提取结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军军事科学院系统工程研究院,其通讯地址为:100141 北京市丰台区大成路13号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。