北京交通大学冀振燕获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京交通大学申请的专利基于不确定性感知异质图注意力网络的短文本分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115292483B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210288840.7,技术领域涉及:G06F16/35;该发明授权基于不确定性感知异质图注意力网络的短文本分类方法是由冀振燕;孔德焱;杨燕燕;吴睿智;韩梦豪设计研发完成,并于2022-03-23向国家知识产权局提交的专利申请。
本基于不确定性感知异质图注意力网络的短文本分类方法在说明书摘要公布了:本发明公开一种基于不确定性感知异质图注意力网络的短文本分类方法。该方法包括:获取有标签数据集和无标签数据集,其中有标签数据的数量少于无标签数据;基于所述有标签数据集训练异质图注意力网络模型;利用经训练的异质图注意力网络模型对所述无标签数据集进行预测,并计算预测结果的不确定性值;利用预测值和所述不确定性值同时作为置信度,对所述无标签数据集打伪标签,并选择出正负样本伪标签;混合所选择的伪标签数据和所述有标签数据集,获得混合数据集,利用该混合数据集对所述异质图注意力网络模型进一步训练;重复上述步骤,直到满足设定的终止条件。本发明能够在低数据源的情况下,准确对常见的短文本进行分类。
本发明授权基于不确定性感知异质图注意力网络的短文本分类方法在权利要求书中公布了:1.一种基于不确定性感知异质图注意力网络的短文本分类方法,包括以下步骤: 步骤S1,获取有标签数据集和无标签数据集,其中有标签数据的数量少于无标签数据,所述有标签数据集反映短文本数据与标签类型之间的对应关系; 步骤S2,基于所述有标签数据集训练异质图注意力网络模型; 步骤S3,利用经训练的异质图注意力网络模型对所述无标签数据集进行预测,并计算预测结果的不确定性值; 步骤S4,利用预测值和所述不确定性值同时作为置信度,对所述无标签数据集打伪标签,并选择出正负样本伪标签; 步骤S5,混合所选择的伪标签数据和所述有标签数据集,获得混合数据集,利用该混合数据集对所述异质图注意力网络模型进一步训练和优化; 步骤S6,重复步骤S3至步骤S5,直到满足设定的终止条件; 其中,所述异质图注意力网络模型包括异质图注意力网络,双层注意力机制模块和伪标签选择器,所述异质图注意力网络利用知识图谱和无标签数据,实现信息沿图的传播,以捕获相邻节点之间的关系;所述双层注意力机制模块用于提取邻居节点的重要特征信息并赋予不同类型节点不同的权值;所述伪标签选择器利用所述预测值和所述不确定性值对无标签数据选择出高准确率且高稳定性的正负样本进行打伪标签,以在训练迭代过程中扩展训练集,进而不断迭代训练和优化所述异质图注意力网络模型; 其中,利用异质信息网络结构对短文本、主题信息和知识图谱中的实体知识进行建模,获得异质图网络节点向量表示作为所述异质图注意力网络模型的输入; 其中,所述异质图注意力网络模型以所述异质信息网络结构作为输入,并将不同类型信息投射到一个隐式公共空间中,实现异质图卷积神经网络,并引入双层注意力机制用于提取邻居节点的重要特征信息并赋予不同类型节点不同的权值; 其中,所述异质信息网络结构设置为集成多种附加信息,并捕获短文本和附加信息之间的关系; 其中,所述附加信息包括主题信息、实体信息和短文本信息,其中主题信息是通过隐含狄利克雷分布聚类方法挖掘短文本潜在的主题信息;实体信息是从领域知识图谱中或维基百科中获取向量表示;短文本信息是利用预训练语言模型对其进行向量表示,以从短文本数据中提取语言特征; 其中,所述不确定性值是所述异质图注意力网络模型的训练过程中,针对同一输入,多次使用丢弃率进行预测,并并行将多次预测值进行平均和统计方差的操作,进而得到该输入的不确定性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京交通大学,其通讯地址为:100044 北京市海淀区西直门外上园村3号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励