北京长河数智科技有限责任公司;长河信息股份有限公司张煇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京长河数智科技有限责任公司;长河信息股份有限公司申请的专利一种基于事件标签的文本分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118733777B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410903529.8,技术领域涉及:G06F16/35;该发明授权一种基于事件标签的文本分类方法是由张煇;杨勇;刘俊龙;李龙设计研发完成,并于2024-07-08向国家知识产权局提交的专利申请。
本一种基于事件标签的文本分类方法在说明书摘要公布了:本申请公开了一种基于事件标签的文本分类方法,涉及计算机技术领域,包括:获取文本,并进行预处理;利用预训练的回环神经网络XLNet,将预处理后的文本转换为词向量序列;将词向量序列输入预训练的Transformer编码器,输出表示文本语义的文本向量编码;根据文本分类任务,构建表示文本类别的事件标签集;将标签集作为输入,利用预训练的图神经网络,获取标签之间的层级关系,输出表示标签语义的标签向量;通过动态协作过滤的注意力机制,将文本向量编码和标签向量进行融合,得到融合特征;利用融合特征作为输入,训练文本分类的神经网络模型;利用训练后的文本分类的神经网络模型进行文本分类。针对现有技术中文本分类精度低,本申请提高了文本分类精度。
本发明授权一种基于事件标签的文本分类方法在权利要求书中公布了:1.一种基于事件标签的文本分类方法,包括: 获取文本,并对获取的文本进行分词和去停用词的预处理,得到预处理后的文本; 利用预训练的回环神经网络XLNet,将预处理后的文本转换为词向量序列; 将得到的词向量序列输入预训练的Transformer编码器,输出表示文本语义的文本向量编码; 根据文本分类任务,构建表示文本类别的事件标签集; 将事件标签集作为输入,利用预训练的图神经网络,获取标签之间的层级关系,输出表示标签语义的标签向量,包括:将文本分类任务中的事件标签作为节点,事件标签之间的语义关系作为边,构建标签图;根据标签图,通过图注意力网络AgGNN进行节点分类和负采样,获取事件标签之间的层级关系;对事件标签集中的每个标签,在AgGNN中,以标签为中心节点,通过注意力机制聚合与中心节点具有层级关系的邻近节点,作为对应节点的标签向量; 通过注意力机制,将文本向量编码和标签向量进行融合,得到融合特征,包括:将文本向量编码输入文本通道的多头自注意力层,通过线性变换和拼接将文本向量编码映射到多个子空间,获得多头文本注意力向量;将标签向量输入AgGNN的图注意力层,通过线性变换和拼接将标签向量映射到多个子空间,获得多头标签注意力向量;采用co-attention机制,将多头文本注意力向量和多头标签注意力向量进行交互,通过查询向量和键值向量计算标签到文本和文本到标签的注意力分数矩阵;将注意力分数矩阵应用于多头文本注意力向量和多头标签注意力向量,通过加权求和得到交互后的文本向量和标签向量;将交互后的文本向量和标签向量拼接,作为融合特征; 利用融合特征作为输入,训练文本分类的神经网络模型; 利用训练后的文本分类的神经网络模型对预处理后的文本进行分类,得到文本分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京长河数智科技有限责任公司;长河信息股份有限公司,其通讯地址为:100071 北京市丰台区汽车博物馆西路8号院3号楼7层705;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。