Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜东北电力大学鲍松彬获国家专利权

恭喜东北电力大学鲍松彬获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜东北电力大学申请的专利融合关联信息的程式语识别系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114330338B

龙图腾网通过国家知识产权局官网在2025-05-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210037262.X,技术领域涉及:G06F40/289;该发明授权融合关联信息的程式语识别系统及方法是由鲍松彬;郑育杰;王敬东;孟凡奇设计研发完成,并于2022-01-13向国家知识产权局提交的专利申请。

融合关联信息的程式语识别系统及方法在说明书摘要公布了:本发明公开了融合关联信息的程式语识别系统及方法,其中的系统包括:基本特征提取模块,用于使用Torch中的embedding层生成词嵌入向量作为词性特征、GloVe词向量技术训练的特征向量作为语义特征,经过晚融合的词性特征和语义特征作为该模型的基本特征;关联信息提取模块,用于采用单词间的互信息和句子的依存句法关系作为识别程式语的关联信息;标签表示模块,用于表示标签。本发明通过词嵌入技术来表示特征向量,并融合了能够代表程式语特征的关联信息,使用图卷积神经网络获取更深层次的语义特征,最后考虑到标签之间含有依存关系,使用条件随机场模型进行标签解码,达到识别程式语的目的。

本发明授权融合关联信息的程式语识别系统及方法在权利要求书中公布了:1.融合关联信息的程式语识别方法,其特征在于,包括:基本特征提取方法;关联信息提取方法;标签表示方法;所述基本特征提取方法包括:特征选择;基于Bi-LSTM的特征表示;词性特征和语义特征的晚融合;所述特征选择包括使用Torch中的embedding层生成词嵌入向量作为词性特征、使用GloVe训练的特征向量来表示程式语的语义特征:根据语料库构建一个共现矩阵X,矩阵中的每一个元素Xij代表单词i和上下文单词j在特定大小的上下文窗口内共同出现的次数;构建词向量和共现矩阵之间的近似关系,关系如下公式所示: 其中,上式的wi和wj是我们最终要求解的词向量;而bi和bj则是两个词向量的bias项;构造损失函数,如式所示: 其中,fXij为权重函数,它的计算公式如下公式所示: 其中,x表示共现次数,而xmax表示最大共现次数;所述基于Bi-LSTM的特征表示包括:设句子si=[x1,x2,...,xt,...,xn],将其输入到Bi-LSTM网络中,得到句子si的隐藏层的表示{h1,h2,...,ht,...hn};每个单元根据前一个隐藏向量ht-1和当前输入向量xt的计算,得到当前隐藏向量ht,其操作定义如下:it=σWxixt+Whiht-1+Wcict-1+bift=σWxfxt+Whfht-1+Wcfct-1+bfct=ftct-1+ittanhWxcxt+Whcht-1+bcot=σWx0xt+Whoht-1+Wcoct+boht=ottanhct式中:it,ft,ct,ot,ht分别为记忆门、隐藏层、遗忘门、细胞核和输出门在输入第t个文本时的状态;W为模型的参数;b为偏置向量;σ为Sigmoid函数;tanh为双曲正切函数;所述词性特征和语义特征的晚融合包括:首先把词性特征和语义特征分别输入到Bi-LSTM中,再将两个模型的结果进行拼接形成基本特征向量;所述关联信息提取方法包括:1基于互信息的关联信息:两个离散随机变量X和Y的互信息的定义为: 其中px,y是X和Y的联合概率分布函数,px和py分别是X和Y的边缘概率分布函数;如果要衡量某个数据集中任意两个单词x,y的关联程度,这样计算:其中,px,py为x,y在数据集中独立出现的概率,直接统计词频后除以总的词数就得到;px,y为x,y同时出现在数据集中的概率,直接统计二者同时出现的次数,再除以所有无序对的个数即可;2基于依存句法分析的关联信息:依存句法揭示了句子中词与词之间的依存关系以及搭配关系,其中一个依存关系连接两个词,一个是核心词,一个是修饰词,这样的关系与句子的语义关系是相互关联的;3基于图卷积神经网络的特征表示:通过MI和依存句法分析将单词间的关系用图来表示,所以采用图卷积神经网络来处理关联信息;给定一个图G=V,E,V是包含N个节点的顶点集,E是包括自循环边的边集,图GV,E的特征信息可由拉普拉斯矩阵L表示,如下公式所示:L=D-A或者使用对称归一化后的拉普拉斯矩阵:Lsys=IN-D-12AD-12式中:A为图的邻接矩阵;IN为N阶单位矩阵;D=diagd为顶点的度矩阵; 基于图的傅里叶变换,图卷积公式表示为:g*x=U[UTg·UTx]式中:x为节点的基本特征向量;g为卷积核;U为拉普拉斯矩阵L的特征向量矩阵;采用Chebyshev多项式简化图卷积公式,最终图卷积分层传播公式可表示为: 式中:σ为激活函数;W为需要训练的权重矩阵;所述标签表示方法包括:在CRF中,每个句子X={x1,x2,…,xn}都有一个待选标签序列集合,通过计算集合中每个标签序列Y={y1,y2,…,yn}的得分来决定最终的标注序列,计算得分过程如式所示: 其中,P∈Rn×k是一个得分矩阵,k为所有标签数量;A∈Rk+2×k+2是一个包含了句子开始与结束标签的转移矩阵;将每个标签序列的分数进行归一化得到概率,其中概率最大的标签序列即为该句子的最终序列,归一化过程如式所示:

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北电力大学,其通讯地址为:132012 吉林省吉林市长春路169号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。