Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜江苏方天电力技术有限公司;东南大学龙玲莉获国家专利权

恭喜江苏方天电力技术有限公司;东南大学龙玲莉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜江苏方天电力技术有限公司;东南大学申请的专利基于多视角特征解耦的NL2SQL方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114969087B

龙图腾网通过国家知识产权局官网在2025-03-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210405166.6,技术领域涉及:G06F16/242;该发明授权基于多视角特征解耦的NL2SQL方法和装置是由龙玲莉;祝永晋;李剑;孔峥;李昆明;邵俊;陈公海;于广荣;杨勤胜;林涛;谢伟;曹卫青;张旭;周德宇设计研发完成,并于2022-04-18向国家知识产权局提交的专利申请。

基于多视角特征解耦的NL2SQL方法和装置在说明书摘要公布了:本发明公开了一种基于多视角特征解耦的NL2SQL方法及装置,所述方法具体包括以下步骤:1NL2SQL知识库构建步骤;2NL2SQL数据集构建步骤;3NL2SQL模型构建步骤,用于分别构建SQL查询语句SELECT部分、WHERE部分以及SQL整体的语义编码模型;为了有效捕捉SELECT以及WHERE各个部分的语义特征,构建多视角特征解耦的方法;4NL2SQL模型训练步骤,用于构建损失函数,构建优化函数。本发明的方法真实的NL2SQL数据集上取得了显著效果,在自动问答系统领域有很大的应用前景。

本发明授权基于多视角特征解耦的NL2SQL方法和装置在权利要求书中公布了:1.一种基于多视角特征解耦的NL2SQL方法,其特征在于,该方法包括以下步骤:S1.构建NL2SQL知识库,利用用户的查询问题,人工编写SQL查询语句,构造由查询问题、SQL查询语句以及表结构一一对应的数据条目,形成NL2SQL知识库;S2.构建NL2SQL数据集,对于每个问题,在NL2SQL知识库中每一个问题都有一个与之配对的SQL查询语句以及数据库表结构,根据NL2SQL知识库划分训练集、验证集以及测试集;S3.构建NL2SQL模型,依次构建输入层、构建SELECT部分编码模型、构建WHERE部分编码模型、构建SELECT+WHERE部分编码模型、构建不同任务多视角解耦层、构建不同子任务预测层;步骤S3中所述构建输入层具体为:输入层分别从NL2SQL数据集中获取用户问题、表结构,将其形式化为:Input:;所述输入层采用BERT的输入,由三部分组成:词嵌入TokenEmbedding、片段嵌入SegmentEmbedding、位置嵌入PositionEmbedding,将这三个向量相加即可得到句子中每个词的输入向量,将句子中每个词的输入向量组合成矩阵,就是句子的输入;BERT的输入进行若干次多头注意力机制、层归一化以及前馈网络层之后得到输出:E=BERTInput针对矩阵E定义分类概率分布Pc的计算公式:PcE=SoftmaxWtanhE W表示的是可训练的参数,tanh是机器学习中一种常见的激活函数,用softmax函数对向量中所有数值进行归一化处理,并将其转化成概率值,经过归一化处理后的数值总和为1;步骤S3中所述构建SELECT部分编码模型具体为:SELECT编码模型的优化目标只包含SELECT部分的子任务SELECT-COL以及SELECT-AGGSELECTCOUNT*SQL中SELECT部分,使用BERT进行编码的到相应的文本表示ES;根据ES预测列名SELECT-COL,取值范围为当前数据表中的所有列名,为SELECT-COL预测模块的权重,SELECT-COL预测模块的分类概率分布公式如下: 在选定使用的列名COL后,还需要预测列名对应的聚合操作SELECT-AGG,取值范围为{“NONE”,“MAX”,“MIN”,“COUNT”,“SUM”,“AVG”},为为SELECT-AGG预测模块的权重: 其中,为SELECT-AGG预测模块的概率分布;步骤S3中所述构建WHERE部分编码模型具体为:WHERE编码模型的优化目标只包含WHERE部分的子任务WHERE-COL、WHERE-NUM、WHERE-OP以及WHERE-VALUE,使用BERT进行编码的到相应的文本表示EW,根据EW预测WHERE子任务,首先预测列名COL使用的数量WHERE-NUM,为WHERE-NUM预测模块的权重,公式如下: 其中,为WHERE-NUM预测模块的分类概率分布;在预测完列名COL使用的数量之后,接下来需要预测对应数量使用的是哪些列名WHERE-COL,即需要选定使用的列名COL,取值范围为当前数据表中的所有列名,为WHERE-COL预测模块的权重,WHERE-COL预测模块的分类概率分布公式如下: 在选定使用的列名COL后,还需要预测列名对应的比较操作WHERE-OP,取值范围为{“”,“”,“=”,“!=”,“=”,“=”},假设当前选中的列名COL为数据表T中的第hi列,为WHERE-OP预测模块的权重,WHERE-OP预测模块的分类概率分布公式如下: 通过对原始的自然语言查询进行序列标注,标注中包含START和END两个特殊标签,在这两个标签之间的文本就是获取的条件值;利用这个整体特征表达,对其构建分类模型,用于判断当前文本类型的VAL值构成的候选条件是否在SQL语句中,二分类问题取值范围为{0,1},以及为分别为WHERE-VALstart预测模块和WHERE-VALend预测模块的权重, 其中,为WHERE-VALstart预测模块的概率分布,为WHERE-VALend预测模块的概率分布;所述构建SELECT+WHERE部分编码模型具体为:SELECT+WHERE编码模型的优化目标包含SELECT部分的子任务SELECT-COL以及SELECT-AGG,同时包含WHERE部分的子任务WHERE-COL、WHERE-NUM、WHERE-OP以及WHERE-VALUE,使用BERT进行编码的到相应的文本表示ESW,并对各个子任务进行分类预测;构建不同任务多视角解耦层具体为:根据获得的针对SELECT部分的文本表示ES、WHERE部分的文本表示EW、以及SELECT部分和WHERE部分的文本表示ESW,在此基础上,针对ES和EW分别使用ESW进行正交投影,得到EW1和ES1:首先,将ES投影到ESW的方向上得到ES*,具体的方法公式化为:ES*=ProjES,ESW,其中,x及v为相应特征向量;再一次求ES与ES-ES*的投影 这里就代表了消除了SELECT部分特征之后的纯化向量EW1;同理得到ES1;后期整合ES以及ES1得到ES2进行SELECT部分子任务预测,整合EW以及EW1得到EW2进行WHERE部分子任务预测,即ES2=ES+ES1EW2=EW+EW1这样就从多个视角获得了SELECT部分以及WHERE部分的语义特征向量;构建不同子任务预测层具体为:将得到的SELECT部分以及WHERE部分的语义特征向量ES2和EW2用于各个子任务的预测;S4.NL2SQL模型训练,用步骤S2得到的训练集对步骤S3构建的NL2SQL模型进行训练,从而构建损失函数,构建优化函数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏方天电力技术有限公司;东南大学,其通讯地址为:211100 江苏省南京市江宁区苏源大道58号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。