恭喜电子科技大学陈思芹获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜电子科技大学申请的专利一种基于Text-to-SQL的表格开放域问答方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115563248B 。
龙图腾网通过国家知识产权局官网在2025-05-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211226678.2,技术领域涉及:G06F16/334;该发明授权一种基于Text-to-SQL的表格开放域问答方法是由陈思芹;吴洁;张廷意;侯磊;石微微;侯孟书设计研发完成,并于2022-10-09向国家知识产权局提交的专利申请。
本一种基于Text-to-SQL的表格开放域问答方法在说明书摘要公布了:本发明属于自然语言处理和问答任务领域,涉及一种基于Text‑to‑SQL的表格开放域问答方法。首先使用检索器从表格语料库中初步筛选相关的表格得到表格池,然后按相似性分数排序得到前top‑k表格作为后续的输入;在提取回答时使用深度学习的Text‑to‑SQL模型,结合问句和表格模式信息将问句转换为SQL等的标准化的逻辑形式,在表格上执行SQL并判断执行结果是否发生错误;并以此结果作为相关性依据之一回溯至表格重排序,融入新一轮相似性计算中。本发明利用了Text‑to‑SQL模型的执行结果作为表格检索的相似性排序依据,使得所检索的表格更为准确,进而提升了整个开放域问答的结果准确性。
本发明授权一种基于Text-to-SQL的表格开放域问答方法在权利要求书中公布了:1.一种基于Text-to-SQL的表格开放域问答方法,其特征在于,包括:表格检索阶段和提取回答阶段;所述表格检索阶段基于输入的问句和给定的表格语料库,包括三个子阶段:a1、表格预处理:将表格语料库进行格式转换,使得SQL语句可以在任一表格上执行;将表格按行平铺展开,形成文本形式的表格内容;a2、初检索阶段:利用检索器计算出表格语料库中各表格原始相似度;按照原始相似度由大到小的损失进行排序,选择前N个表格构成表格池;a3、重排序阶段:从表格池中选择出前top-k个表格;所述提取回答阶段输入为表格检索阶段所得前top-k个表格,过程分为两个子阶段:b1、语义解析阶段:对各表格,将问句和表格模式信息输入Text-to-SQL深度学习模型,得到对应的SQL语句;b2、执行阶段:在表格上执行得到的SQL语义,得到候选答案;答案是表格的单个单元格的内容、一组单元格的内容或者一组单元格的聚合结果中的一种;其中的重排序阶段,即从表格池中选择出前top-k个表格的方法,依赖于后续提取回答阶段的执行情况,具体方法为:设置执行引导回溯的最大限制次数为X,初始回溯次数为x=0;K为预先设置的值,K=N,初始令k=K;在初始情况下,直接使用表格池中原始相似度最高的前top-k个表格进入答案提取阶段,之后,每当执行步骤b2后,进行以下条件判断:如果回溯次数x=X,则停止回溯,以没有发生执行错误且相似度排名最高的表格所对应的候选答案作为最终答案;如果回溯次数xX,则对各表判断是否发生执行错误,如果没有发生执行错误,则令resEG=1,如果发生执行错误,则令resEG=0;回溯到表格检索的重排序阶段,计算新的相似性得分:simwithEG=1-α·simoriginmaxsimorigin+α·resEG其中simorigin是检索阶段的原始相似性得分,maxsimorigin是检索阶段所有表格的最大的原始相似性得分,simwithEG是新的相似性得分;将表格池中的N个表格按新的相似性得分simwithEG从大到小重新排序得到新的相似性得分最高的top-k个表格;采用递减或折半方式更新k值,回溯次数x增加1,选择新的相似性得分最高的top-k个表格再次进入提取回答阶段。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新西区西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。