首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于句法结构删减的自动文摘事实性增强方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京邮电大学

摘要:本发明是一种基于句法结构删减的自动文摘事实性增强方法,涉及大数据资源服务、数据挖掘技术。本发明方法包括:分析待纠错摘要文本语法结构获取对应的语法依存树;后序遍历语法依存树,根据语法依存关系尝试剪枝子树,获得候选摘要,并在按序访问下一子树前先将被剪枝子树还原;预先在服务器部署多个事实评价指标模型;实时调用服务器上多个事实评价指标模型,对每个候选摘要进行事实性评价,优选当后一摘要在所有事实评价指标上都优于前一摘要时,认为后一摘要更优,输出最佳摘要。本发明首次将语法结构删减应用于后纠错方案,极大地扩充了可以应对的错误范围,提高了自动文摘模型生成摘要的事实准确性,能广泛地作用于已有的自动文摘模型中。

主权项:1.一种基于句法结构删减的自动文摘事实性增强方法,其特征在于,包括如下步骤:步骤1:将待纠错摘要文本输入语法依存树构建模块,语法依存树构建模块输出所述摘要文本对应的语法依存树,语法依存树中记录单词之间的语法依存关系;步骤2:剪枝模块对语法依存树进行剪枝操作,获得候选摘要集;预先将语法依存关系分类,分为三类:第一类语法依存关系所引导的子树能直接删减;第二类语法依存关系所引导的子树能删减,但要核查删减后的文本语法准确性,若语法出现错误则不能删减子树;第三类语法依存关系所引导的子树不能删减;剪枝模块对语法依存树进行后序遍历,依次访问每个子树,判断引导子树的节点与该节点的父节点间的语法依存关系类型,对于属于第一类和第二类的语法依存关系,则尝试剪枝该节点引导的子树,若能删减子树,生成一个删减子树后的候选摘要;在后续遍历过程中,先将被剪枝的子树还原,然后继续按序访问下一个子树,尝试剪枝子树,生成候选摘要;在对语法依存树遍历完成后,获得一个候选摘要集;步骤3:预先在服务器部署多个事实评价指标模型;将每个事实评价指标模型的实现进行封装并统一调用形式,部署在服务器并开放调用接口;步骤4:最佳摘要输出模块实时调用服务器上多个事实评价指标模型,对候选摘要集中的每个候选摘要及原始摘要进行事实性评价,根据评价结果输出最佳摘要。

全文数据:

权利要求:

百度查询: 北京邮电大学 一种基于句法结构删减的自动文摘事实性增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。