买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:桂林电子科技大学
摘要:本发明提供一种英语短文句子层次主题连贯分析方法,该方法是一个由顺序连接的英语短文句子预处理模块、英语短文层次主题树混合语义空间分析模块、英语短文句子层次主题连贯分析模块、英语短文句子层次主题连贯分析输出模块组成的分析模型。一篇英语短文通过该分析模型和分析方法处理后,最后能够得到这篇英语短文句子层次的主题连贯分析结果。本发明分析方法解决了英语短文句子层次主题连贯的自动分析问题,其分析结果比传统的英语短文句子层次主题连贯分析结果更好。
主权项:1.一种英语短文句子层次主题连贯分析方法,其特征是:包括一个由顺序连接的英语短文句子预处理模块、英语短文层次主题树混合语义空间分析模块、英语短文句子层次主题连贯分析模块、英语短文句子层次主题连贯分析输出模块组成的分析模型,其分析方法包括如下步骤:1英语短文句子预处理模块输入英语短文的题目和全文,对英语短文题目和英语短文全文分别进行分词分句、删除停用词、词干化处理;对分词分句、删除停用词、词干化处理后的英语短文的题目和全文进行词性标注、关系三元组提取;输出处理的英语短文的题目和全文的预处理结果;2英语短文层次主题树混合语义空间分析模块输入英语短文的题目和全文的预处理结果,使用构建的关系三元组层次主题树模型,对从英语短文的题目、全文、段落、句子的关系三元组信息分别进行主题聚类;将主题聚类映射到分布式语义空间中,生成英语短文的题目主题关系三元组分布式向量、全文主题关系三元组分布式向量、段落主题关系三元组分布式向量、句子主题关系三元组分布式向量;对生成的英语短文的题目主题关系三元组分布式向量、全文主题关系三元组分布式向量、段落主题关系三元组分布式向量、句子主题关系三元组分布式向量,匹配英语知识库中语义概念,抽取相邻关系三元组,并通过迭代的方法分析出最优英语短文的题目、全文、段落、句子的候选主题关系三元组集合,扩展英语短文的题目主题关系三元组分布式向量、全文主题关系三元组分布式向量、段落主题关系三元组分布式向量、句子主题关系三元组分布式向量;3英语短文句子层次主题连贯分析模块输入英语短文的题目主题关系三元组分布式向量、全文主题关系三元组分布式向量、段落主题关系三元组分布式向量、句子主题关系三元组分布式向量,分别计算英语短文中题目与句子之间的层次主题连贯语义相似度、段落与句子之间的层次主题连贯语义相似度;根据计算出的英语短文中题目与句子之间的层次主题连贯语义相似度、段落与句子之间的层次主题连贯语义相似度,设置计算英语短文中题目与句子之间的层次主题连贯语义相似度的权重值、段落与句子之间的层次主题连贯语义相似度的权重值,计算出英语短文中句子的层次主题连贯语义相似度;根据计算出的英语短文中句子的层次主题连贯语义相似度,计算英语短文层次主题连贯语义相似度评分值;计算英语短文中句子与段落的层次主题连贯值、段落与段落的层次主题连贯值、各段落与全文的层次主题连贯值;根据英语短文中句子与段落的层次主题连贯值,将各句子与段落的层次主题连贯值排序,设置层次主题连贯阈值抽取英语短文中主题不连贯句子;根据英语短文中句子与段落的层次主题连贯值、段落与段落的层次主题连贯值、段落与全文的层次主题连贯值,计算出英语短文的层次主题连贯评分均值;4英语短文句子层次主题连贯分析输出模块输入英语短文句子层次主题连贯分析模块中的英语短文层次主题连贯语义相似度评分值、英语短文层次主题连贯评分均值;根据英语短文句子层次主题连贯分析模块的英语短文层次主题连贯语义相似度评分值、英语短文层次主题连贯评分均值,计算英语短文的主题连贯分数,并生成英语短文的主题连贯分析评语。
全文数据:
权利要求:
百度查询: 桂林电子科技大学 一种英语短文句子层次主题连贯分析方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。