首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

摘要生成方法、装置和设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:阿里巴巴集团控股有限公司

摘要:本发明实施例提供一种摘要生成方法、装置和设备,该方法包括:获取组成本文的多个第一语句;通过词语编码器分别对多个第一语句进行词语编码处理,得到个第一语句表示向量;通过语句编码器对多个第一语句表示向量进行句子编码处理,得到第一文本表示向量;通过语句解码器对第一文本表示向量进行解码处理,得到多个第一语句指示向量;通过词语解码器分别对多个第一语句指示向量进行解码处理,得到多个第一摘要语句,由多个第一摘要语句组成文本的摘要。在该方案中,利用文本的句子结构为文本进行摘要生成处理,使得摘要的生成质量、速度得以保证。

主权项:1.一种摘要生成方法,包括:获取组成文本的多个第一语句;通过词语编码器分别对所述多个第一语句进行词语编码处理,得到对应于所述多个第一语句的多个第一语句表示向量,所述词语编码器包括双向长短期记忆网络,所述第一语句表示向量由所述词语编码器对应的双向长短期记忆网络最后时刻的隐层状态构成;通过语句编码器对所述多个第一语句表示向量进行句子编码处理,得到对应于所述文本的第一文本表示向量,所述语句编码器包括双向长短期记忆网络,所述第一文本表示向量包括所述语句编码器对应的双向长短期记忆网络最后时刻的隐层状态;通过语句解码器对所述第一文本表示向量进行解码处理,得到指示需解码的文本内容的多个第一语句指示向量;通过词语解码器分别对所述多个第一语句指示向量进行解码处理,得到多个第一摘要语句,由所述多个第一摘要语句组成所述文本的摘要;模型包括所述词语编码器、所述语句编码器、所述语句解码器和所述词语解码器,所述模型的训练步骤:获取被标注的训练样本中包含的多个第二语句;通过所述词语编码器分别对所述多个第二语句进行词语编码处理,得到对应于所述多个第二语句的多个第二语句表示向量;通过所述语句编码器对所述多个第二语句表示向量进行句子编码处理,得到对应于所述训练样本的第二文本表示向量;通过所述语句解码器对所述第二文本表示向量进行解码处理,得到指示了需解码的文本内容的多个第二语句指示向量;对于所述多个第二语句指示向量中的任一语句指示向量,通过所述词语解码器对所述任一语句指示向量进行解码处理,得到所述词语解码器各时刻的实际隐层状态;根据所述各时刻的实际隐层状态确定各时刻分别对应的词语,所述任一语句指示向量对应的第二摘要语句由所述各时刻分别对应的词语组成;根据多个第二摘要语句与标注的多个参考摘要语句,确定第一损失函数;根据所述第一损失函数确定所述模型的参数;根据所述词语解码器t时刻的实际隐层状态反推所述词语解码器t-1至t-m时刻各自对应的重构隐层状态,m大于1,t为所述各时刻中的一时刻;根据所述词语解码器t-1至t-m时刻各自对应的实际隐层状态与所述t-1至t-m时刻各自对应的重构隐层状态,确定多个第三损失函数;根据所述多个第三损失函数调整所述模型的参数。

全文数据:

权利要求:

百度查询: 阿里巴巴集团控股有限公司 摘要生成方法、装置和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。