买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江香侬慧语科技有限责任公司
摘要:本发明公开了一种转述文本生成方法、装置、介质及设备,属于语言处理技术领域,其主要包括包括:对无标注语料库进行无监督学习得到上下文匹配模型;利用上下文匹配模型得到至少一个给定句子的多个候选转述文本对,进而得到每个给定句子的候选转述文本对集合;根据每个候选转述文本对的两个文本的语义和不同词,得到高质量候选转述文本对集合;以及对每个高质量候选转述文本对集合进行无监督学习得到转述文本生成模型,进一步进行转述文本的生成。本发明的应用完全不需要标注数据即可得到高质量的转述文本,减少了对标注数据的依赖,缩短了生成标注数据所需的耗时,减少工作量。
主权项:1.一种转述文本生成方法,其特征在于,包括,利用语言模型工具对预先确定的无标注语料库中每个句子的上下文匹配关系进行无监督学习得到上下文匹配模型;利用所述上下文匹配模型得到至少一个给定句子的多个上文和多个下文,将每个所述给定句子、每个所述给定句子的上文或者每个所述给定句子的下文两两组合得到每个所述给定句子分别对应的多个候选转述文本对,进而得到每个所述给定句子的候选转述文本对集合;根据每个所述候选转述文本对的两个文本的语义和不同词,对每个所述候选转述文本对集合中低质量的所述候选转述文本对进行筛除,得到每个所述给定句子对应的高质量候选转述文本对集合;以及,利用所述语言模型工具对每个所述高质量候选转述文本对集合中每个候选转述文本对的转述规则进行无监督学习得到转述文本生成模型,进一步利用所述转述文本生成模型进行所述转述文本的生成。
全文数据:
权利要求:
百度查询: 浙江香侬慧语科技有限责任公司 一种转述文本生成方法、装置、介质及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。