买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东山大鸥玛软件股份有限公司
摘要:本发明属于自然语言处理技术领域,具体涉及一种融入元示例的作文评语生成方法、装置、电子设备及存储介质。该方法包括:将原始作文评语数据集中的原作文分割为若干第一文本块,标注第一文本块与评语内容间的映射关系,构建元示例集;结合评价角度对元示例集中元示例的评语内容进行标注以构建训练样本集,并采用对比学习训练作文语义编码器;将新作文分割为若干第二文本块,利用训练后的作文语义编码器分别获取第二文本块和第一文本块的编码表示向量,计算两向量间的相似度,以找出第二文本块的相关示例;对该相关示例的评语内容进行掩码操作,以构建示例信息集合,再将新作文和示例信息集合输入作文评语生成模型,以生成新作文对应的作文评语。
主权项:1.一种融入元示例的作文评语生成方法,其特征在于,所述方法包括:S1、获取原始作文评语数据集,所述原始作文评语数据集中的数据样本包含原作文及其评语内容,将所述原作文分割为若干第一文本块,并标注每个第一文本块与评语内容间的映射关系,将完成标注后的每个第一文本块与其对应的评语内容作为元示例并构建元示例集;S2、结合评价角度对所述元示例集中每个元示例的评语内容进行评价角度标注,将完成标注后的元示例作为训练样本构建训练样本集,并利用所述训练样本集采用对比学习训练作文语义编码器;S3、对于新作文,将所述新作文分割为若干第二文本块,并将所述第二文本块以及所述元示例的第一文本块输入训练后的作文语义编码器中,分别获取所述第二文本块的编码表示向量和第一文本块的编码表示向量,计算所述第二文本块的编码表示向量和第一文本块的编码表示向量之间的相似度,将相似度最大的第一文本块对应的元示例作为相应第二文本块的相关示例;S4、对所述相关示例的评语内容进行掩码操作,并基于掩码后的评语内容构建示例信息集合,将所述新作文和示例信息集合输入作文评语生成模型进行编码-解码操作,以生成新作文对应的作文评语。
全文数据:
权利要求:
百度查询: 山东山大鸥玛软件股份有限公司 融入元示例的作文评语生成方法、装置、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。