首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

融入元示例的作文评语生成方法、装置、电子设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:山东山大鸥玛软件股份有限公司

摘要:本发明属于自然语言处理技术领域,具体涉及一种融入元示例的作文评语生成方法、装置、电子设备及存储介质。该方法包括:将原始作文评语数据集中的原作文分割为若干第一文本块,标注第一文本块与评语内容间的映射关系,构建元示例集;结合评价角度对元示例集中元示例的评语内容进行标注以构建训练样本集,并采用对比学习训练作文语义编码器;将新作文分割为若干第二文本块,利用训练后的作文语义编码器分别获取第二文本块和第一文本块的编码表示向量,计算两向量间的相似度,以找出第二文本块的相关示例;对该相关示例的评语内容进行掩码操作,以构建示例信息集合,再将新作文和示例信息集合输入作文评语生成模型,以生成新作文对应的作文评语。

主权项:1.一种融入元示例的作文评语生成方法,其特征在于,所述方法包括:S1、获取原始作文评语数据集,所述原始作文评语数据集中的数据样本包含原作文及其评语内容,将所述原作文分割为若干第一文本块,并标注每个第一文本块与评语内容间的映射关系,将完成标注后的每个第一文本块与其对应的评语内容作为元示例并构建元示例集;S2、结合评价角度对所述元示例集中每个元示例的评语内容进行评价角度标注,将完成标注后的元示例作为训练样本构建训练样本集,并利用所述训练样本集采用对比学习训练作文语义编码器;其中,利用所述训练样本集采用对比学习训练作文语义编码器,具体包括:通过人工标注对所述元示例集中每个元示例的评语内容进行评价角度标注,对于元示例,表示第一文本块,表示第一文本块对应的评语内容,其评语内容所属的评价角度标签为,则完成评价角度标注后的元示例表示为,,表示评价角度集合;基于完成评价角度标注后的元示例构建正负样本,对于完成评价角度标注后的元示例,从与第一文本块属于同一个作文文体类型且评价角度标签一致的其余元示例中,随机采样一条元示例作为正样本;从与第一文本块属于不同作文文体类型且评价角度标签不一致的其余元示例中,随机采样一条元示例作为负样本;将构建的正负样本作为训练样本,并采用对比损失函数训练所述作文语义编码器,所述对比损失函数为: (1);式(1)中:表示以实数e为底的指数函数;表示度量两个向量之间距离的函数,取值范围大于0,且表示第一文本块的编码表示向量与正样本的第一文本块的编码表示向量之间的距离,表示第一文本块的编码表示向量与负样本的第一文本块的编码表示向量之间的距离;表示温度参数;S3、对于新作文,将所述新作文分割为若干第二文本块,并将所述第二文本块以及所述元示例的第一文本块输入训练后的作文语义编码器中,分别获取所述第二文本块的编码表示向量和第一文本块的编码表示向量,计算所述第二文本块的编码表示向量和第一文本块的编码表示向量之间的相似度,将相似度最大的第一文本块对应的元示例作为相应第二文本块的相关示例;S4、对所述相关示例的评语内容进行掩码操作,并基于掩码后的评语内容构建示例信息集合,将所述新作文和示例信息集合输入作文评语生成模型进行编码-解码操作,以生成新作文对应的作文评语。

全文数据:

权利要求:

百度查询: 山东山大鸥玛软件股份有限公司 融入元示例的作文评语生成方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。