首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于提示学习的三阶段任意文本风格迁移方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西北工业大学;西北工业大学深圳研究院

摘要:本发明公开了一种基于提示学习的三阶段任意文本风格迁移方法,由编辑区域获取阶段、掩蔽序列的有效性验证阶段以及风格信息填充阶段组成。1编辑区域获取阶段。该阶段用于获取输入文本的编辑区域。在该阶段,模型将识别风格词并对其进行掩码,以获得掩蔽序列。2掩蔽序列的有效性验证阶段。该阶段对从上一阶段获得的掩蔽序列进行有效性验证,以确保编辑区域的有效性。3风格信息填充阶段。此阶段模型将基于用户指定的任意目标风格生成最终输出。本发明方法将TST任务转换为文本填充任务以应对自回归方式造成的误差累积,引导LLM在特定语义区域内编辑少量文本即可实现TST,这种方式可增强模型的可控性、稳定性和可解释性。

主权项:1.一种基于提示学习的三阶段任意文本风格迁移方法,其特征在于,包括如下步骤:步骤1:编辑区域获取阶段;所述编辑区域获取阶段用于获取输入文本的编辑区域,该阶段识别出风格词并将其掩蔽,掩蔽的区域即为编辑区域;为了得到编辑区域,提出包含识别及掩蔽的两阶段编辑区域获取策略,通过基于提示学习以及基于词频两种方式分别识别风格信息,随后将其风格信息掩蔽得到掩蔽序列x以及x;步骤1-1:以输入文本x以及源风格s为输入,模型识别出风格词并将其掩蔽;步骤1-1-1:识别风格词;通过基于提示学习以及基于词频的方式识别输入文本x中的风格词,接着产生掩码标记向量v=[v1,v2,v3,…,vn-2,vn-1,vn],基于提示学习的方式及基于词频的方式分别产生掩码标记向量v以及v;步骤1-1-2:掩蔽风格词;对于掩码向量v,其中vi∈{0,1},表示输入文本x中的第i个词是否为风格词;vi=0表示源文本中的第i个单词为内容词,需要保留;vi=1表示输入文本x中的第i个单词为风格词,被掩蔽;步骤1-2:基于词频的编辑区域获取;采用基于词频的方式识别风格词,将基于词频和基于提示学习的方式相结合,以提高模型获取编辑区域的稳定性及可靠性;对于任意的单词w,通过如下公式判断其是否为风格词: 其中w为某个词,s为一种风格,t为另一种风格,s≠t且s和t均属于S,S为一组风格;Dx为具有风格s的句子集,Dy为具有风格t的句子集,λ为平滑参数,countw,Dx为n-gramw在Dx中出现的次数,countw,Dy为n-gramw在Dy中出现的次数;当fw,s大于指定的阈值γ时,则将w定义为风格词;步骤2:掩蔽序列的有效性验证阶段;步骤2-1:鉴别器模块;通过鉴别器判断模型输出的掩码序列x以及x是否有效,随后将结果反馈到LLM以及基于词频的编辑区域获取模块;进入鉴别器的掩蔽序列采用[MASK]掩码方式,即使用[MASK]代替风格词;将训练好的分类器作为模型的鉴别器,鉴别器模块的输入为原文本x和编辑区域获取阶段得到的掩码序列x以及x,得到输入后,鉴别器将对原文本x、掩码序列x以及x分别进行打分得到x_score、x_score以及x_score,随后计算得到x与x之间的分差以及x与x之间的分差,当分差超过设定的阈值时表明得到的编辑区域有效,即掩蔽序列有效;当掩蔽序列无效时,鉴别器将信息反馈到LLM,LLM将重新识别输入语句x中的风格词并产生掩码向量,随后将向量中值为1的对应位置的单词用[MASK]进行掩蔽,再次得到掩蔽序列并进入鉴别器;当掩蔽序列有效时,掩蔽序列将进入隐式掩蔽模块;步骤2-2:隐式掩蔽模块;通过分隔符“[]”将掩码向量v中值为1的对应单词进行隐式的标记;步骤3:风格信息填充阶段;基于全局信息提示LLM实现文本风格信息填充,即考虑上下文内容实现风格信息填充;在风格信息填充阶段,共有3个输入,分别是源输入文本x、基于提示学习得到的掩蔽序列x以及基于词频得到的掩蔽序列x;将上述3个输入分别通过提示模板查询LLM,最终得到多个候选输出;在获得多个候选输出后,模型自动根据准确性、内容保存性和流畅性对其进行评估;最后,选择得分最高的候选句子作为模型的最终输出。

全文数据:

权利要求:

百度查询: 西北工业大学 西北工业大学深圳研究院 一种基于提示学习的三阶段任意文本风格迁移方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术