一种基于提示学习的三阶段任意文本风格迁移方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西北工业大学;西北工业大学深圳研究院

摘要：本发明公开了一种基于提示学习的三阶段任意文本风格迁移方法，由编辑区域获取阶段、掩蔽序列的有效性验证阶段以及风格信息填充阶段组成。1编辑区域获取阶段。该阶段用于获取输入文本的编辑区域。在该阶段，模型将识别风格词并对其进行掩码，以获得掩蔽序列。2掩蔽序列的有效性验证阶段。该阶段对从上一阶段获得的掩蔽序列进行有效性验证，以确保编辑区域的有效性。3风格信息填充阶段。此阶段模型将基于用户指定的任意目标风格生成最终输出。本发明方法将TST任务转换为文本填充任务以应对自回归方式造成的误差累积，引导LLM在特定语义区域内编辑少量文本即可实现TST，这种方式可增强模型的可控性、稳定性和可解释性。

主权项：1.一种基于提示学习的三阶段任意文本风格迁移方法，其特征在于，包括如下步骤：步骤1：编辑区域获取阶段；所述编辑区域获取阶段用于获取输入文本的编辑区域，该阶段识别出风格词并将其掩蔽，掩蔽的区域即为编辑区域；为了得到编辑区域，提出包含识别及掩蔽的两阶段编辑区域获取策略，通过基于提示学习以及基于词频两种方式分别识别风格信息，随后将其风格信息掩蔽得到掩蔽序列x以及x；步骤1-1：以输入文本x以及源风格s为输入，模型识别出风格词并将其掩蔽；步骤1-1-1：识别风格词；通过基于提示学习以及基于词频的方式识别输入文本x中的风格词，接着产生掩码标记向量v＝[v1,v2,v3,…,vn-2,vn-1,vn]，基于提示学习的方式及基于词频的方式分别产生掩码标记向量v以及v；步骤1-1-2：掩蔽风格词；对于掩码向量v，其中vi∈{0,1}，表示输入文本x中的第i个词是否为风格词；vi＝0表示源文本中的第i个单词为内容词，需要保留；vi＝1表示输入文本x中的第i个单词为风格词，被掩蔽；步骤1-2：基于词频的编辑区域获取；采用基于词频的方式识别风格词，将基于词频和基于提示学习的方式相结合，以提高模型获取编辑区域的稳定性及可靠性；对于任意的单词w，通过如下公式判断其是否为风格词：其中w为某个词，s为一种风格，t为另一种风格，s≠t且s和t均属于S，S为一组风格；Dx为具有风格s的句子集，Dy为具有风格t的句子集，λ为平滑参数，countw,Dx为n-gramw在Dx中出现的次数，countw,Dy为n-gramw在Dy中出现的次数；当fw,s大于指定的阈值γ时，则将w定义为风格词；步骤2：掩蔽序列的有效性验证阶段；步骤2-1：鉴别器模块；通过鉴别器判断模型输出的掩码序列x以及x是否有效，随后将结果反馈到LLM以及基于词频的编辑区域获取模块；进入鉴别器的掩蔽序列采用[MASK]掩码方式，即使用[MASK]代替风格词；将训练好的分类器作为模型的鉴别器，鉴别器模块的输入为原文本x和编辑区域获取阶段得到的掩码序列x以及x，得到输入后，鉴别器将对原文本x、掩码序列x以及x分别进行打分得到x_score、x_score以及x_score，随后计算得到x与x之间的分差以及x与x之间的分差，当分差超过设定的阈值时表明得到的编辑区域有效，即掩蔽序列有效；当掩蔽序列无效时，鉴别器将信息反馈到LLM，LLM将重新识别输入语句x中的风格词并产生掩码向量，随后将向量中值为1的对应位置的单词用[MASK]进行掩蔽，再次得到掩蔽序列并进入鉴别器；当掩蔽序列有效时，掩蔽序列将进入隐式掩蔽模块；步骤2-2：隐式掩蔽模块；通过分隔符“[]”将掩码向量v中值为1的对应单词进行隐式的标记；步骤3：风格信息填充阶段；基于全局信息提示LLM实现文本风格信息填充，即考虑上下文内容实现风格信息填充；在风格信息填充阶段，共有3个输入，分别是源输入文本x、基于提示学习得到的掩蔽序列x以及基于词频得到的掩蔽序列x；将上述3个输入分别通过提示模板查询LLM，最终得到多个候选输出；在获得多个候选输出后，模型自动根据准确性、内容保存性和流畅性对其进行评估；最后，选择得分最高的候选句子作为模型的最终输出。

全文数据：

权利要求：

百度查询：西北工业大学西北工业大学深圳研究院一种基于提示学习的三阶段任意文本风格迁移方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种黄芩病虫害识别系统及方法

下一篇：一种大数据检索方法、装置以及可读存储介质

相关技术

一种黄芩病虫害识别系统及方法

一种大数据检索方法、装置以及可读存储介质

一种新能源汽车电池包自加热检测柜

一种重型机械龙门自动焊接装置

一种齿轨车的制动方法、装置、设备及存储介质

制氢装置以及氢发电系统

一种可移动式预装变电站

一种人脸识别环卫作业电子工牌

一种盾构壁后注浆浆液及其制备方法

一种超声波诊断检查防护装置

一种基于突变适配体的快速检测食品中残留甲硝唑的方法

一种铝基制冷散热片及其制备方法

相关技术

相关技术

相关技术

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于提示学习的三阶段任意文本风格迁移方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务