Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于提示学习的领域自适应方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:扬州大学

摘要:本发明公开了一种基于提示学习的领域自适应方法,包括以下步骤:1)选择Bert模型,将该预训练语言模型作为主干,对提示学习方法中的模板和标签词进行设置;2)构造出所需要的提示学习模型,对于数据集,运用提示学习数据加载函数对数据进行加载和处理,之后进行领域自适应任务;3)随机选取少量源域数据样本进行训练,之后将目标域的句子嵌入到同样的模板中,通过预训练语言模型进行掩码语言建模,对输入的目标域句子进行分类预测。本发明利用提示学习的方法,可以解决源域和目标域中语义特征结构的扭曲和类别可辨别性的丢失,在少量源域数据样本的前提下,能够在目标域分类任务中达到更好的准确度。

主权项:1.一种基于提示学习的领域自适应方法,其特征在于,包括以下步骤:1选择Bert模型,将该预训练语言模型作为主干,对提示学习方法中的模板和标签词进行设置;2构造出所需要的提示学习模型,对于数据集,运用提示学习数据加载函数对数据进行加载和处理,之后进行领域自适应任务;所述步骤2具体包括:步骤2.1构造提示学习模型,调用openprompt第三方库中的提示学习分类函数,所述提示学习分类函数包括三个参数,分别是预训练语言模型、模板、标签词,将步骤1中得到三个变量分别赋予进去,从而可以得到提示模型;步骤2.2加载和处理源域和目标域中的数据集,调用openprompt第三方库中的提示数据加载函数,所述提示数据加载函数包括四个参数,分别是数据集、分词器、模板、分词包装类,所述分词器和分词包装类所要赋予的值是由调用加载预训练语言模型函数得到的,之后得到处理好的的训练和测试数据集,从而进行领域自适应任务;3随机选取少量源域数据样本进行训练,之后将目标域的句子嵌入到同样的模板中,通过预训练语言模型进行掩码语言建模,对输入的目标域句子进行分类预测;所述步骤3体包括:步骤3.1在对少量源域数据进行训练后,当目标域句子嵌入到模板中,它将被归类带标签为y的类别中,其中y∈Y,标签词集为Vy={v1,v2,…,vn},Vy是整个词汇V的子集,即Vy∈V,并且Vy被映射到标签为y的类别中;在预训练语言模型中,Vy中的每个单词被填入到[MASK]中,其概率表示为P[MASK]=v∈Vy|Xp;因此,对目标域分类任务转化为标签词的概率计算问题,其计算公式如1所示:Py∈Y|Xp=P[MASK]=v∈Vy|Xp1步骤3.2在求出Vy中每个标签词的概率后,将目标域中每个标签词得到的预测概率映射到具体地类别标签上,预测分数的平均值作为最后类别分类的依据,则预测标签如2所示: 步骤3.3在目标域句子中,如果的V1={computer}的计算预测概率大于的V2={recreation},则最后预测该目标域中的句子被分类为Computer类。

全文数据:

权利要求:

百度查询: 扬州大学 一种基于提示学习的领域自适应方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。