买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:支付宝(杭州)信息技术有限公司
摘要:本说明书实施例涉及一种构建语料库的方法及装置,所述方法包括:获取第一语料库,其中包含多个无标签语料,然后,获取目标语料及其对应的目标类别标签,将目标语料与第一语料库中的各个语料进行相似度匹配,得到相似度排名靠前的多个检索结果语料。接下来,根据目标语料、目标类别标签以及多个检索结果语料,确定提示文本;提示文本指示大语言模型以提示文本中的各个语料为示例,生成目标类别标签所指示的类别的语料。在得到提示文本后,将提示文本输入到大语言模型中,得到多个生成结果语料。最后,根据多个检索结果语料、多个生成结果语料以及目标类别标签,构建有标签的第二语料库。
主权项:1.一种构建语料库的方法,包括:获取第一语料库,其中包含多个无标签语料;获取目标语料及其对应的目标类别标签,将所述目标语料与所述第一语料库中的各个语料进行相似度匹配,得到相似度排名靠前的多个检索结果语料;根据所述目标语料、目标类别标签以及所述多个检索结果语料,确定提示文本;所述提示文本指示大语言模型以提示文本中的各个语料为示例,生成所述目标类别标签所指示的类别的语料;将所述提示文本输入到大语言模型中,得到多个生成结果语料;根据所述多个检索结果语料、多个生成结果语料以及所述目标类别标签,构建有标签的第二语料库。
全文数据:
权利要求:
百度查询: 支付宝(杭州)信息技术有限公司 一种构建语料库的方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。