首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于任务链的大模型语病纠错方法、设备和存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨工业大学

摘要:基于任务链的大模型语病纠错方法、设备和存储介质,属于语言信息处理技术领域,解决基于大语言模型的语病纠错正确性低问题。本发明方法包括:在输出中找出与输入原句子对应的信息类型,信息类型包括语病范围、语病类型和纠错方式三种类型;对不同粒度的语病范围进行标注,针对每种语病类型,计算自动标注的语病范围与人工标注的语病范围之间的相似性分数,选择相似性分数最高的标注粒度作为最终的语病范围标注结果;将训练集中的所有样本随机排序,按照样本的顺序,将每个样本的三条指令数据加入到训练队列中,依次使用每条指令数据对大语言模型进行指令微调;利用指令微调后的大语言模型进行语病纠错。本发明适用于基于大语言模型的语病纠错。

主权项:1.一种基于任务链的大模型语病纠错方法,其特征在于,所述方法包括:对大语言模型进行指令微调,具体包括:设置任务链,具体包括:在指令中加入提示词,使用该指令作为大语言模型的输入,得到包含中文语病纠错过程的输出;分解大语言模型的输出,从中找出与输入原句子对应的信息类型,所述信息类型包括语病范围、语病类型和纠错方式三种类型;针对所述信息类型设计任务;构建任务链指令,具体包括:对不同粒度的语病范围进行标注,获取自动标注的语病范围,所述粒度包括字符级别、词级别和句子级别;针对每种语病类型,计算所述自动标注的语病范围与人工标注的语病范围之间的相似性分数,选择相似性分数最高的标注粒度作为最终的语病范围标注结果;任务链指令微调,具体包括:将训练集中的所有样本随机排序,每个训练样本均包含语病范围识别、语病错误分类、语病错误纠错三条指令数据;按照样本的顺序,将每个样本的三条指令数据加入到训练队列中;依次使用每条指令数据对大语言模型进行指令微调;利用所述指令微调后的大语言模型进行语病纠错。

全文数据:

权利要求:

百度查询: 哈尔滨工业大学 基于任务链的大模型语病纠错方法、设备和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。