首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

复杂过程控制用人机协同强化与提示学习方法、模型及设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:同济大学

摘要:本发明公开了一种复杂过程控制用人机协同强化与提示学习方法、模型及设备,所述方法包括构建复杂过程控制领域的专家评审数据集、设计融合领域知识的深度神经网络强化学习模型、构建基于提示学习的人机协同强化模型等步骤。本发明通过面向多任务提示工程,生成特定提示语,并通过提示文本‑时序数据之间的模态转化,完成预训练模型的提示优化;生成的人机协同强化模型融合领域知识,不断更新预训练模型参数和模型输入,以便更好地激活和获取领域最相关知识,模型生成指令更符合工业机理。

主权项:1.一种复杂过程控制用人机协同强化与提示学习方法,其特征在于,包括以下步骤:步骤S1、构建复杂过程控制领域的专家评审数据集:整合来自多领域、多层次经验数据和审核数据,建立涵盖跨层域和跨业务的专家知识库;步骤S2、设计融合领域知识的深度神经网络强化学习模型:实现人类反馈的强化,利用领域专家知识指导模型的决策和学习过程,调整模型参数获得多模态生成式预训练模型;步骤S3、构建基于提示学习的人机协同强化模型:引入提示学习使人机协同强化模型与人类专家交互,选择适当的提示类型,设计合适的文本提示以及有效的提示策略,将多个提示集成输入至人机协同强化模型中,引导模型的输出,发挥模型的性能和学习效果。

全文数据:

权利要求:

百度查询: 同济大学 复杂过程控制用人机协同强化与提示学习方法、模型及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。