买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:无锡雪浪数制科技有限公司
摘要:本申请提供了一种人机交互处理方法、装置、设备及存储介质,其中,该方法包括:按照预设的频率获取用户界面的图像;获取用户的操作指令;将图像输入预先训练得到的图像处理模型,对图像进行内容提取,生成图像对应的结构化信息;将图像、结构化信息以及操作指令输入预先训练得到的多模态大模型,生成操作指令对应的任务语句;针对用户界面执行任务语句,并向用户输出执行结果。本申请通过能够对多模态信息进行准确的整合以及推理决策,实现多模态下的人机交互,同时,还可以通过多次执行本申请实施例提供的人机交互处理方法,以对用户复杂的操作需求进行人机交互处理,使得本申请实施例提供的人机交互处理方法还能够适用于复杂工业场景下。
主权项:1.一种人机交互处理方法,其特征在于,包括:按照预设的频率获取用户界面的图像;获取用户的操作指令;将所述图像输入预先训练得到的图像处理模型,对所述图像进行内容提取,生成所述图像对应的结构化信息,所述结构化信息用于表征所述图像中各元素的类型以及位置;将所述图像、所述结构化信息以及所述操作指令输入预先训练得到的多模态大模型,生成所述操作指令对应的任务语句,所述任务语句至少包括所述操作指令对应的待操作区域以及待执行操作;针对所述用户界面执行所述任务语句,并向所述用户输出执行结果。
全文数据:
权利要求:
百度查询: 无锡雪浪数制科技有限公司 人机交互处理方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。