Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于动态掩码和深度强化学习的特征加工工步排序方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京邮电大学

摘要:本发明公开了基于动态掩码和深度强化学习的特征加工工步排序方法,包括步骤1、构建特征工步排序深度强化学习模型;步骤2、构造输入向量的输入模式;步骤3、搭建Actor行动家网络和Critic评论家网络;步骤4、确定动态掩码:不满足几何前置特征、工艺前置特征、工艺链工步等加工约束条件的特征工步动态掩码赋予设定极大值;步骤5、确定局部耗费:考虑夹具更换、刀具更换、刀轨空行程的特征工步耗费;步骤6、确定特征工步排序深度强化学习模型;步骤7、模型训练;步骤8、特征加工工步排序。本发明能在可接受计算时间内实现满足加工约束的特征工步排序结果优化,从而缩短计算时间和提高加工效率。

主权项:1.一种基于动态掩码和深度强化学习的特征加工工步排序方法,其特征在于:包括如下步骤:步骤1、构建特征工步排序深度强化学习模型:特征工步排序深度强化学习模型的输入向量为无序状态特征加工工步,输出向量为具有加工顺序的特征加工工步;特征工步排序深度强化学习模型包括Actor行动家网络和Critic评论家网络;步骤2、构造输入向量的输入模式:输入向量的每个特征加工工步均具有设定输入模式;其中,设定输入模式均需基于对应加工特征的几何信息和工艺链信息;步骤3、搭建Actor行动家网络和Critic评论家网络:Actor行动家网络包括Actor映射层、循环编码器A1和循环解码器A2;其中:Actor映射层用于将步骤2构建的输入向量映射为循环编码器A1的输入格式;循环编码器A1为第一长短期记忆网络LSTM,循环编码器A1具有两个输出向量,分别为细胞状态向量c和历史状态向量h;其中,历史状态向量h被另存为参考向量e;循环解码器A2为第二长短期记忆网络LSTM、自注意力残差网络AR和特征工步选择网络Pt的组合;第二长短期记忆网络LSTM的输入向量包括循环编码器A1的两个输出向量,输出向量为更新后的细胞状态向量c和更新后的历史状态向量h;其中,更新后的历史状态向量h被另存为解码向量d;自注意力残差网络AR的输入向量为参考向量e和解码向量d,输出向量为更新后解码向量D;特征工步选择网络Pt的输入向量为参考向量e、更新后解码向量D、动态掩码m和局部耗费f,输出向量为特征工步排序深度强化学习模型输入向量中每个特征加工工步的选择概率;Critic评论家网络包括Critic映射层、循环编码器C1和预测网络;Critic映射层用于将步骤2构建的输入向量映射为循环编码器C1的输入格式;循环编码器C1的输出作为预测网络的输入,预测网络的输出为排序后特征加工工步的预测总耗费P;步骤4、确定动态掩码m:根据特征工步执行过程中需要满足的加工约束条件,确定输入向量中每个特征加工工步的动态掩码m;其中,对不满足加工约束条件特征工步的动态掩码m赋予设定极大值;对满足加工约束条件特征工步的动态掩码m赋值0或设定极小值;步骤5、确定局部耗费f:局部耗费是指局部两个不同特征工步切换时的耗费;对特征工步排序深度强化学习模型输入向量中的每个特征加工工步,均计算对应的局部耗费f;其中,局部耗费f包括夹具更换耗费、刀具更换耗费和空行程耗费;步骤6、确定特征工步排序深度强化学习模型:将步骤4确定的动态掩码m和步骤5确定的局部耗费f,代入步骤3中,得到完整的Actor行动家网络;将完整Actor行动家网络代入步骤1中,得到具有完整网络的特征工步排序深度强化学习模型;此时,特征工步排序深度强化学习模型中的行动家网络能计算当前选择每个特征加工工步的选择概率,通过循环编码器计算n次来得到排序后的特征加工工步,即形成为特征工步排序深度强化学习模型的输出向量;步骤7、模型训练:采用样本数据集对步骤6确定的特征工步排序深度强化学习模型,进行训练,得到训练后的特征工步排序深度强化学习模型;在训练过程中,根据Actor行动家网络的输出向量,计算排序后特征加工工步的实际总耗费C;根据Critic评论家网络得到预测总耗费P;基于预测总耗费P和实际总耗费C,一方面,根据P-C的均方误差,使用Adam优化器降低Critic评论家网络中预测总耗费P的预测误差;另一方面,根据C-P误差,使用Adam优化器优化Actor评论家网络的特征工步排序结果;步骤8、特征加工工步排序:将一组无序状态的n个待加工特征加工步,输入步骤7训练完成的特征工步排序深度强化学习模型中,使用Actor行动家网络,得到排序后具有加工顺序的特征加工工步。

全文数据:

权利要求:

百度查询: 南京邮电大学 基于动态掩码和深度强化学习的特征加工工步排序方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。