一种仿哥布林鲨的海参捕捞机器人及其位姿控制方法

导航：龙图腾网> 最新专利技术> 一种仿哥布林鲨的海参捕捞机器人及其位姿控制方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：山东科技大学

摘要：本发明公开了一种仿哥布林鲨的海参捕捞机器人及其位姿控制方法，涉及水下捕捞装备技术领域，包括机架、浮体、推进器、运动仓、仿生鱼嘴、控制仓、收集箱、抽吸装置及探测控制单元，仿生鱼嘴纵向滑动设在运动仓内，运动仓后部设有带动仿生鱼嘴移动的伸缩驱动装置。仿生鱼嘴包括上颚壳体、下颚壳体及弹性内衬体，弹性内衬体设在上、下颚壳体内侧，鱼嘴开合装置驱动仿生鱼嘴开启和闭合。抽吸装置与弹性内衬体后端相连相通，控制仓内设有横向调平装置和纵向调平装置。探测控制单元包括透明罩壳、深度相机、图像识别模块、九轴姿态传感器及控制器。本发明通过DDPG控制算法完成位姿控制训练，探测和识别目标海参，调节重心位置准确吸入海参，自动化、智能化程度高，实现精准捕捞和提高捕捞效率。

主权项：1.一种仿哥布林鲨的海参捕捞机器人，其特征在于，包括机架、浮体、推进器、运动仓、仿生鱼嘴、控制仓、收集箱、抽吸装置及探测控制单元，所述机架为具有开放内腔的钢架结构，浮体设置在机架的顶部，推进器有两组，对称设置在机架的左右两侧；收集箱设于机架的前部下侧，运动仓为前侧开口的方形箱体，设于收集箱和浮体之间，控制仓相邻布置在收集箱后侧；仿生鱼嘴位于运动仓的内部前侧且与运动仓的开口正对，通过导向支架与运动仓纵向滑动配合，运动仓的后部设有伸缩驱动装置，伸缩驱动装置带动导向支架和仿生鱼嘴前后移动；仿生鱼嘴包括上颚壳体、下颚壳体及弹性内衬体，上、下颚壳体一上一下相对布置，弹性内衬体设在上、下颚壳体的内侧，为前端带有条形口的楔形囊状结构；上颚壳体和下颚壳体分别与导向支架转动相连，导向支架上设有鱼嘴开合装置，鱼嘴开合装置的执行端与上、下颚壳体的后端相连，驱动上颚壳体和下颚壳体同步相对运动，使仿生鱼嘴开启和闭合；抽吸装置设在控制仓前部，通过位于收集箱内的三通管与弹性内衬体的后端相连相通，收集箱通过排水机构与外部相通，控制仓的后部设有横向调平装置和纵向调平装置，纵向和横向调平装置一高一低布置；探测控制单元包括透明罩壳、深度相机、图像识别模块、九轴姿态传感器及控制器，透明罩壳设在浮体前侧，深度相机及图像识别模块封装在透明罩壳内，九轴姿态传感器和图像识别模块分别与控制器通讯相连；纵向调平装置和横向调平装置均包括配重块和平行布置的两个导轨，配重块滑动设置在两个导轨顶部，配重块与设在两个第一导轨之间的带传动机构相连，带传动机构驱动配重块沿导轨移动；横向调平装置的两个导轨一前一后横向布置，纵向调平装置的两个导轨一左一右纵向布置，带传动机构包括同步带和两个同步带轮，两个同步带轮通过同步带相连，同步带与配重块底部固定相连，其中一个同步带轮配置有第二伺服电机，第二伺服电机的信号端与控制器通讯相连；利用深度确定性策略梯度算法对海参捕捞机器人进行姿态控制训练；姿态控制方法包括如下步骤：步骤一、构造神经网络：初始化当前Actor神经网络和当前Critic神经网络，把当前Actor神经网络和当前Critic神经网络复制到目标Actor神经网络和目标Critic神经网络中；初始化当前Critic神经网络与目标Critic神经网络的参数ω与，初始化当前Actor神经网络与目标Actor神经网络的参数θ与；步骤二、生成样本：当前Actor神经网络与海参捕捞机器人的位置坐标和姿态进行交互，将当前环境状态St信息输入到当前Actor网络，当前环境状态St包括俯仰角、横滚角和偏航角，并根据行为策略选择一个策略at，策略at包括横向调平装置配重块的位移g1和纵向调平装置配重块的位移g2；海参捕捞机器人执行策略at，获得奖励rt和下一时刻的环境状态St+1；用四元组St，at，rt，St+1表示在当前环境状态St时，采取策略at，得到的奖励rt和下一时刻的环境状态St+1；将经验数据St，at，rt，St+1存入经验缓冲池；步骤三、更新当前Critic神经网络：随机选取经验缓冲池中数据St，at，rt，St+1进行训练，把St和at输入到当前Critic神经网络中，得到当前的估计状态值函数QtSt，at；把St+1输入到目标Actor神经网络中，得到策略at’；把St+1和at’输入到目标Critic神经网络中，得到状态值函数QtSt+1，at’，则目标状态值函数Qt’St+1，at’＝rt+γQtSt+1，at’，其中，γ为加权系数；建立损失函数L＝QtSt，at-Qt’St+1，at’2模型，以最小化函数L为基准，更新当前Critic神经网络的网络参数ω；步骤四、更新当前Actor神经网络：利用梯度策略函数基于准则更新当前Actor神经网络的网络参数θ，其中，表示利用替换θ的值，实现对θ的更新；其中，为关于QtSt，at梯度策略函数；anew为利用当前Actor神经网络计算出在环境状态St作用下的策略值；为策略值anew对网络参数θ的梯度，为Qtst,at对策略值anew的梯度；0≤α≤1；步骤五、更新目标神经网络：根据分别对目标Critic神经网络的网络参数为和目标Actor神经网络的网络参数进行更新，0≤τ≤1；其中，←τω+1-τ表示利用τω+1-τ替换的值，实现对的更新；←τθ+1-τ表示利用τθ+1-τ替换的值，实现对的更新；判断是否达到最大训练次数N，若达到最大训练次数，则训练完成，获得水下机器人姿态控制策略；否则，执行步骤二。

全文数据：

权利要求：

百度查询：山东科技大学一种仿哥布林鲨的海参捕捞机器人及其位姿控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

相关技术

相关技术

相关技术

相关技术

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种仿哥布林鲨的海参捕捞机器人及其位姿控制方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务