Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种急诊医疗资源的调度方法、系统、设备与存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明公开了一种急诊医疗资源的调度方法、系统、设备与存储介质,涉及资源分配技术领域,包括步骤:获取急诊室内的医疗资源调度状态信息和相关动作;通过深度强化学习模型估计相关动作;使用粒子群算法优化深度强化学习模型的参数,随机初始化粒子群中每个粒子的位置和速度;根据个体历史最佳位置和全局历史最佳位置更新每个粒子的速度和位置;选择最优粒子更新深度强化学习模型的参数,获得优化后的深度强化学习模型;将医疗资源调度状态信息和相关动作输入优化后的深度强化学习模型中,获得最优的资源调度策略。本发明利用粒子群算法改善优化深度强化学习模型训练的方法,提高了资源调度中获得最佳参数的速度和准确性。

主权项:1.一种急诊医疗资源的调度方法,其特征在于,包括如下步骤:获取急诊室内的医疗资源调度信息;通过深度强化学习模型对所述医疗资源调度信息中的状态和相关动作进行估计,并通过估计获得的状态和相关动作以及奖励关系构建初始调度方案;使用粒子群算法对所述深度强化学习模型的权重参数和偏置参数进行优化,并随机初始化粒子群中每个粒子的位置和速度,将每个粒子在某个位置的参数作为每个粒子的适应度;根据所述适应度获得每个粒子历史最佳位置和全局历史最佳位置,更新每个粒子的速度和位置,并通过更新后每个粒子的速度和位置选择最优粒子;通过最优粒子更新深度强化学习模型的权重参数和偏置参数,获得优化后的深度强化学习模型;将待调度的所述状态和相关动作输入优化后的深度强化学习模型中,通过对初始调度方案进行迭代优化,获得最优的资源调度策略;所述获取急诊室内的医疗资源调度信息,包括如下步骤:通过当前急诊室内的患者人数、患者等待时间、医护人员的工作状态和设备利用率构建医疗资源调度的状态信息;通过当前医疗资源调度的状态下执行的行动构建相关动作和动作空间;通过基于患者等待时间的减少、资源利用率的提高以及患者治疗效果的改善获得奖励,基于相关状态和相关动作生成的奖励信号生成奖励函数;所述通过深度强化学习模型对所述医疗资源调度信息中的状态和相关动作进行估计之前,需对所述深度强化学习模型进行训练,包括如下步骤:利用调度的历史数据来收集整理状态st、动作at和奖励rt的序列集合st,at,rt;初始化深度神经网络参数θ,在当前状态st下根据当前策略选择动作;所述深度神经网络参数θ包括权重参数和偏置参数;执行动作at,观察奖励rt和新状态st+1;获取目标网络的Q值yt,并使用均方误差MSE作为损失函数更新深度神经网络参数θ,获得最小化的损失函数。

全文数据:

权利要求:

百度查询: 广东医通软件有限公司 一种急诊医疗资源的调度方法、系统、设备与存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术