买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广东省教育研究院
摘要:本发明提出了一种基于强化学习的自适应抢答优化方法及系统,方法包括:利用传感器收集学生的多模态抢答信号,进行预处理得到目标信号,进行特征提取和融合;边缘计算节点收集目标信号,形成多模态特征数据,对多模态特征数据进行特征融合,并构建强化学习模型对抢答信号进行优先级排序;动态调整抢答信号处理顺序和权重;优化抢答信号的传输路径,对光学自适应光学技术产生的光信号进行加密和解密传输;中央处理器接受解密后的光信号并进行处理和分析,将分析结果发送至各边缘计算节点和用户。本发明提出了一种基于强化学习的自适应光学抢答公平性优化系统,有效解决了现有课堂抢答系统在信号传输延迟、公平性和安全性方面存在的问题。
主权项:1.一种基于强化学习的自适应抢答优化方法,其特征在于,方法包括以下步骤:S1、利用传感器收集学生的多模态抢答信号,并对抢答信息进行预处理得到目标信号,传感器对目标进行特征提取和融合,得到统一的数据集;其中,所述多模态抢答信号包括语音信号、视频信号和按键信号;S2、边缘计算节点收集目标信号,形成多模态特征数据,边缘计算节点对多模态特征数据进行特征融合得到融合后的多模态特征向量,并构建强化学习模型对抢答信号进行优先级排序;S3、引入强化学习算法动态调整抢答信号处理顺序和权重;S4、采用自适应光学技术结合动态波前校正技术优化抢答信号的传输路径,并对光学自适应光学技术产生的光信号进行加密和解密传输;S5、中央处理器接收解密后的光信号并进行处理和分析,将分析结果发送至各边缘计算节点和用户;其中,所述S3具体包括:S301、构建强化学习环境:构建强化学习环境的状态空间St,其中,状态空间St包括降维后的特征向量Fpcat和当前时间步的延迟信息Dlatencyt,表示如下:St=[Fpcat,Dlatencyt]其中,Dlatencyt表示当前时间步的延迟信息;定义动作空间At,包括对抢答信号的优先级排序和权重调整,表示如下:At=[Ppriorityt,Wweightt]其中,Ppriorityt表示当前时间步的优先级排序,Wweightt表示当前时间步的权重调整;S302、设计奖励函数:设第i个学生的响应时间为Tit,定义响应时间公平性指标FairTimeAt为: 其中,表示所有学生的平均响应时间,N表示学生总数;设备差异公平性指标FairEquipAt定义为: 其中,表示所有学生的平均设备性能,设备性能为Pit;加入响应时间和设备差异,定义总的公平性指标FairnessAt为:FairnessAt=γ1·FairTimeAt+γ2·FairEquipAt其中,γ1和γ2表示平衡响应时间和设备差异的权重参数;实时性指标RealTimeAt用于衡量系统的响应速度,定义实时性指标为:RealTimeAt=-maxi∈{1,2,...,N}Tit-Tstartt其中,Tstartt表示当前时间步的开始时间;加入公平性和实时性,设计综合奖励函数Rt为:Rt=αR·FairnessAt+βR·RealTimeAt其中,αR和βR表示权重参数,用于平衡公平性和实时性的影响。
全文数据:
权利要求:
百度查询: 广东省教育研究院 一种基于强化学习的自适应抢答优化方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。