一种基于强化学习的消费者体验驱动的智能菜单优化方法

导航：龙图腾网> 最新专利技术> 一种基于强化学习的消费者体验驱动的智能菜单优化方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：广东外语外贸大学

摘要：本发明公开了一种基于强化学习的消费者体验驱动的智能菜单优化方法、系统、设备及介质，所述方法包括如下步骤：以获得最优菜单为目标，构建强化学习模型，采用马尔科夫决策过程刻画强化学习模型；采用强化学习模型对智能体进行训练，获得智能体生成的菜单优化策略；根据菜单优化策略，对菜单进行优化。本发明通过智能体生成菜单优化策略，能够实时地、自动地对菜单进行优化调整，满足顾客的需求，提高顾客的体验，使得餐厅能够提供更加智能化和个性化的服务，同时可以使得餐厅可以较好地适应不断变化的市场和口味趋势。

主权项：1.一种基于强化学习的消费者体验驱动的智能菜单优化方法，其特征在于，包括如下步骤：以获得最优菜单为目标，构建强化学习模型，采用马尔科夫决策过程刻画强化学习模型；采用强化学习模型对智能体进行训练，获得智能体生成的菜单优化策略；根据菜单优化策略，对菜单进行优化；步骤构建强化学习模型，采用马尔科夫决策过程刻画强化学习模型，包括：构建状态空间，其中，状态空间包括所有菜单情况，每个状态为一种菜单情况；定义动作空间，其中，动作空间中的动作包括替换菜品、交换菜品位置、增加菜品和或删除菜品；设置奖励函数，其中，奖励函数为顾客对菜单或菜品的满意度和或菜品的销售额；根据奖励函数更新状态-动作价值函数：状态与在该状态下采取的动作形成状态-动作价值函数，获得奖励函数反馈的奖励值，并根据奖励值更新状态-动作价值函数，以获得最大化的长期奖励；对于菜单中的每个菜品设有保留阈值T，当菜品的奖励值高于保留阈值时，该菜品被继续保留在菜单中，否则将其从菜单中下架；设有最低阈值L，当菜品的奖励值低于最低阈值L时，直接将其从菜单中下架；当菜品的奖励值高于最低阈值L但低于保留阈值T时，设置有观察时间t，观察菜品的奖励值在观察时间t内是否增加，若在观察时间内该菜品的奖励值并未增加，则将其从菜单中下架，并替换新菜品。

全文数据：

权利要求：

百度查询：广东外语外贸大学一种基于强化学习的消费者体验驱动的智能菜单优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：通信系统及基站

下一篇：一种扩散片的自动化生产装置及其使用方法

相关技术

通信系统及基站

一种扩散片的自动化生产装置及其使用方法

一种用于纺织品生产的输送装置

社交网络舆情态势决策方法、装置、设备及介质

模型训练方法、影像分割方法、装置及电子设备

一种安全通信方法、系统、设备和介质

一种装配路径规划方法

卡读写装置、自动交易系统及自动交易的方法

一种应用于游泳场馆的恒温除湿热泵系统

用于混合动力飞行器中DC总线电压的稳定的系统与方法

一种提高采收率用纳米渗吸驱油剂

一种欠驱动无人船自适应滑模轨迹跟踪控制方法

相关技术

相关技术

相关技术

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于强化学习的消费者体验驱动的智能菜单优化方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务