基于逆向强化学习的舰载机甲板调度优化方案生成方法-2013年第04期-国防科技大学学报-好发表

期刊在线咨询服务，立即咨询

投稿策略

期刊推荐

杂志分类

首页学术杂志科普订阅 SCI期刊投稿经验期刊咨询文秘服务论著出书出版社

首页 > 期刊 > 国防科技大学学报 > 基于逆向强化学习的舰载机甲板调度优化方案生成方法【正文】

基于逆向强化学习的舰载机甲板调度优化方案生成方法

李耀宇朱一凡杨峰贾全国防科技大学信息系统与管理学院湖南长沙410073

关键词：逆向强化学习强化学习舰载机甲板调度优化方案生成

摘要：针对计算机辅助指挥调度舰载机甲板作业的决策过程无法脱离人参与这一特点,引入基于逆向学习的强化学习方法,将指挥员或专家的演示作为学习对象,通过分析舰载机的甲板活动,建立舰载机甲板调度的马尔可夫决策模型（MDP）框架;经线性近似,采用逆向学习方法计算得到回报函数,从而能够通过强化学习方法得到智能优化策略,生成舰载机甲板调度方案。经仿真实验验证,本文所提方法能够较好地学习专家演示,结果符合调度方案优化需求,为形成辅助决策提供了基础。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

投稿咨询免费咨询

国防科技大学学报

北大期刊
1-3个月下单

关注 11人评论|0人关注

投稿策略

基于逆向强化学习的舰载机甲板调度优化方案生成方法

期刊咨询

论著出书

订阅服务