摘要
研究基于深度强化学习技术的避障场景的算法模型设计,采用改进岛深度Q网络(DeepQ-lesrningNet-work,DQN)算法克服了Q-learning表名式算法在连续状态下导致内存不足的局限性。鉴于学习过程中奖励稀疏导致很艰难获得较好结果的情况,改进奖利机制,增知实时奖惩作为补充,解决学习耗时长和练不稳定的问题:采用相对角度、位置金和距离等信息,相比绝对坐标信息可以更有效的躲障碍物。不同于基于栅格法/可视图法等传统人为策略避障算法,深度强化学习算法DQN能够在缺乏先验知识的条件下具备自主决策能力,因此适用性更强。该技术可应用在仓储无人车、巡佥机器人、无人机等现实场景。
出版日期
2018年02月12日(中国Betway体育网页登陆平台首次上网日期,不代表论文的发表时间)