作为行为主义学派的重要技术,近年来,强化学习在 Atari 游戏领域大放异彩。然而,人们要想将强化学习技术真正应用于现实世界任务,还有很长的一段路要走。本文将真实世界强化学习任务抽象为「简化」和「求解」的两个步骤,从马尔科夫决策过程的角度,讨论了基于强化学习的普适性自动化技术。…
评论