逆增强学习(IRL)研究的目标是使机器通过expert的行为来反推出环境的reward,目前这一领域还是偏理论的,而且圈子很小众,本文将讲述IRL的主要理论和发展历史。

IRL的奠基人可以说是Andrew Ng和Russell。Russell在1998年的论文中定义了IRL研究问题的模型,而他和Andrew Ng在2000年合作的论文Algorithms for Inverse Reinforcement Learning则系统地、完整地建立了IRL的数学模型并提出了三种求解问题的算法。