强化学习系列文章,http://www.algorithmdog.com/ml/rl。感觉比较浅显易懂。
内容包括:
强化学习系列之六:策略梯度
强化学习系列之五:价值函数近似
强化学习系列之四:模型无关的策略学习
强化学习系列之三:模型无关的策略评价
强化学习系列之二:模型相关的强化学习
强化学习系列之一:马尔科夫决策过程
内容包括:
强化学习系列之六:策略梯度
强化学习系列之五:价值函数近似
强化学习系列之四:模型无关的策略学习
强化学习系列之三:模型无关的策略评价
强化学习系列之二:模型相关的强化学习
强化学习系列之一:马尔科夫决策过程