好东西不能独享：近期D-RNN分类论文列表

Deep Reinforcement Learning Papers
https://github.com/junhyukoh/deep-reinforcement-learning-papers/blob/master/README.md

Deep RL?
D-RNN?

不感兴趣

开通SVIP免广告

倒数第二篇文章，是UCT+DQN，但是它的UCT部分相当于复制了一份原模拟器作为状态转移（state transition）模型（如下象棋一样的上帝视角），DQN用来剪枝，貌似是这个意思

Action-Conditional Video Predictionusing Deep Networks in Atari Games
用神经网络生成状态转移模型，预测执行操作后的未来场景，视频：
https://sites.google.com/a/umich.edu/junhyuk-oh/action-conditional-video-prediction

好多重复啊，貌似总共就20篇

求讨论

略读了4楼的那篇论文，感想如下：
1. DQN的影响真是很大，导致不少人做后续的研究
2. 上世纪的AI主流大体可以说是做低维的高等学习推理的东西，近十年来主要是用ANN做高维的低等学习识别的东西，两头一直没有接轨（不是指实际技术接轨，是指观念和应用领域上的接轨）。最近有些研究(如这篇论文）开始进入低维学习推理的范围（如论文中学习高级特征和动作间的关系）並能够综合最近CNN的成果，这是很好的事。
3. 能够将识别和动作一体做学习，得到的就是可学习的规则（即condition-action rules)。下一步就是将多个规则并和起来做推理。这样子上世纪很多未了的研究就有路子可以继续走下去了。
4. 前阵子看到用来综合feature和action的做法都就是简单的把两个向量拼成一个，感觉很粗糙。这篇论文照顾到了这点，提出了些不错的比较细腻的处理方式（equations 3&4)。
5. 虽说这论文是承续DQN拿Atari的游戏做题材，不过如果成果不错的话该是很快的就可以用到实体机器人上头。

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

8回复贴，共1页

<<返回人工智能吧

分享到:

日	一	二	三	四	五	六