Avatar

Frank Ding

Biography

欢迎关注我的公众号 wechat myencyclopedia

兴趣爱好

  • AI 和 机器学习
  • 算法
  • 计算机工程
  • 多线程编程
  • 分布式计算和大数据
  • 统计和数学

Recent Posts

强化学习开源环境集

游戏环境 OpenAI Gym Retro OpenAI 发布的增强的游戏强化学习研究平台,Gym Retro。其中包括对任天堂 Game boy,NES, 世嘉游戏等各种模拟器的支持。通过附带的

解读TRPO论文,一种深度强化学习和传统优化方法结合的方法

导读:本论文由Berkeley 的几位大神于2015年发表于 JMLR(Journal of Machine Learning Research)。深度强化学习算法例如DQN或者P

深度强化学习之:Policy Gradient Theorem 一些理解

Policy gradient 定理作为现代深度强化学习的基石,同时也是actor-critic的基础,重要性不言而喻。但是它的推导和理解不是那么浅显,不同的资料中又有

解读深度强化学习基石论文:函数近似的策略梯度方法

导读:这篇式1999 年Richard Sutton 在强化学习领域中的经典论文,论文证明了策略梯度定理和在用函数近似 Q 值时策略梯度定理依然成立,本文奠定了

深度强化学习之:DQN训练超级玛丽闯关

上一期 MyEncyclopedia公众号文章 从Q-Learning 演化到 DQN ,我们从原理上讲解了DQN算法,这一期,让我们通过代码来实现任天堂

Projects

Recent Publications

Quickly discover relevant content by filtering publications.

Contact