MyEncyclopedia 中文站
MyEncyclopedia 中文站
Home
中文 (简体)
中文 (简体)
English
Frank Ding
Biography
欢迎关注我的公众号
兴趣爱好
AI 和 机器学习
算法
计算机工程
多线程编程
分布式计算和大数据
统计和数学
Recent Posts
强化学习开源环境集
游戏环境 OpenAI Gym Retro OpenAI 发布的增强的游戏强化学习研究平台,Gym Retro。其中包括对任天堂 Game boy,NES, 世嘉游戏等各种模拟器的支持。通过附带的
Jan 23, 2021
2 分钟阅读时长
Tech Blog
解读TRPO论文,一种深度强化学习和传统优化方法结合的方法
导读:本论文由Berkeley 的几位大神于2015年发表于 JMLR(Journal of Machine Learning Research)。深度强化学习算法例如DQN或者P
Dec 25, 2020
9 分钟阅读时长
Tech Blog
深度强化学习之:Policy Gradient Theorem 一些理解
Policy gradient 定理作为现代深度强化学习的基石,同时也是actor-critic的基础,重要性不言而喻。但是它的推导和理解不是那么浅显,不同的资料中又有
Dec 12, 2020
6 分钟阅读时长
Tech Blog
解读深度强化学习基石论文:函数近似的策略梯度方法
导读:这篇式1999 年Richard Sutton 在强化学习领域中的经典论文,论文证明了策略梯度定理和在用函数近似 Q 值时策略梯度定理依然成立,本文奠定了
Dec 12, 2020
5 分钟阅读时长
Tech Blog
深度强化学习之:DQN训练超级玛丽闯关
上一期 MyEncyclopedia公众号文章 从Q-Learning 演化到 DQN ,我们从原理上讲解了DQN算法,这一期,让我们通过代码来实现任天堂
Dec 5, 2020
5 分钟阅读时长
Tech Blog
查看全部文章
Projects
Recent Publications
Quickly discover relevant content by
filtering publications
.
Popular Topics
Algorithm
Course
Deep Learning
DFS
DQN
Dynamic Programming
Functional Programming
Gaming
Java
LeetCode
MCTS
Monte Carlo
OpenAI Gym
Paper Dive
Policy Iteration
Python
Pytorch
Reinforcement Learning
sharing
Simulation
Contact
姓名
邮箱
信息
发送
引用
×