揭秘深度强化学习-彭伟


深度强化学习是深度学习算法和强化学习算法的巧妙结合, 它是一种新兴的通用人工智能算法技术, 也是机器学习的前沿技术, DRL算法潜力无限, AlphaGo是目前该算法最成功的使用案例。DRL算法以马尔科夫决策过程为基础, 是在深度学习强大的非线性函数的拟合能力下构成的一种增强算法。深度强化学习算法主要包括基于动态规划 (DP) 的算法以及基于策略优化的算法, 这本书共10章, 首先以AlphaGo在围棋大战的伟大事迹开始, 引起对人工智能发展和现状的介绍, 进而介绍深度强化学习的基本知识。然后分别介绍了强化学习 (重点介绍蒙特卡洛算法和时序差分算法) 和深度学习的基础知识、功能神经网络层、卷积神经网络 (CNN)、循环神经网络 (RNN), 以及深度强化学习的理论基础和当前主流的算法框架。最后介绍了深度强化学习在不同领域的几个应用实例。
资源截图
代码片段和文件信息

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。

发表评论

评论列表(条)