深度强化学习 ( DQN )基本原理与AI项目实战

4744
回复
75385
查看
  [复制链接]

2万

主题

2万

帖子

8万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
86707
发表于 2021-8-25 23:46:11 | 显示全部楼层 |阅读模式
强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。

在强化学习的世界里, 算法称之为Agent, 它与环境发生交互,Agent从环境中获取状态(state),并决定自己要做出的动作(action).环境会根据自身的逻辑给Agent予以奖励(reward)。奖励有正向和反向之分。比如在游戏中,每击中一个敌人就是正向的奖励,掉血或者游戏结束就是反向的奖励。

【课程内容】


强化学习简介
强化学习基本概念
马尔科夫决策过程
Bellman方程
值迭代求解
代码实战求解过程
QLearning基本原理
QLearning迭代计算实例
QLearning迭代效果
求解流程详解
DeepQnetwork原理
DQN网络细节
DQN网络参数配置
搭建DQN网络模型
DQN卷积操作定义
数据预处理
实验阶段数据存储
实现训练模块
Debug解读训练代码
完整代码流程分析
DQN效果演示









本资源来源于 网络 付费网站  付费收集而来, 随时收集更新资源  本站专注搜集和分享各种付费网站资源,感谢您的信任


资源下载地址:
链接:
https://pan.baidu.com/s/1nwFeDPR
密码:nmgi
本站所有资源都来源于网络收集,网友提供或者交换而来!

如果侵犯了您的权益,请及时联系客服,我们即刻删除!




上一篇:TensorFlow强化学习应用案例
下一篇:深度学习原理与算法详解+8大实战项目 附数据、代码
回复

使用道具 举报

客服客服

客服客服

客服客服

客服QQ
微信扫一扫
自助开通会员后联系客服

QQ- Archiver-手机版-小黑屋- 副业项目_副业项目网

中国互联网举报中心 北京12318文化市场举报热线 网络110报警服务 蜀ICP备13002521号-1 | 业务许可证:B1.B2-20140071