深度强化学习 ( DQN )基本原理与AI项目实战


深度强化学习 ( DQN )基本原理与AI项目实战


强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。

在强化学习的世界里, 算法称之为Agent, 它与环境发生交互,Agent从环境中获取状态(state),并决定自己要做出的动作(action).环境会根据自身的逻辑给Agent予以奖励(reward)。奖励有正向和反向之分。比如在游戏中,每击中一个敌人就是正向的奖励,掉血或者游戏结束就是反向的奖励。

【课程内容】

强化学习简介

强化学习基本概念

马尔科夫决策过程

Bellman方程

值迭代求解

代码实战求解过程

QLearning基本原理

QLearning迭代计算实例

QLearning迭代效果

求解流程详解

DeepQnetwork原理

DQN网络细节

DQN网络参数配置

搭建DQN网络模型

DQN卷积操作定义

数据预处理

实验阶段数据存储

实现训练模块

Debug解读训练代码

完整代码流程分析

DQN效果演示

立 即 下 载

相关资源

发表评论

点 击 提 交