当前位置：首页―正文

人工智慧深度强化学习

　　课程目的及简介报名请按-->

　　本课程的目标在奠定学员学习当代人工智慧关键技术的理论基础。透过学习许多目前具有代表性的深度学习神经网路架构，可累积学员对于各种重要神经网路元件的理解，进而组成许多人工智慧核心系统的设计，达成具有自我学习及解析功能的智慧型产品设计。

　　课程大纲及说明

　　转寄列印

　　◆深度强化学习(Deep Reinforcement Learning)简介

　　˙人工智慧环境(Environment)与智慧代理人(Agent)

　　˙策略与规划(Policy and Planning)

　　˙价值函数(Value Function)

　　˙运作模型(Model)

　　˙酬劳与惩罚(Reward)

　　˙最优价值函数(Optimal Value Function)

　　˙马可夫决策问题(MDP)

　　◆图表化及逼近式 (Tabular and Approximation)解决方案

　　˙有限马可夫决策处理(FMDP)

　　˙动态规划(Dynamic Programming)

　　˙蒙地卡罗方法(Monte Carlo Method)

　　˙时间差分学习(Time-Difference Learning)

　　˙Q学习(Q-Learning)

　　˙策略梯度法(Policy Gradient Method)

　　◆类神经深度强化学习

　　˙深度Q学习网路(Deep Q-Learning Network)

　　˙TensorFlow DQN

　　˙OpenAI Gym

　　˙Actor Critic

　　˙Deep Deterministic Policy Gradients(DDPG)

　　˙Asynchronous Advantage Actor-Critic (A3C)

　　˙Distributed Proximal Policy Optimization (DPPO)

　　◆人工智慧深度强化学习个案研究

　　˙AlphaGo设计理念与方法

　　˙问答系统强化学习

　　˙汽车避撞系统模拟

　　˙自驾车强化学习

　　˙Q-learning Gridworld Player

　　˙Atari Ping Pong Player

　　讲师介绍

　　资策会专业师资

本文地址：http://www.jiaoyutoutiao.com/news/43.html

人工智慧学习