课 程 目 的 及 简 介 报名请按-->
本课程的目标在奠定学员学习当代人工智慧关键技术的理论基础。透过学习许多目前具有代表性的深度学习神经网路架构,可累积学员对于各种重要神经网路元件的理解,进而组成许多人工智慧核心系统的设计,达成具有自我学习及解析功能的智慧型产品设计。
课 程 大 纲 及 说 明
分享
转寄列印
◆深度强化学习(Deep Reinforcement Learning)简介
˙人工智慧环境(Environment)与智慧代理人(Agent)
˙策略与规划(Policy and Planning)
˙价值函数(Value Function)
˙运作模型(Model)
˙酬劳与惩罚(Reward)
˙最优价值函数(Optimal Value Function)
˙马可夫决策问题(MDP)
◆图表化及逼近式 (Tabular and Approximation)解决方案
˙有限马可夫决策处理(FMDP)
˙动态规划(Dynamic Programming)
˙蒙地卡罗方法(Monte Carlo Method)
˙时间差分学习(Time-Difference Learning)
˙Q学习(Q-Learning)
˙策略梯度法(Policy Gradient Method)
◆类神经深度强化学习
˙深度Q学习网路(Deep Q-Learning Network)
˙TensorFlow DQN
˙OpenAI Gym
˙Actor Critic
˙Deep Deterministic Policy Gradients(DDPG)
˙Asynchronous Advantage Actor-Critic (A3C)
˙Distributed Proximal Policy Optimization (DPPO)
◆人工智慧深度强化学习个案研究
˙AlphaGo设计理念与方法
˙问答系统强化学习
˙汽车避撞系统模拟
˙自驾车强化学习
˙Q-learning Gridworld Player
˙Atari Ping Pong Player
讲 师 介 绍
资策会专业师资
本文地址:http://www.jiaoyutoutiao.com/news/43.html
华丽丽的“对抗赛”来了,华尔街英语广州学习中心开启有趣互动教育1
亲子共读《大吼大叫的妈妈》体会我家宝贝受伤了教育2
七年前那个卖肾买苹果手机的高中生,现在过得怎么样了?教育3- 教育英语学得好的孩子,为什么会更优秀?
- 教育朗果英语推出在线英语教育新理念
- 教育科贝乐脑力冠军赛全面开启,秀出宝贝最强大脑!
- 教育40W美金保获美国永久绿卡EB-1A,青胜助力您的移民梦想
- 教育孩子无法变聪明,都因为爸妈这三种行为
- 教育首届中国计算机教育大会在厦门隆重举行
- 教育开展科学运动,增强幼儿体质 首届幼儿体质健康高峰论坛在京隆重举行
- 教育第二期四川省青年书法教师培训班顺利结业
- 教育国语是所有学科的根基!妈咪simple teach,小孩轻松认识时间
- 教育“一颗种子,放飞一个梦想”PlayABC感恩节活动专题报道
- 教育还在纠结vipJr好不好?来看看别人家的孩子怎么学英语
- 教育《阿甘正传》妈妈说一个人不需要太多钱,够用就好;多余的钱只是用来炫耀