你将学到的
  • 强化学习概念
  • Sarsa 强化学习算法
  • OpenAI Gym 应用
  • Q-Learning 强化学习算法
  • 策略梯度算法

机器学习通常被划分为 4 个大分支,分别是:监督学习、非监督学习、半监督学习以及强化学习。本次课程中,我们将对强化学习的概念进行介绍并完成算法应用实践。

强化学习(英语:Reinforcement learning)是非常前沿的学科,它可能是实现强(类)人工智能的手段之一。了解并掌握基础的强化学习方法,将使得你对人工智能的概念进一步深化。

图片描述

先学课程

课程难度

  • 困难

适合人群

  • 本课程主要面向已掌握机器学习监督学习和非监督学习方法,并且想要了解并学习基础强化学习理论知识的用户。

课程信息

  • 学习周期:课程有效期 2 个月,2 个月后无法进行在线实验,但可查看文档内容。高级会员有效期内可一直学习,到期后课程失效,且无法查看文档。部分云主机实验环境因成本较高,存在开启次数限制。关于课程退款等相关注意事项说明,请阅读 用户付费协议
  • 版权说明:课程内容为蓝桥云课原创或蓝桥云课在原作者授权下制作。未经书面同意,擅自爬取、转载和再分发课程内容,均将受到严肃追责。
  • 企业团报:企业购买,请点击 企业用户咨询
课程教师

huhuhang 蓝桥教研中心 共发布过 110 门课程

查看老师的所有课程 >
会员
开通会员,即刻开始学习
加入编程交流社群👇