你将学到的
  • Pandas 数据预处理
  • K-近邻
  • 线性回归
  • 特征工程
  • 梯度下降法
  • 决策树
  • 随机森林
  • 逻辑回归
  • 主成分分析
  • 时间序列数据处理
课程内容
  共18个章节
实验 1 使用 Pandas 进行数据探索

知识点: 1.排列 2.索引 3.交叉表 4.透视表 5.数据探索

挑战 1 人口收入普查数据探索
实验 2 Python 数据可视化分析

知识点: 1.单变量可视化的常用方法 2.多变量可视化的常用方法 3.tSNE

挑战 2 心血管疾病数据探索分析
实验 3 决策树和 K 近邻分类

知识点: 1.决策树 2.最近邻方法 3.交叉验证

挑战 3 决策树和随机森林分析应用
实验 4 线性回归和线性分类器

知识点: 1.回归 2.线性分类 3.逻辑回归的正则化 4.逻辑回归的优缺点 5.验证和学习曲线

挑战 4 逻辑回归用于讽刺文本检测
实验 5 集成学习和随机森林方法

知识点: 1.集成 2.Bootstraping 3.Bagging 4.随机森林 5.特征重要性

挑战 5 构建信用评分预测分类模型
实验 6 特征工程和特征选择

知识点: 1.特征提取 2.特征转换 3.特征选择

挑战 6 红酒质量数据回归探索
实验 7 主成分分析和聚类

知识点: 1.PCA降维 2.KMeans 3.近邻传播 4.谱聚类 5.凝聚聚类

挑战 7 非监督学习应用练习
实验 8 随机梯度下降和独热编码

知识点: 1.随机梯度下降 2.在线学习 3.独热编码 4.哈希技巧

挑战 8 线性回归和随机梯度下降
实验 9 时间序列处理与应用

知识点: 1.时间序列 2.SARIMA 3.线性回归 4.XGBoost 5.Prophet

挑战 9 时间序列分析应用练习
课程介绍

机器学习开放基础课程是蓝桥云课经由 Open Machine Learning Course 授权并制作的机器学习免费基础实战课。主要讲解机器学习常用的分类算法和回归算法,以及常用的数据预处理技巧。

我们在原英文课程提供的内容和代码基础上进行了编译,并不局限于简单的翻译。特别地,我们针对部分代码和内容进行增删,添加了更多的讲解和注释性内容,内容也更易于国内用户理解。另外,课程适配了蓝桥云课提供的线上 Notebook 实验环境,让你可以随时随地开始学习。该课程适合于对机器学习感兴趣的用户,但需要具备基础的 Python 编程能力和数学水平。

实验任务

  • 使用 Pandas 进行数据探索
  • 使用 Pandas 进行数据可视化
  • 学习决策树算法的基本原理,并动手实现
  • 学习 K-近邻算法基本原理,并动手实现
  • 使用交叉验证完成模型选择
  • 学习线性回归于逻辑回归数学原理,并使用 sklearn 实现
  • 学习集成算法思想,并使用 sklearn 实现
  • 学习常用聚类方法,并使用 sklearn 实现
  • 学习常用的时间序列数据处理方法,并动手实现

先学知识

课程难度

  • 本课程难度为中等偏上。

面向用户

  • 本课程主要讲解机器学习常见算法,整体难度中等偏上,该课程适合于对机器学习感兴趣且数学相对较好的用户。
课程教师

huhuhang 蓝桥教研中心 共发布过 133 门课程

查看老师的所有课程 >
开通会员,即刻开始学习
加入社群
加入编程交流社群