你将学到的
  • Pandas 数据预处理
  • K-近邻
  • 线性回归
  • 特征工程
  • 梯度下降法
  • 决策树
  • 随机森林
  • 逻辑回归
  • 主成分分析
  • 时间序列数据处理
课程内容
  共18个章节
实验 1 使用 Pandas 进行数据探索

知识点: 1.排列 2.索引 3.交叉表 4.透视表 5.数据探索

挑战 1 人口收入普查数据探索
实验 2 Python 数据可视化分析

知识点: 1.单变量可视化的常用方法 2.多变量可视化的常用方法 3.tSNE

挑战 2 心血管疾病数据探索分析
实验 3 决策树和 K 近邻分类

知识点: 1.决策树 2.最近邻方法 3.交叉验证

挑战 3 决策树和随机森林分析应用
实验 4 线性回归和线性分类器

知识点: 1.回归 2.线性分类 3.逻辑回归的正则化 4.逻辑回归的优缺点 5.验证和学习曲线

挑战 4 逻辑回归用于讽刺文本检测
实验 5 集成学习和随机森林方法

知识点: 1.集成 2.Bootstraping 3.Bagging 4.随机森林 5.特征重要性

挑战 5 构建信用评分预测分类模型
实验 6 特征工程和特征选择

知识点: 1.特征提取 2.特征转换 3.特征选择

挑战 6 红酒质量数据回归探索
实验 7 主成分分析和聚类

知识点: 1.PCA降维 2.KMeans 3.近邻传播 4.谱聚类 5.凝聚聚类

挑战 7 非监督学习应用练习
实验 8 随机梯度下降和独热编码

知识点: 1.随机梯度下降 2.在线学习 3.独热编码 4.哈希技巧

挑战 8 线性回归和随机梯度下降
实验 9 时间序列处理与应用

知识点: 1.时间序列 2.SARIMA 3.线性回归 4.XGBoost 5.Prophet

挑战 9 时间序列分析应用练习
课程介绍

实验任务

  • 使用 Pandas 进行数据探索

  • 使用 Pandas 进行数据可视化

  • 学习决策树算法的基本原理,并动手实现

  • 学习 K-近邻算法基本原理,并动手实现

  • 使用交叉验证完成模型选择

  • 学习线性回归于逻辑回归数学原理,并使用 sklearn 实现

  • 学习集成算法思想,并使用 sklearn 实现

  • 学习常用聚类方法,并使用 sklearn 实现

  • 学习常用的时间序列数据处理方法,并动手实现

    先学知识

  • 需要了解实验楼的基本操作,推荐学习 。

  • 高等数学和线性代数基础知识。如函数求导、矩阵运算等

课程难度

本课程难度为中等偏上。

面向用户

本课程主要讲解机器学习常见算法,整体难度中等偏上,该课程适合于对机器学习感兴趣且数学相对较好的用户。

课程教师

云课管理员 共发布过 58 门课程

查看老师的所有课程 >
开通会员,即刻开始学习
加入社群
加入交流社群