Python机器学习算法 升级版课程

4921
回复
34402
查看
  [复制链接]

2万

主题

2万

帖子

8万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
86707
发表于 2021-3-10 13:27:51 | 显示全部楼层 |阅读模式
本课程特点是从数学层面推导最经典的机器学习算法,以及每种算法的示例和代码实现(Python)、如何做算法的参数调试、机器学习算法的应用场景介绍等。

【课程内容】

数学基础1 - 数学分析

  • 机器学习的角度看数学
  • 复习数学分析
  • 直观解释常数e
  • 导数/梯度与SGD
  • Taylor展式
  • 凸函数
  • 概率论基础
  • 古典概型
  • 贝叶斯公式
  • 常见概率分布

数学基础2 - 数理统计与参数估计

  • 统计量
  • 期望/方差/偏度/峰度
  • 协方差(矩阵)和相关系数
  • 独立和不相关
  • 大数定律
  • 中心极限定理
  • 中心矩/原点矩/矩估计
  • 深刻理解最大似然估计
  • 过拟合的数学原理
  • 偏差方差二难

数学基础3 - 矩阵和线性代数

  • 线性代数是有用的:以SVD为例
  • 马尔科夫模型和矩阵乘法、状态转移矩阵
  • 矩阵和向量组
  • 特征值和特征向量
  • 对称阵、正交阵、正定阵
  • 数据白化及其应用
  • 向量对向量求导
  • 标量对向量求导
  • 标量对矩阵求导

数学基础4 - 凸优化

  • 凸集的严格数学表达
  • 凸集保凸运算
  • 分割超平面/支撑超平面
  • 凸函数/上境图
  • Jensen不等式
  • Fenchel不等式
  • K-L散度
  • 凸优化
  • 共轭函数和对偶函数
  • 鞍点解释
  • 用对偶方法求解最小二乘问题
  • 强对偶KKT条件

Python基础及其数学库的使用

  • 解释器Python2.7与IDE:Anaconda/Pycharm
  • Python基础:列表/元组/字典/类/文件
  • numpy/scipy/matplotlib/panda的介绍和典型使用
  • 典型图像处理

Python基础及其机器学习库的使用

  • scikit-learn的介绍和典型使用
  • 损失函数的绘制
  • 多种数学曲线
  • 多项式拟合
  • 股票数据分析、卷积、(指数)移动平均线

回归

  • 线性回归
  • 高斯分布
  • Logistic回归
  • 最大似然估计
  • 梯度下降算法:BGD与SGD
  • 特征选择与过拟合

回归实践

  • 机器学习sklearn库介绍
  • Ridge回归、LASSO
  • Logistic/Softmax回归
  • 回归代码实现和调参
  • 交叉验证
  • 数据可视化

决策树和随机森林

  • 熵、联合熵、条件熵、KL散度、互信息
  • 最大似然估计与最大熵模型
  • ID3、C4.5、CART详解
  • 决策树的评价
  • 预剪枝和后剪枝
  • Bagging
  • 随机森林

随机森林实践

  • 手写随机森林实践
  • 调用开源库函数完成随机森林
  • 数据结构的综合使用
  • gini系数

提升

  • 提升为什么有效
  • Adaboost算法
  • 加法模型与指数损失
  • 梯度提升决策树GBDT

XGBoost

  • 自己动手实现GBDT
  • XGBoost库介绍
  • Taylor展式与学习算法
  • KAGGLE简介
  • 泰坦尼克乘客存活率估计

SVM

  • 线性可分支持向量机
  • 软间隔的改进
  • 损失函数的理解
  • 核函数的原理和选择
  • SMO算法
  • 支持向量回归SVR

SVM实践

  • libSVM代码库介绍
  • 原始数据和特征提取
  • 调用开源库函数完成SVM
  • SVR用于时间序列曲线预测
  • SVM、Logistic回归、随机森林三者的横向比较

聚类

  • 各种相似度度量及其相互关系
  • Jaccard相似度和准确率、召回率
  • Pearson相关系数与余弦相似度
  • K-means与K-Medoids及变种
  • AP算法(Sci07)/LPA算法及其应用
  • 密度聚类DBSCAN/DensityPeak(Sci14)
  • 谱聚类SC
  • 聚类评价和结果指标

聚类实践

  • K-Means++算法原理和实现
  • 向量量化VQ及图像近似
  • 并查集的实践应用
  • 密度聚类的代码实现
  • 谱聚类用于图片分割

EM算法

  • 最大似然估计
  • Jensen不等式
  • 朴素理解EM算法
  • 精确推导EM算法
  • EM算法的深入理解
  • 混合高斯分布
  • 主题模型pLSA

EM算法实践

  • 多元高斯分布的EM实现
  • 分类结果的数据可视化
  • EM与聚类的比较
  • Dirichlet过程EM
  • 三维及等高线等图件的绘制
  • 主题模型pLSA与EM算法

贝叶斯网络

  • 朴素贝叶斯
  • 贝叶斯网络的表达
  • 条件概率表参数个数分析
  • 马尔科夫模型
  • D-separation
  • 条件独立的三种类型
  • Markov Blanket
  • 混合(离散+连续)网络:线性高斯模型
  • Chow-Liu算法:最大权生成树MSWT

朴素贝叶斯实践

  • GaussianNB
  • MultinomialNB
  • BernoulliNB
  • 朴素贝叶斯用于鸢尾花数据
  • 朴素贝叶斯用于路透社新闻文本分类

主题模型LDA

  • 贝叶斯学派的模型认识
  • 共轭先验分布
  • Dirichlet分布
  • Laplace平滑
  • Gibbs采样详解

LDA实践

  • 网络爬虫的原理和代码实现
  • 停止词和高频词
  • 动手自己实现LDA
  • LDA开源包的使用和过程分析
  • Metropolis-Hastings算法
  • MCMC
  • LDA与word2vec的比较

隐马尔科夫模型HMM

  • 概率计算问题
  • 前向/后向算法
  • HMM的参数学习
  • Baum-Welch算法详解
  • Viterbi算法详解

HMM实践

  • 动手自己实现HMM用于中文分词
  • 多个语言分词开源包的使用和过程分析
  • 文件数据格式UFT-8、Unicode
  • 停止词和标点符号对分词的影响
  • 前向后向算法计算概率溢出的解决方案
  • 发现新词和分词效果分析
  • 高斯混合模型HMM
  • GMM-HMM用于股票数据特征提取









本资源来源于 网络 付费网站  付费收集而来, 随时收集更新资源  本站专注搜集和分享各种付费网站资源,感谢您的信任


资源下载地址:
链接:
http://pan.baidu.com/s/1c1K8XVU
密码:d9ll
本站所有资源都来源于网络收集,网友提供或者交换而来!

如果侵犯了您的权益,请及时联系客服,我们即刻删除!




上一篇:Udacity、北邮、华盛顿大学 人工智能课程
下一篇:大数据竞赛平台Kaggle案例实战
回复

使用道具 举报

客服客服

客服客服

客服客服

客服QQ
微信扫一扫
自助开通会员后联系客服

QQ- Archiver-手机版-小黑屋- 副业项目_副业项目网

中国互联网举报中心 北京12318文化市场举报热线 网络110报警服务 蜀ICP备13002521号-1 | 业务许可证:B1.B2-20140071