ML 工程师需要了解的一些基本算法

511 阅读2分钟
原文链接: zhuanlan.zhihu.com
简评:机器学习的算法繁多,其中很多算法是一类算法,而有些算法又是从其他算法中衍生出来的,本文从算法类似性简单地列举一些常见的算法。

回归算法 Regression Algorithms

回归算法最初来自于统计学,是一种通过最小化预测值与实际结果值之间的差距,而得到输入特征之间的最佳组合方式的一类算法。

常见的回归算法有:

  • 最小二乘回归
  • 线性回归
  • Logistic 回归

拓展:Coursera Course by Johns Hopkins


聚类算法 Clustering Algorithms

聚类的本质就是寻找联系紧密的事物,把他们区分出来。聚类算法做的事情是,把输入样本聚成围绕一些中心的数据点,以发现数据分布结构的一些规律。

常见的聚类算法有:

  • K-均值聚类
  • 层次聚类
  • 图团体检测

拓展:Amazing introductory video on clustering


降维算法 Dimensionality reduction algorithms

降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维算法能够去除冗余信息以及噪音信息,用更少的信息总结和描述出原始信息的大部分内容。

常见的降维算法:

  • 主成分分析算法
  • 低方差滤波
  • 高相关滤波
  • 随机森林
  • 反向特征消除 / 前向特征构造

拓展:KDnuggets blog


决策树算法 Decision tree algorithms

决策树算法在机器学习中算是很经典的了,决策树会根据数据中的值来创建决策模型,预测阶段选择路径进行决策。与其他算法不同的一点是,它们很容易在许多不同的数据类型上使用。

常见的决策树算法:

  • 分类及回归树(CART)
  • C4.5 and C5.0
  • 随机森林
  • Chi-squared Automatic Interaction Detection (CHAID)

拓展:Analytics Vidhya,本文是关于决策树较为深入的文章


深度学习 Deep Learning

深度学习近期在国内引起很大关注,它是一种半监督式学习算法,用来处理存在少量未标识数据的大数据集。利用摩尔定律带来的日益价廉的计算能力,深度学习得以建立大得多也复杂得多的神经网络。大众最熟知的例子就是围棋 AI —— Alpha Go

常见的深度学习算法:

  • 堆栈式自动编码器(Stacked Auto-encoders)
  • 卷积神经网络(Convolution Neural Network)
  • 递归神经网络(Recurrent neural networks)
  • 胶囊网络(Capsule Networks

拓展:这本书的片段 覆盖了深度学习的主要架构。

原文链接:
推荐阅读:

极光日报,极光开发者 的 Side Project,欢迎关注。