简评:机器学习的算法繁多,其中很多算法是一类算法,而有些算法又是从其他算法中衍生出来的,本文从算法类似性简单地列举一些常见的算法。
回归算法 Regression Algorithms
回归算法最初来自于统计学,是一种通过最小化预测值与实际结果值之间的差距,而得到输入特征之间的最佳组合方式的一类算法。
常见的回归算法有:
- 最小二乘回归
- 线性回归
- Logistic 回归
拓展:Coursera Course by Johns Hopkins
聚类算法 Clustering Algorithms
聚类的本质就是寻找联系紧密的事物,把他们区分出来。聚类算法做的事情是,把输入样本聚成围绕一些中心的数据点,以发现数据分布结构的一些规律。
常见的聚类算法有:
- K-均值聚类
- 层次聚类
- 图团体检测
拓展:Amazing introductory video on clustering
降维算法 Dimensionality reduction algorithms
降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维算法能够去除冗余信息以及噪音信息,用更少的信息总结和描述出原始信息的大部分内容。
常见的降维算法:
- 主成分分析算法
- 低方差滤波
- 高相关滤波
- 随机森林
- 反向特征消除 / 前向特征构造
决策树算法 Decision tree algorithms
决策树算法在机器学习中算是很经典的了,决策树会根据数据中的值来创建决策模型,预测阶段选择路径进行决策。与其他算法不同的一点是,它们很容易在许多不同的数据类型上使用。
常见的决策树算法:
- 分类及回归树(CART)
- C4.5 and C5.0
- 随机森林
- Chi-squared Automatic Interaction Detection (CHAID)
拓展:Analytics Vidhya,本文是关于决策树较为深入的文章
深度学习 Deep Learning
深度学习近期在国内引起很大关注,它是一种半监督式学习算法,用来处理存在少量未标识数据的大数据集。利用摩尔定律带来的日益价廉的计算能力,深度学习得以建立大得多也复杂得多的神经网络。大众最熟知的例子就是围棋 AI —— Alpha Go。
常见的深度学习算法:
- 堆栈式自动编码器(Stacked Auto-encoders)
- 卷积神经网络(Convolution Neural Network)
- 递归神经网络(Recurrent neural networks)
- 胶囊网络(Capsule Networks)
拓展:这本书的片段 覆盖了深度学习的主要架构。
原文链接:
推荐阅读:
极光日报,极光开发者 的 Side Project,欢迎关注。