机器学习算法分类

发表于2023年11月22日2023年7月16日作者 IT之美

根据算法的工作原理,机器学习算法主要可以分为三大类:

监督学习

监督学习算法需要带标签的训练数据。
它在训练过程中不断优化模型,以减少损失。
在测试过程中,利用训练得到的模型做预测。

典型算法:

线性回归
决策树
逻辑回归
SVM
神经网络等

无监督学习

无监督学习无需训练数据的标签,直接从数据集中寻找模式。
它主要聚类数据、压缩表示等。
常用于特征提取。

典型算法:

K均值聚类
主成分分析
自组织特征映射
稠密潜变量模型等

半监督学习

它利用少量有标签的数据和大量无标签的数据进行训练模型。
训练数据中标签稀少是一个比较常见的情况。
优化模型需要同时考虑有标签数据和无标签数据。

典型算法:

自助训练
谱聚类
图嵌入等

根据数据标签的有无和算法的优化策略,机器学习主要包括:
监督学习、无监督学习和半监督学习三大类。
它们分别用于有标签数据、无标签数据和少量有标签数据的情况。