根据算法的工作原理,机器学习算法主要可以分为三大类:
监督学习
- 监督学习算法需要带标签的训练数据。
- 它在训练过程中不断优化模型,以减少损失。
- 在测试过程中,利用训练得到的模型做预测。
典型算法:
- 线性回归
- 决策树
- 逻辑回归
- SVM
- 神经网络等
无监督学习
- 无监督学习无需训练数据的标签,直接从数据集中寻找模式。
- 它主要聚类数据、压缩表示等。
- 常用于特征提取。
典型算法:
- K均值聚类
- 主成分分析
- 自组织特征映射
- 稠密潜变量模型等
半监督学习
- 它利用少量有标签的数据和大量无标签的数据进行训练模型。
- 训练数据中标签稀少是一个比较常见的情况。
- 优化模型需要同时考虑有标签数据和无标签数据。
典型算法:
- 自助训练
- 谱聚类
- 图嵌入等
根据数据标签的有无和算法的优化策略,机器学习主要包括:
监督学习、无监督学习和半监督学习三大类。
它们分别用于有标签数据、无标签数据和少量有标签数据的情况。