什么是监督学习和非监督学习？它们的区别是什么？

发表于2023年5月26日2023年5月23日作者 IT之美

机器学习可以分为监督学习和非监督学习两大类:
监督学习:训练数据中包含标签或目标值,模型通过学习输入特征与输出标签的对应关系,得出用于预测未知样本标签的学习模型。典型的监督学习算法有线性回归、逻辑回归、决策树、支持向量机等。
非监督学习:训练数据没有标签,模型通过检测数据的内在规律性质与模式,对其进行划分或聚类。典型的非监督学习算法有k-means聚类、层次聚类、主成分分析等。
监督学习与非监督学习的主要区别如下:

训练数据:监督学习含有标签,非监督学习数据无标签。
学习目标:监督学习以预测目标值为目的,非监督学习主要用于发现数据的内在结构。
算法分类:监督学习通常归为分类、回归任务,非监督学习以聚类与降维为主。
应用领域:监督学习更广泛应用于预测与分类任务,非监督学习用于推荐、customer segmentation等。
评估方法:监督学习通过损失函数与准确率评估,非监督学习难以直接评估结果,更依赖于可解释性与业务目标。
一般流程:监督学习通常包含训练、预测、评估步骤,非监督学习主要聚焦训练过程。

总之,监督学习通过标签信息进行预测与分类,非监督学习通过发现模式与规律来理解数据。两者采取不同的学习目标与算法,在实际应用中往往结合使用,以利用全部信息进行数据挖掘与分析。