决策树算法的工作原理是什么？ – 编程技术之美-IT之美

决策树算法的工作原理主要分为四个部分:

每个节点选择最优的特征来分离数据。
选择标准是信息增益(Information Gain):

InfoGain(D, attribute) = H(D) - H(D|attribute)

其中H(D)是数据集D的熵,H(D|attribute)是关于特征attribute分割后的数据集的条件熵。

根据每个特征的值将数据划分到子节点中。
直到每一个子集中属于同一类。

考虑过拟合,采用预剪枝和后剪枝提前终止生成树。

对新样本,根据决策树路径从上到下直到叶子节点进行分类。

综上,决策树的工作原理包括:

其中选择最优特征划分节点的核心在于: