K折交叉验证的主要步骤为:
i、将数据随机分成K等份
将所有样本随机分成K个相同大小的集合。
通常K取值5或10。
ii、循环验证
对于每一份:
- 用其余K-1份数据作为训练集
- 用这一份数据作为验证集
- 训练模型,计算模型在验证集上的指标
- 重复1-3,直到所有K份数据都用做验证集一次
iii、平均效果
将K次验证的平均效果作为最终的效果。
iv、模型适用性
K折交叉验证可以验证模型在多个数据集上的适用性。
避免由单个数据集划分带来的偏差。
v、利用全部数据
K折交叉验证可以有效地利用所有数据。
每份数据既用于训练又用于测试。
vi、数据增强
K折交叉验证可以重复K次,有利于数据增强。
通过在不同的K个数据集上训练,可以增强模型。
总的来说,K折交叉验证的主要步骤为:
- 将所有数据随机分成K份
- 每次使用K-1份数据进行训练
- 使用1份数据测试
- 不断循环直到K次
- 计算K次平均效果
- 验证模型在不同数据集上的适用性
- 更好地利用所有数据
- 对K折重复,有利于数据增强
其中:
- 数据分成K份
- K次验证,平均效果
- 避免数据集偏差
- 更充分利用数据
- 增加模型鲁棒性