【深度学习】深度学习中的数据泄漏现象如何解决？

发表于2024年2月5日2023年7月12日作者 IT之美

数据泄漏是深度学习中一个非常易出现的问题。
一、数据泄漏现象
数据泄漏指:模型在测试集上表现意外地好。
通常是由以下原因造成:

二、解决方案
要解决数据泄漏问题,需要做:

具体来说:

三、识别数据泄漏
我们可以通过如下方式来识别数据泄漏 :

总的来说,要解决深度学习中的数据泄漏问题,需要:
1.完全随机划分数据集
2.使用专门的函数
3.不在测试集上统计阈值
4.使用 K 折交叉验证工序
5.增加测试集数据量

同时可以通过:
1.准确率差异
2.效果高于随机猜测
3.效果不变
4.可视化