深度学习中的数据预处理包括什么步骤？

深度学习中的数据预处理主要包括以下几个步骤:
i、数据清洗
查找和去除缺失和错误的数据。
修正格式不一致,移除极端值和离群点。

ii、特征抽取
根据问题特点,提取有效的定量和定性特征。
减少不必要的特征数量。

iii、编码分类变量
使用one-hot 编码或数字编码处理分类变量。
变为机器可理解形式。

iv、归一化
使用Min-Max归一化或标准化将特征值转变到相似的范围。
避免训练时的不平衡。

v、数据分割
将数据分割成训练、验证和测试集。
用于训练、验证和测试模型。

vi、数据增强
对图像进行翻转、裁剪、扰动等操作,扩充训练数据量。
增加模型泛化能力。

总的来说,数据预处理主要包括:

这些步骤的目的是:

好的数据预处理可以显著提升深度学习模型的效果。