在我看来,机器学习/深度学习最重要的三件事是:
一、选对模型
选择合适的模型架构和算法是非常重要的。这决定了是否能找到合理的解。
需要考虑:
- 任务特点
- 模型复杂度
- 计算资源
二、足够的数据
数据是机器学习的灵魂。没有足够的数据,通常难以找到一个合理的模型。
需要考虑:
- 数据量
- 质量
- 特征充足程度
三、有效的训练
即便有了模型和数据,如果无法有效地训练模型,性能仍然难以保证。
需要考虑:
- 合理的优化器和算法参数
- 技巧如:数据增强、正则化、dropout等
- 足够的迭代次数
总的来说:
- 选对模型决定是否找到合理解
- 足够的数据决定是否能找到正确的模式
- 有效的训练决定是否能达到理想效果
它们三个互相影响,共同决定模型最终的水平。只有做好这三件事,我们才能得到一个性能出色的模型。