什么是循环神经网络？ – 编程技术之美-IT之美

循环神经网络(Recurrent Neural Network, RNN)是一种针对序列处理的神经网络。它利用序列间的循环连接,实现对序列的学习与理解。
RNN的主要特征是:

常用的RNN模型有:

RNN的工作流程是:

定义RNN模型及隐藏层大小、层数等 hyperparameter
初始化权重和偏置
提供序列输入x1, x2, …, xn
计算各时刻隐状态hn及输出yn (hn = f(hn-1, xn))
根据损失函数计算输出结果与真实值的误差
使用反向传播算法更新网络权重
重复3-6步,直到误差达到期望值或达到最大迭代次数
RNN在自然语言处理、语音识别、机器翻译等序列学习问题上有着广泛的应用。理解RNN有助于我们解决更加复杂的序列学习任务。