卷积神经网络:卷积核、stride(减小特征大小)、padding(更好处理图像边角,控制输出特征大小)、池化
梯度爆炸与梯度消失问题
记忆单元、遗忘门、输入门、记忆单元更新、输出门、完整前向过程
LSTM应用:语言模型、seq2seq