第一章 深度学习绪论

一. 深度学习介绍

深度学习三步:定义一个函数集合、函数的质量、挑选最好的函数

定义一个函数集合

  • 神经元:权重、偏置、激活函数
  • 全连接前馈神经网络
  • 给定参数定义一个函数,给定网络架构定义一个函数集合
  • Deep意味着许多隐藏层,通用函数近似定理
  • 输出层:softmax
  • 应该用多少层,每层多少神经元:不断试错+直觉

函数的质量

  • 带标签的训练集、训练目标、Loss、Total Loss

挑选最好的函数

  • 找到网络参数最小化 Total loss:梯度下降
  • 局部最小值:平坦区更新缓慢,陷入鞍点、陷入局部最小值
  • 反向传播

二. 深度学习示例

准备数据——配置网络——训练网络——模型评估——模型预测

三. 深度学习技巧

  • 训练集表现不佳:选择合适的loss,Mini-batch,新激活函数,调节学习率,增加冲量
  • 测试集表现不佳(过拟合):及时停止、dropout、正则化、网络架构

results matching ""

    No results matching ""