站点图标 AI技术聚合

神经网络中的反向传播

神经网络中的反向传播

神经网络中的反向传播

图1 模型输入输出图

图1简单描述了神经网络的整体情况,输入为(x,y),经过映射f:y= Wx后,得到预测值。神经网络训练过程就是希望得到函数y=Wx,能够使得y值尽可能得接近真实情况,显然这个训练过程的核心在于寻找合适的参数W.

参考《深入浅出图神经网络》,给定样本(x,y),前向传播可以得到输出,对应的损失值为,其中L为损失函数(具体可参阅以前的文章深入浅出图神经网络》阅读笔记-第2章 图神经网络基础(1))。

符号说明:

是第l层的输出,

是第l层的输入,第l-1层的输出经过激活函数的输出,

是第l层的偏差输入。

一般来说:,对于第一层:

随后的反向传播推理步骤如下:

1、使用链式法则求参数矩阵:的梯度:

=

2、定义误差项-该误差项衡量了对损失值的影响,之后使用链式法则:

3、基于公式可得:

是哈达玛积,是一种对应元素想成的二元运算符。是激活函数的导数。从式子中可以看出第一层的误差与第l+1层的误差有关,这就是反向传播的来源。

4、对于可以得到:21

5、对于偏置项d的导数:

文章出处登录后可见!

已经登录?立即刷新
退出移动版