当前位置：首页 >个人收藏

前向传播和反向传播（举例说明）

日期： 2017-09-19 分类：个人收藏 469次阅读

假设神经网络结构如下图所示：有2个输入单元；隐含层为2个神经元；输出层也是2个神经元，隐含层和输出层各有1个偏置。

为了直观，这里初始化权重和偏置量，得到如下效果：

----前向传播----

隐含层神经元h1的输入：

$net_{h_{1} } =w_{1}\ast i_{1} +w_{2}\ast i_{2}+b_{1}\ast 1$

代入数据可得：

$net_{h_{1} } =0.15\ast 0.05 +0.2\ast 0.1+0.35\ast 1=0.3775$

假设激励函数用logistic函数，计算得隐含层神经元h1的输出：

$out_{h_{1} }=\frac{1}{1+e^{-net_{h_{1} } } } =\frac{1}{1+e^{-0.3775} }=0.593269992$

同样的方法，可以得到隐含层神经元h2的输出为：

$out_{h_{2} }=0.596884378$

对输出层神经元重复这个过程，使用隐藏层神经元的输出作为输入。这样输出层神经元O1的输出为：

$net_{o_{1} } =w_{5}\ast out_{h_{1} } +w_{6}\ast out_{h_{2} }+b_{2}\ast 1$

代入数据：

$net_{o_{1} } =0.4\ast 0.593269992 +0.45\ast 0.596884378+0.6=1.105905967$

输出层神经元O1的输出：

$out_{o_{1} }=\frac{1}{1+e^{-net_{o_{1} } } } =\frac{1}{1+e^{-1.105905967} }=0.75136507$

同样的方法，可以得到输出层神经元O2的输出为：

$out_{o_{2} }=0.772928465$

----统计误差----

假如误差公式为：

$E_{total} =\sum_{}^{}{\frac{1}{2}(target - output)^{2} }$

如上图，O1的原始输出为0.01，而神经网络的输出为0.75136507，则其误差为：

$E_{o_{1} } =\sum_{}^{}{\frac{1}{2}(0.01 - 0.75136507)^{2} }=0.298371109$

同理可得，O2的误差为：

$E_{o_{2} } =0.023560026$

这样，总的误差为：

$E_{total} =E_{o_{1} }+ E_{o_{2} }=0.298371109$

----反向传播----

对于w5，想知道其改变对总误差有多少影响，得求偏导：

$\frac{d E_{total} }{d w_{5} }$

根据链式法则：

$\frac{d E_{total} }{d w_{5} }=\frac{d E_{total} }{d out_{o_{1} } }\ast\frac{d out_{o_{1} } }{d net_{o_{1} } }\ast \frac{d net_{o_{1} } }{d w_{5} }$

在这个过程中，需要弄清楚每一个部分。

首先：

其次：

最后：

把以上三部分相乘，得到：

根据梯度下降原理，从当前的权重减去这个值（假设学习率为0.5），得：

同理，可以得到：

这样，输出层的所以权值就都更新了（先不管偏置），接下来看隐含层：

对w1求偏导：

用图表来描述上述链式法则求导的路径：

接下来，又是一部分一部分的计算：

>>>>>>>> 1

上式中，第一部分前边已经计算过了：

第二部分中，因为：

所以：

两部分相乘，得：

>>>>>>>> 2

>>>>>>>> 3

>>>>>>>> 4

这样对W1的偏导就出来了：

更新权值：

同理得到：

最后，更新了所有的权重！当最初前馈传播时输入为0.05和0.1，网络上的误差是0.298371109。在第一轮反向传播之后，总误差现在下降到0.291027924。它可能看起来不太多，但是在重复此过程10,000次之后。例如，错误倾斜到0.000035085。

在这一点上，当前馈输入为0.05和0.1时，两个输出神经元产生0.015912196（相对于目标为0.01）和0.984065734（相对于目标为0.99）。

除特别声明，本站所有文章均为原创，如需转载请以超级链接形式注明出处：SmartCat's Blog

标签：机器学习

上一篇：【Android优化】APK包资源精简，立减1M

下一篇：我的《自学编程》之路