前向传播和反向传播(举例说明)
日期: 2017-09-19 分类: 个人收藏 392次阅读
假设神经网络结构如下图所示:有2个输入单元;隐含层为2个神经元;输出层也是2个神经元,隐含层和输出层各有1个偏置。
为了直观,这里初始化权重和偏置量,得到如下效果:
----前向传播----
隐含层神经元h1的输入:
代入数据可得:
假设激励函数用logistic函数,计算得隐含层神经元h1的输出:
同样的方法,可以得到隐含层神经元h2的输出为:
对输出层神经元重复这个过程,使用隐藏层神经元的输出作为输入。这样输出层神经元O1的输出为:
代入数据:
输出层神经元O1的输出:
同样的方法,可以得到输出层神经元O2的输出为:
----统计误差----
假如误差公式为:
如上图,O1的原始输出为0.01,而神经网络的输出为0.75136507,则其误差为:
同理可得,O2的误差为:
这样,总的误差为:
----反向传播----
对于w5,想知道其改变对总误差有多少影响,得求偏导:
根据链式法则:
在这个过程中,需要弄清楚每一个部分。
首先:

其次:

最后:

把以上三部分相乘,得到:

根据梯度下降原理,从当前的权重减去这个值(假设学习率为0.5),得:

同理,可以得到:

这样,输出层的所以权值就都更新了(先不管偏置),接下来看隐含层:
对w1求偏导:
用图表来描述上述链式法则求导的路径:
接下来,又是一部分一部分的计算:
>>>>>>>> 1

上式中,第一部分前边已经计算过了:

第二部分中,因为:

所以:

两部分相乘,得:

>>>>>>>> 2

>>>>>>>> 3


>>>>>>>> 4


这样对W1的偏导就出来了:

更新权值:

同理得到:

最后,更新了所有的权重! 当最初前馈传播时输入为0.05和0.1,网络上的误差是0.298371109。 在第一轮反向传播之后,总误差现在下降到0.291027924。 它可能看起来不太多,但是在重复此过程10,000次之后。例如,错误倾斜到0.000035085。
在这一点上,当前馈输入为0.05和0.1时,两个输出神经元产生0.015912196(相对于目标为0.01)和0.984065734(相对于目标为0.99)。
除特别声明,本站所有文章均为原创,如需转载请以超级链接形式注明出处:SmartCat's Blog
标签:机器学习
下一篇: 我的《自学编程》之路
精华推荐
