反向传播
来源:7-2 循环神经网络
werrdx
2019-05-08
老师好,多对多时损失函数要加起来计算,我想问一下,这个加起来有必要么?计算的时候不还是要按时间展开么?也就是说不还是要算E0对W的偏导,然后E1的…,最后把结果相加么?这样的话求总的E(E0+E1…)有必要么?
写回答
1回答
-
正十七
2019-06-09
同学你好,抱歉回的晚了。
多对多的时候是有必要的,因为En上有En-1, En-2, ..., E0的导数,En-1同时也有En-2, En-3,..., E0的导数,叠加的部分是要一块算进来的。
另外一点就是,En-1传下去的导数可能跟En是不一样的。从这个方面来说,加起来也是有意义的。
00
相似问题