您好老师,这一节里损失函数为什么是对交叉熵损失求均值?

来源:7-15 指标计算与梯度算子实现

慕的地8618126

2018-09-21

写回答

1回答

正十七

2018-09-29

我们在其他节的损失函数里也会求均值。均值是在batch_size个样本上进行平均。其实均值不是必须的,因为在train的时候batch_size不变,均值相当于总和除以了一个固定的值。但是如果test的时候batch_size和train的时候不一样,那么我们就无法比较train和test的损失值了,所以求均值是为了让你在不同的batch_size下得到的结果变得具有可比性。

1
0

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程