您好老师,这一节里损失函数为什么是对交叉熵损失求均值?
来源:7-15 指标计算与梯度算子实现
慕的地8618126
2018-09-21
写回答
1回答
-
正十七
2018-09-29
我们在其他节的损失函数里也会求均值。均值是在batch_size个样本上进行平均。其实均值不是必须的,因为在train的时候batch_size不变,均值相当于总和除以了一个固定的值。但是如果test的时候batch_size和train的时候不一样,那么我们就无法比较train和test的损失值了,所以求均值是为了让你在不同的batch_size下得到的结果变得具有可比性。
10
相似问题
能讲一下这是什么损失函数吗?
回答 1
激活函数和损失函数的关系
回答 2