请问求style_gram为什么是在channel之间?

来源:6-8 图像风格转换计算图构建与损失函数计算

xue109196

2018-08-20

每个channel之间的关系应该是平行的吧,每个channel代表这个filter学习到一种feature,那么在channel之间求gram矩阵不就变成了求每个feature之间的关系了。但是每个feature之间应该是没关系的啊,比如可能一个channel是识别提取车的轮子的,另一个是车灯的,两个之间应该是没有关系的。所以我觉得求gram matrix应该是在width 和height这个级别上求,原矩阵乘一个转置,channel不变。计算style loss的时候应该是相同channel(feature)之间相比较求mean square。gram_matrix_style = [1, ([width, height] * [height, width]), channel]。

写回答

1回答

正十七

2018-08-22

Gram矩阵在channel之间是实验结论而非理论结论,这点我在课上也讲过了。就我个人理解,channel之间算相似度是为了提取图像不同特征的关联程度,而这种关联程度则是风格的一种表达。不过这也是由实验反推回来的。建议你试试你说的想法,看最后能不能达到类似的效果。

0
2
xue109196
我在网上找了好几个源代码,还真都是像老师这样做的……
2018-08-26
共2条回复

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程