请问求style_gram为什么是在channel之间?
来源:6-8 图像风格转换计算图构建与损失函数计算
xue109196
2018-08-20
每个channel之间的关系应该是平行的吧,每个channel代表这个filter学习到一种feature,那么在channel之间求gram矩阵不就变成了求每个feature之间的关系了。但是每个feature之间应该是没关系的啊,比如可能一个channel是识别提取车的轮子的,另一个是车灯的,两个之间应该是没有关系的。所以我觉得求gram matrix应该是在width 和height这个级别上求,原矩阵乘一个转置,channel不变。计算style loss的时候应该是相同channel(feature)之间相比较求mean square。gram_matrix_style = [1, ([width, height] * [height, width]), channel]。
写回答
1回答
-
Gram矩阵在channel之间是实验结论而非理论结论,这点我在课上也讲过了。就我个人理解,channel之间算相似度是为了提取图像不同特征的关联程度,而这种关联程度则是风格的一种表达。不过这也是由实验反推回来的。建议你试试你说的想法,看最后能不能达到类似的效果。
022018-08-26
相似问题