如何采样m个不同的神经网络?
来源:10-3 自动网络结构搜索算法一的分布式训练
追梦逐梦白日做梦
2018-09-30
老师,采样m个模型得到不同的反馈,这m个模型里面的超参数是一样的吧,那么这m个模型的差别是不是在初始化的不同呢?或者是还有其他不同的地方?
写回答
1回答
-
所谓的采样是根据概率随机生成的,比如某一层的网络的两个参数,输出通道数和卷积核大小,比如输出通道数的可能的值为[32, 64, 96],概率为[0.5, 0.3, 0.2];卷积核大小可能的值为[(3,3), (5,5), (7,7)],概率为[0.4, 0.3, 0.3],那么sample出来的可能是 [32, (3,3)], 也可能是[96, (5,5)]。 因为模型结构不同,所以最后的反馈不同。
而这几个模型的初始化方法什么的都是一样的。只有网络结构不同。
00
相似问题