迁移学习的一般方法

来源:6-5 VGG16预训练模型读取函数封装

闰土在线抓猹

2020-03-22

老师您好,

在利用经典网络模型做迁移学习的时候,是不是必须按照这种方式先把网络重构出来才行啊,有没有其他方法呢?

我看到很多github项目中给出了类似封装好的train方法,是不是和这里介绍的其实本质一样呢?在利用这种封装好的train方法做迁移学习的时候应该注意些什么呢?
谢谢!

写回答

1回答

正十七

2020-03-24

不一定需要重构网络,有很多封装好的库,比如tf.keras.applications 下的各种模型,https://www.tensorflow.org/api_docs/python/tf/keras/applications/ResNet101

用这些预训练模型的时候,需要注意两点:

a. 更改输出层大小,因为你的类别数跟预训练模型可能不同。

b. 一般会设置模型的最后几层可以被训练,前面的大多数层的参数保持不变。

0
0

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程