使用预训练的word2vec,之后训练embedding层。

来源:7-9 LSTM长短期记忆网络

追梦逐梦白日做梦

2019-06-30

这样训练之后,效果不如不训练embedding层效果好,这是为什么?

写回答

1回答

正十七

2019-07-06

可能的原因是learning rate太大,导致embedding从word2vec初始化的那个好状态经过训练后变成了一个差状态。一般fine-tune的时候要设置较小的学习率。

0
1
追梦逐梦白日做梦
tensorflow如何单独给embding层设置lr
2019-07-06
共1条回复

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程