embedding时,我们的词袋是10000,实际把500*10000输入是?

来源:1-1 课程导学

慕设计0293856

2021-05-12

embedding时,我们的词袋是10000,实际把50010000变为50016,请问500*10000,每一行的1万,是不是one-hot编码去表示某个词的?

写回答

1回答

正十七

2021-05-20

分密集编码还是one-hot编码。

如果是one-hot编码:词袋大小是10000, 句子长度或者feature个数是500, 那么编码后就是500 * 10000.

如果是密集编码:词袋是10000大小,embedding size是16,那么embedding的参数大小是10000 x 16. 如果句子长度是500, 那么查表后,得到的编码是500 x 16的。

0
0

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程