embedding时,我们的词袋是10000,实际把500*10000输入是?
来源:1-1 课程导学
慕设计0293856
2021-05-12
embedding时,我们的词袋是10000,实际把50010000变为50016,请问500*10000,每一行的1万,是不是one-hot编码去表示某个词的?
写回答
1回答
-
正十七
2021-05-20
分密集编码还是one-hot编码。
如果是one-hot编码:词袋大小是10000, 句子长度或者feature个数是500, 那么编码后就是500 * 10000.
如果是密集编码:词袋是10000大小,embedding size是16,那么embedding的参数大小是10000 x 16. 如果句子长度是500, 那么查表后,得到的编码是500 x 16的。
00
相似问题