关于one-hot 的疑问
来源:9-2 循环神经网络RNN
lemonlxn
2020-04-12
老师好,如果这里都采用one-hot 的形式,那假如文本特别长的话,不会导致储存过大吗?为什么只能不能用字典的方式,如{‘the’:1,‘courses’:1000,…},即key:对应唯一的value呢,这样储存方式不就小了很多吗?
写回答
1回答
-
这个存储量基本不算什么的,不能用1 2 3这种方式表示的原因在于,不同字符代表不同的结果,他们直接是独立没有关系的。如果你用1 2 3在数值上,存在倍数关系,会影响模型的结构关系。所以多分类问题,也都是类似one hot格式的输出,而不是单纯的数值
022020-04-13
相似问题