关于训练集id化后出现了0索引

来源:7-12 数据集封装

你鸡

2019-04-16

图片描述
老师这个是你打印的训练集中得到的2个minibatch,我发现里面有0索引,对应的应该是unknown。但是词表不是就是由训练集得到的吗?为什么训练集中还会存在unknown呢?

写回答

1回答

正十七

2019-04-21

因为我做了filter,不是所有的词都留了下来,对于出现频次较少的词,我过滤掉了。当然频次阈值是可以设的,你可以设成0来用全词表。

0
1
你鸡
好的谢谢老师
2019-04-23
共1条回复

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程