index_from

来源:7-2 数据集载入与构建词表索引

kingdomad

2019-08-12

(train_data, train_labels), (test_data, test_labels) = imdb.load_data(
    num_words=vocab_size, index_from=index_from)

这里的index_from有什么用?
即使设置了为3,train_data里还是有小于3的ids。

写回答

1回答

正十七

2019-08-14

小于3的id都是特殊字符了,我在下面的代码中给这些id的意义做了明确:

word_index['<PAD>'] = 0
word_index['<START>'] = 1
word_index['<UNK>'] = 2
word_index['<END>'] = 3

同时,需要注意的一点是取出来的词表还是从1开始的,需要做处理

word_index = imdb.get_word_index()
word_index = {k:(v+3) for k, v in word_index.items()}


1
3
闪闪一年
回复
慕姐9068210
同学你好,这个问题我也很迷糊。index_from的意思不是说从哪个index开始取吗?为什么还能改变原来的ID?
2020-04-23
共3条回复

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程