老师 我想问unk为什么是-1,而不是0

来源:7-11 词表封装与类别封装

weixin_慕斯卡0236420

2019-12-07

老师 我想问unk为什么是-1,而不是0

写回答

1回答

正十七

2019-12-15

同学你好,在我们的代码中,UNK本来就是0啊。我们在pre-processing里把<UNK>作为词表文件的第一行。然后读入的时候赋值成了0啊。

def _read_dict(self, filename):
        with open(filename, 'r') as f:
            lines = f.readlines()     
        for line in lines:
            word, frequency = line.strip('\r\n').split('\t')
            frequency = int(frequency)            
            if frequency < self._num_word_threshold:               
                continue
            idx = len(self._word_to_id)            
            if word == '<UNK>':
                self._unk = idx
            self._word_to_id[word] = idx


0
0

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程