老师,请问一下,self.dict中存放的为什么是WordSequence.PAD_TAG等几个标签,不是应该存放的是各个字词出现的频率吗

来源:6-6 数据处理-句子编码化处理(训练字典)

慕村9918781

2018-08-23

写回答

1回答

Mr_Ricky

2018-09-14

在这里将标签存放成字典的形式是为了转换的方便和统一性,方便对后续代码的填充和补位,而词出现的频率直接使用累加统计即可,不需要放在字典中。

0
0

NLP实践TensorFlow打造聊天机器人

解析自然语言处理( NLP )常用技术,从0搭建聊天机器人应用并部署上线,可用于毕设。

673 学习 · 281 问题

查看课程