text分类的那里,生成词表时是不是去除一下停用词会好一点?

来源:7-7 数据预处理之分词

慕数据1235810

2018-11-09

写回答

1回答

正十七

2018-11-12

是的,去除停用词会带来效果的提升,不过提升应该不大,一般模型算法去除听用词后提升1%已经算不错的了。

不过去除停用词有另一个好处,那就是节省计算时间。

对于文本分类问题,除了去除停用词外,还有很多种筛选特征的方法,比如信息增益,交叉熵,卡方分布等等。最简单的就是根据词频删除,比如把只出现过一次的词语删掉。这些都会带来提升的。

0
2
慕数据1235810
老师,我还有个问题,就是我跟着您的课程敲了一遍代码,刚敲完的时候感觉自己细节都懂了,但是过了一段时间,自己好像都忘了,啥都记不起来,这种情况自己要怎么解决呢?就是敲过的代码忘记了
2019-01-07
共2条回复

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程