CountVectorizer和TfidfTransformer的问题
来源:4-10 朴素贝叶斯例子(2)

丨越丨
2018-08-16
老师,您的步骤是:
读取文件,分词,整合成数据集
转化向量
特征工程
训练
其中第2步到第3步我没看明白,转化成词向量可以理解,为什么之后还要提取特征,才能训练呢?
count_vector.fit_transform(train_data)
TfidfTransformer(use_idf=False).fit_transform(vector_matrix)
这两步内部分别作了哪些事情?
写回答
1回答
-
Mr_Ricky
2018-08-16
第二步到第三步实际上在转换为词向量之后我们是读取了训练数据的tfidf的值,然后再利用这个值进行训练。下面这两句实际上也就是在做这件事。并不是说提取特征,可能我用提取特征这几个字表达的稍微有点会误导,实际上只是提取其tfidf的值。
022018-08-16
相似问题
对于实现问答对的处理疑问
回答 2
课程听不清
回答 1