为什么要用英文,中文的‘不’‘非’等特征怎么处理?

来源:11-5 训练分类模型

慕粉1472511417

2020-08-03

写回答

1回答

Wotchin

2020-08-03

用啥语言算法都一样,只不过英文更简单。提取这些特征,最关键的是如何进行预处理。不同语言,预处理的复杂程度不一样。如何提取特征?用算法提取特征,也就是构造词向量,比较简单的方法是词袋模型,类似于查字典的原理。

0
0

掌握Spark机器学习库 大数据开发技能更进一步

案例+原理+代码 提升大数据处理能力

476 学习 · 81 问题

查看课程