KMeans算法的训练集与测试集

来源:9-3 Kmeans算法实战

weibo_小朋打酱油_0

2018-10-23

KMeans算法是无监督学习,那它是否就没有训练集与测试集的概念,就像代码里写的那样:
val model = kmeans.fit(data)
model.transform(data).show()

这样的话,模型里面的fit、transform都有什么意义呢?

写回答

1回答

Wotchin

2018-10-24

这个问题问得很好,对其他同学也有借鉴意义。所谓无监督学习是指训练数据集中没有标签y,只有特征向量X,而不是说没有测试集和训练集之分。无监督的训练过程是算法自己找到划分类别的边界,而对预测集的拟合就是利用算法自己找到的边界进行类别的划分。也就是说,与分类算法的不同是训练集形式的不同,相似之处都是能够将结果的类别进行标定并给出结果。

0
1
weibo_小朋打酱油_0
老师思路很清晰
2018-10-24
共1条回复

掌握Spark机器学习库 大数据开发技能更进一步

案例+原理+代码 提升大数据处理能力

476 学习 · 81 问题

查看课程