关于中心点的选取

来源:4-2 Kmeans-KNN-Meanshift

码农小陈

2020-08-04

老师,请问下,在均值漂移聚类算法中,每次新的中心点的选择是在现有的未被分类的数据点中选择吧?(我这里所说的数据点意思是数据集中的点,即样本点) 还是说中心点的选取可以不是数据点,而是在空间中的任意一点呢? 我觉得这个算法的中心点的选取与kmeans有些不一样,因为在你的两个案例中kmeans初始选择的中心点既可以是空间中的任意点也可以是数据点。

所以我的理解是Kmeans既可以选择空间中的任意一点,也可以选择数据点作为初始点。 但是对于means-shift,必须选择数据点作为初始点,因为当第一个中心点不再变化的时候,需要重复初始的算法步骤,这个时候第二个中心的必须是未被分类的数据点,如果是空间中的任意一点,很难确定如何选择。

写回答

1回答

flare_zhao

2020-08-05

通常来说,两种算法的起始点都不局限于样本点,而是可以是根据样本划分出一个数据空间,然后从空间中取点,meanshift也不是就取一个点,而是可以一次性取一批点,然后进行迭代计算,最后收敛。当然,不少情况下,方便起见,可能直接使用样本点开始。

0
4
flare_zhao
回复
WaniuZhang_ITBoy
圈定的数据点的密度中心
2020-09-26
共4条回复

Python3入门人工智能 掌握机器学习+深度学习

人工智能基础全方位讲解,构建完整人工智能知识体系,带你入门AI

1946 学习 · 594 问题

查看课程