关于中心点的选取
来源:4-2 Kmeans-KNN-Meanshift
码农小陈
2020-08-04
老师,请问下,在均值漂移聚类算法中,每次新的中心点的选择是在现有的未被分类的数据点中选择吧?(我这里所说的数据点意思是数据集中的点,即样本点) 还是说中心点的选取可以不是数据点,而是在空间中的任意一点呢? 我觉得这个算法的中心点的选取与kmeans有些不一样,因为在你的两个案例中kmeans初始选择的中心点既可以是空间中的任意点也可以是数据点。
所以我的理解是Kmeans既可以选择空间中的任意一点,也可以选择数据点作为初始点。 但是对于means-shift,必须选择数据点作为初始点,因为当第一个中心点不再变化的时候,需要重复初始的算法步骤,这个时候第二个中心的必须是未被分类的数据点,如果是空间中的任意一点,很难确定如何选择。
写回答
1回答
-
flare_zhao
2020-08-05
通常来说,两种算法的起始点都不局限于样本点,而是可以是根据样本划分出一个数据空间,然后从空间中取点,meanshift也不是就取一个点,而是可以一次性取一批点,然后进行迭代计算,最后收敛。当然,不少情况下,方便起见,可能直接使用样本点开始。
042020-09-26
相似问题