关于topk_y = []的理解
来源:4-1 k近邻算法基础

飞不到北极的企鹅
2017-12-25
视频中讲解的是这些点的y坐标,在我的理解中这是不对的 数据是在二维特性坐标里面那这里就不会是点的y坐标,而是y训练数据里面k个由nearest索引出来离新来点最近的点的值 例如nearest第一个8 那么就对应y里面的第8个也就是1
那要怎么样理解才对呢
写回答
1回答
-
liuyubobobo
2017-12-25
这里可能我有口误。在我们的机器学习算法中,数据的特征都在X中。如果样本数据只有1个维度,通常我会用小x;如果样本数据有多个维度,通常我会用大X。换句话说,小x通常是向量;大X通常是矩阵。都表示样本特征。
样本的输出标记用y表示。由于输出标记只有一个,所以统一用小y表示,是一个向量。
topk_y中存放的是离待预测数据点最近的k个样本数据点,相应的标记输出y的值。
不排除我在课程中,对于二维平面的第二个维度,不自觉的也使用数学坐标系中y轴的说法,需要根据上下文理解一下我说的y是指二维平面的第二个坐标轴,还是样本的标记。
如果还是不理解,麻烦告诉我一下你不理解的说法在视频中的具体的时间,我听一下再回答你。抱歉了!
122017-12-25
相似问题