对明可夫斯基距离没感觉,感觉这么凑巧?

来源:4-5 超参数

神经旷野舞者

2018-02-02

感觉很凑巧的样子,类似归纳法,就得出距离的定义了?

距离是一种度量,不是应该放到metrics模块里吗?这是算法本身的,不是度量效果性能的,应该和metrics无关了。

老师有没有这方面关于距离的文章推荐的?想多了解下

写回答

1回答

liuyubobobo

2018-02-03

我个人确实没有见过太好的系统介绍“距离”的文章。都是很零散的。而且很多比较高级的关于“距离”的探讨,本质其实是对“相似性”的探讨,这类内容都在统计学里。可以顺着这类文章中的关键字自己搜索相关文章:http://www.cnblogs.com/daniel-D/p/3244718.html


非常赞!距离本身就是一种度量,在scikit-learn中就是封装在metric中的。这里我们谈的距离是是两个样本点之间的距离,被封装在sklearn.metrics.pairwise这样的一个子模块中,这个子模块的内容可以参见这里:http://scikit-learn.org/stable/modules/classes.html#module-sklearn.metrics.pairwise


另外,scipy中定义了更多距离度量的函数,文档可以见这里:https://docs.scipy.org/doc/scipy/reference/spatial.distance.html


在kNN中,metric只是一个参数,由用户指定距离的计算方法。在kNN内部根据用户指定的距离计算方法,调用想应metrics模块儿中的函数。

0
2
liuyubobobo
回复
神经旷野舞者
统计学是一个很标准的学科,和高等数学,线性代数,离散数学等一样,是一个很相对比较古老的学科(虽然仍然在发展,但是根基很古老)。搜索大学的标准统计学课本就ok。越大众的越ok。随便捡一个评分不要太差的都可以。
2018-02-03
共2条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5839 学习 · 2437 问题

查看课程