3-6中推荐系统的疑问
来源:3-6 向量点乘的应用.
MOCKINGT
2018-09-13
关于向量点乘越大相似度越高的疑问
- 向量在每个维度上的长度代表什么?
- 在二维空间中,如果原始数据是红色的U向量,在ab向量中找最接近的u的向量,和U向量夹角最小的是绿色的b向量,和u点乘最大的是蓝色的a向量,那么最相似的向量(数据点)是哪一个呢?
- 在这个模型中是向量夹角最小和点乘最大值决定相似度吗?
写回答
1回答
-
liuyubobobo
2018-09-13
非常好的问题。
由于这个课程本身不是讲推荐系统,所以这里只是简单提及一下向量点乘的应用。实际上,当我们说两个向量的点乘越大,相似度越高时(有的时候也会说:两个向量之间的夹角越小,相似度越高),是不考虑向量的大小的。或者,你可以理解成:两个向量的长度是固定的,在这个基础上,两个向量夹角越小,点乘的结果就越大,他们越相似:)
你提出的问题,恰恰同时考虑了向量的长度和夹角这两个因素:)
我考虑最近再找一个更加具体的例子,更新到课程中,让同学们更加深刻的理解这一点:)
具体到推荐系统中(其实不仅仅是推荐系统,无论是在统计学中,还是机器学习中,等等很多领域,“相似”都是一个非常重要的概念。),相似是一个很复杂的“抽象”的概念,当我们定量描述相似的时候,有非常多的不同的方法。真实的推荐系统,不可能只靠点乘运算,就做出了推荐。点乘只是其中的一种方法,可以理解成一种参考,由于计算简便,是最简单的一种参考:)
欧拉距离,曼哈顿距离(推广到明可夫斯基距离),皮尔森相关系数,余弦相似系数,等等等等,都可以描述两个向量之间的相似度。对这些内容感兴趣,可以深入学习推荐系统相关的内容:)
加油!:)
312018-09-13
相似问题