3-6中推荐系统的疑问

来源:3-6 向量点乘的应用.

MOCKINGT

2018-09-13

图片描述图片描述

关于向量点乘越大相似度越高的疑问

  1. 向量在每个维度上的长度代表什么?
  2. 在二维空间中,如果原始数据是红色的U向量,在ab向量中找最接近的u的向量,和U向量夹角最小的是绿色的b向量,和u点乘最大的是蓝色的a向量,那么最相似的向量(数据点)是哪一个呢?
  3. 在这个模型中是向量夹角最小和点乘最大值决定相似度吗?
写回答

1回答

liuyubobobo

2018-09-13

非常好的问题。


由于这个课程本身不是讲推荐系统,所以这里只是简单提及一下向量点乘的应用。实际上,当我们说两个向量的点乘越大,相似度越高时(有的时候也会说:两个向量之间的夹角越小,相似度越高),是不考虑向量的大小的。或者,你可以理解成:两个向量的长度是固定的,在这个基础上,两个向量夹角越小,点乘的结果就越大,他们越相似:)


你提出的问题,恰恰同时考虑了向量的长度和夹角这两个因素:)


我考虑最近再找一个更加具体的例子,更新到课程中,让同学们更加深刻的理解这一点:)


具体到推荐系统中(其实不仅仅是推荐系统,无论是在统计学中,还是机器学习中,等等很多领域,“相似”都是一个非常重要的概念。),相似是一个很复杂的“抽象”的概念,当我们定量描述相似的时候,有非常多的不同的方法。真实的推荐系统,不可能只靠点乘运算,就做出了推荐。点乘只是其中的一种方法,可以理解成一种参考,由于计算简便,是最简单的一种参考:)


欧拉距离,曼哈顿距离(推广到明可夫斯基距离),皮尔森相关系数,余弦相似系数,等等等等,都可以描述两个向量之间的相似度。对这些内容感兴趣,可以深入学习推荐系统相关的内容:)


加油!:)

3
1
MOCKINGT
明白了,谢谢bobo老师!
2018-09-13
共1条回复

结合编程学数学 专为程序员设计的线性代数

创新设计,通俗易懂。编程结合数学,bobo带你彻底征服线性代数

3404 学习 · 375 问题

查看课程