老师, 推荐系统的数据应该如何获取
来源:12-4 推荐系统实战(下)
搬砖战士
2018-12-15
老师能讲解一下推荐系统实战中, 数据源应该怎么制作吗.
学完课程有种自己无法亲手实践一遍的感觉
写回答
1回答
-
Wotchin
2018-12-15
课程里面的数据源是直接采用学术界通常使用的电影评分数据集,这个数据集在工程场景中实际上是离线收集的,具体在工程实践中是通过对用户信息进行收集整理从而实现的,通常的收集方法是:
1. 对于豆瓣这种网站,实际上是最容易实现推荐系统了,因为用户的评分是很容易量化的,直接从数据库中获取用户的评分信息就可以了;
2. 对于很多没有评分的网站,例如淘宝这种网站,里面可以通过用户的点击次数,页面停留时间等特征来判断用户喜好程度,从而实现数据收集综上,收集用户信息可以通过日志(如nginx),数据库,花钱购买等来获取,训练方式主要是离线计算,流式预测
00
相似问题