老师, 推荐系统的数据应该如何获取

来源:12-4 推荐系统实战(下)

搬砖战士

2018-12-15

老师能讲解一下推荐系统实战中, 数据源应该怎么制作吗.
学完课程有种自己无法亲手实践一遍的感觉

写回答

1回答

Wotchin

2018-12-15

课程里面的数据源是直接采用学术界通常使用的电影评分数据集,这个数据集在工程场景中实际上是离线收集的,具体在工程实践中是通过对用户信息进行收集整理从而实现的,通常的收集方法是:
1. 对于豆瓣这种网站,实际上是最容易实现推荐系统了,因为用户的评分是很容易量化的,直接从数据库中获取用户的评分信息就可以了;
2. 对于很多没有评分的网站,例如淘宝这种网站,里面可以通过用户的点击次数,页面停留时间等特征来判断用户喜好程度,从而实现数据收集

综上,收集用户信息可以通过日志(如nginx),数据库,花钱购买等来获取,训练方式主要是离线计算,流式预测

0
0

掌握Spark机器学习库 大数据开发技能更进一步

案例+原理+代码 提升大数据处理能力

476 学习 · 81 问题

查看课程