我的图书推荐项目 想以Apriori算法为主 该挑哪些算法配合呢 数据获取 和存储又该怎么弄呢还是跟这个项目一样
来源:12-4 基于FP-Growth的关联算法

慕设计4006959
2021-04-28
写回答
1回答
-
同学你好,Apriori因为要对数据集做很多轮的扫描,数据量大的话就很费时,你可以用FP-growth代替Apriori,只需要2轮扫描,我课程有讲解这个算法,数据集可能要你自己找一下,因为这两个算法是基于关联规则,也就是我买了a东西,同时又买了b东西的情况,存储就不需要什么存储了,直接出结果了,直接存到hive里面就可以了。
祝学习愉快!
172021-05-15
相似问题