统计增量问题
来源:10-8 -SQL的覆盖程度
慕仙4974986
2018-11-06
现在有一个教师表,要统计各个学科的老师个数,现在用spark_sql开发了,完成了,部署了,统计完成后也写回了mysql数据库中,我想问的是,过了一个月,新教师的新增,和老教师的离职,数据有变动,现在需要重新统计,就要把之前写的代码用shell重新执行一遍对吗?我不想这样,我想只要数据库表中有新增老师或者老师离职(删除记录),就统计一次,能办到吗?怎么实现?
写回答
1回答
-
Michael_PK
2018-11-06
你这是把spark当作普通SQL来处理了么,千万别拿你的关系型的东西套大数据。spark SQL作为离线处理完之后,就不会在动他了,下个月关上个月啥事呢。。。
022018-11-06
相似问题