有一个问题我有些想不明白,sparkSQL和直接将数据转化成传统的map,List等集合再进行数据统计优势在哪里?

来源:1-1 课程概览

BillyWebber

2022-08-28

输入正文

写回答

1回答

Michael_PK

2022-08-31

可以具体举个场景对应的例子吗? 我没太理解你这个问题的意思

0
2
Michael_PK
回复
BillyWebber
你的数据转成list,list是一个集合,本身并没有分布式计算的并行处理的能力。如果使用spark去处理,不管是core还是streaming还是sql,只要数据接入进来后,默认都具备分布式计算的能力的,
2022-09-04
共2条回复

Spark3实时处理-Streaming+StructuredStreaming实战

实战Spark3实时处理,掌握两套企业级处理方案

340 学习 · 238 问题

查看课程