谈谈对大数据生态框架的认识

来源:3-1 课程目录

慕函数9758560

2022-12-23

  1. 谈谈你对Hadoop版本的认识?
    你们公司生产上的Hadoop是什么版本?
hadoop3.2.1
sqoop1.4.5
hive3.1.2

为什么选择这个版本?

相对稳定、漏洞补丁修复方便、满足组件间相互版本依赖



谈谈你对选择版本的看法?

原则:
1、不使用beta版,尽量使用半年以上的stable版本,以保证生产稳定和漏洞补丁修复,
2、针对较历史版本有重大特性变更的Release版本,如hadoop1.X->Hadoop2.X,需谨慎,以保证生产稳定为基础,需保证有完整运维监控手段
3、满足组件间相互版本依赖
  1. 谈谈你对大数据生态框架的认识?

你熟悉大数据生态圈中的哪些框架?
它们各自是为了解决什么应用场景?

存储计算:
    存算一体:Hbase、GP、ClickHouse、Hbase、Doris、druid、Kylin
    算:Presto、Impala、Flink、Spark
    存:HDFS/S3/Hudi/Kudu/Iceberg/DeltaLake
数据集成:DataX、Sqoop、FlinkCDC
工作流:Azkanban、Oozie
数据治理:Atlas、Vone
日志:Flume
写回答

1回答

Michael_PK

2022-12-29

挺不错的。

针对你的回答,继续来

hadoop3.2.1 sqoop1.4.5 hive3.1.2

请问:你这个组合中,你遇到过哪些冲突的问题?你是如何解决的?请举例说明

0
0

轻松入门大数据 一站式完成核心能力构建

大数据入门第一课,一站式完成核心能力构建

174 学习 · 59 问题

查看课程