Hadoop生态系统是以Hadoop为平台的各种应用框架,相互兼容,组成一个独立的应用体系,也可以称之为生态圈。Hadoop生态系统结构如图2-2所示。除核心的HDFS和MapReduce外,Hadoop还包括ZooKeeper、YARN、HBase、Hive、Flume、Kafka、Spark、Flink/Storm等功能组件。下面介绍各功能组件。
图2-2 Hadoop生态系统结构