版本介绍
-
分为社区版和商业版
-
1.x,2.x,-是并行发展的
集群介绍
-
包含两个集群,HDFS集群和YARN集群:
-
都是分布式,可以布置在多台机器上。
-
两者逻辑上分离,但物理常在一起:但是即使装在一台机器上,逻辑上也是分离的,就是说两个的处理完全独立,1个执行不了不影响另一个。
-
优势
-
扩容能力:分布式系统方便的扩充
-
成本低:可以使用多台普通廉价的机器
-
高效率:通过并发数据,结点直接动态并行移动数据,速度块。
-
可靠性:自动同步备份数据
HDFS集群:
-
负责数据的存储。
-
集群中的角色:
-
NameNode:命名结点
-
Datanode:数据结点
-
SecondaryNameNode:秘书结点
-
YARN集群
-
负责数据运算的硬件资源调度,比如内存
-
集群中的角色
-
Resource Manager
-
Node Manager
-
MapReduce
部署方式
-
Standalone mode(独立模式):单机模式,在1个机器上运行一个Java进程,主要用于调试。
-
Pseudo-distributed mode(伪分布模式):1个机器上运行HDFS和YARN,但是分别开启Java进程
-
Cluster mode (集群模式):实际生产使用的模式,在N台主机组成一个Hadoop集群。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。