完全分布式,使用分片,但不使用Hadoop.
它适用于生产环境.
我期待着像这样解释.
>服务器1:Zookeeper
>服务器2:区域服务器
… 和更多
谢谢.
假设您正在运行HDFS(您应该这样做):
> 1 HDFS NameNode
> 1个或更多HDFS Secondary NameNode(s)
> 1个或更多HDFS DataNode(s)
对于MapReduce(如果你想要的话):
> 1 MapReduce JobTracker
> 1个或更多MapReduce TaskTracker(通常与datanodes相同的机器)
对于HBase本身
> 1个或更多HBase Master(热备份是一个好主意)
> 1个或更多HBase RegionServer(通常与datanodes相同的机器)
> 1个或更多Thrift服务器(如果您需要从网络外部访问HBase)
对于ZooKeeper
> 3 – 5个ZooKeeper节点
您需要的机器数量实际上取决于您在面对硬件故障时需要多少可靠性以及哪种节点.上面唯一没有(还)支持热故障转移或面对硬件故障的其他恢复的节点是HDFS NameNode,尽管在最近的Hadoop版本中已经修复了.
您通常希望将RegionServers的HDFS复制因子设置为3,以便您可以利用rack awareness.
因此,经过长时间的抨击,我建议至少(对于生产部署):
> 1x HDFS NameNode> 1x JobTracker / Secondary NameNode> 3x ZK节点> 3x DataNode / RegionServer节点(如果你想运行MapReduce,TaskTracker)> 1x Thrift Server(仅当从运行的网络外部访问HBase时)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。