如何解决AWS Redshift添加节点并将其从单节点更改为多节点以增加磁盘大小
由于我是Redshift的新手,所以我有以下问题。
添加新节点以增加磁盘空间时,我需要使用“分布样式” 选择吗?
由于我的目的是增加磁盘空间,我是否需要考虑“分布样式”或已经编写的查询中的任何更改(查询在单个节点中有效,没有任何问题)?
解决方法
随着越来越多的节点存在,分布变得很重要。
每个节点至少有2个分片,具体取决于执行这些查询时数据在这些分片上的分布方式。
您可以通过以下方式分发:
-
EVEN
-数据集在片之间平均分配,而如果必须从其他片对该数据执行联接,则这将在所有节点之间平均分配存储。没有连接的非规范化数据将极大地受益,因为它将获得每个节点上的CPU来执行计算。 -
KEYS
-数据集根据它们与其他数据的关系分配给切片,这在使用表中的联接时确实会受益,但请注意,数据可能会不均匀地分布在切片上。 -
ALL
-每个分片都将获取整个数据集,对于小型数据集(小于10GB的表)或数据很少更改的数据集,请使用此选项。 -
AUTO
-Redshift会关注分发样式并尝试为数据集选择正确的内容,您无法控制其所做的决策。
在做出决定之前,您应该考虑如何使用数据,因为它会影响您获得的存储和性能输出。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。