微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Elasticsearch节点下线退役and unassigned shards

一、节点退役

当集群中个别节点出现故障预警等情况,需要进行退役工作,即让所有位于该退役节点上的分片的数据分配到其他节点上后,再将此节点关闭并从集群中移除。
1、ES提供了让某个节点上所有数据都移走的功能如下:
  ElasticSearch集群就会自动把这个节点上的所有分片,都自动转移到其他节点上,等到转移完成,这个空节点就可以毫无影响的下线。

curl -XPUT 127.0.0.1:9200/_cluster/settings -d '{
"transient" :{
"cluster.routing.allocation.exclude._ip" : "10.0.0.1"
}
}'

2、当shard都迁移走后,就可以将此机器上的ES进程关闭
3、可以在管理页面上删除此节点的ES服务角色

二、在节点退役过程中遇到的坑

退役ElasticSearch server 节点时,在页面上进行删除该节点后,replia不为0的index恢复过来,但是导致副本为0的index未能进行shard的分配,导致集群始终是red状态。
方式一:跟客户确认该未成功分配分片的索引有没有用,没用就直接删除即可。
方式二:
1、查看ES集群的健康状况
curl -XGET http://localhost:9200/_cluster/health\?pretty
2、查找未分配的分配
curl -s "http://localhost:9200/_cat/shards" | grep UNASSIGNED

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=


3、执行reroute(分多次,逐个修复 变更shard的值为UNASSIGNED查询结果中编号, 上一步查询结果是1 4)
将没有成功分配的shard,进行手动迁移到目标节点

curl -XPOST 'localhost:9200/_cluster/reroute' -d '{
"commands" : [ {
"allocate" : {
"index" : "rs_wx_test",#unsigned 的索引
"shard" : 1,#出现unsigned的切片编号
"node" : "AfUyuXmGTESHXpwi4OExxx",#目标节点
"allow_primary" : true
}
}
] }'

方式三:增加节点数或者减少副本数:
这里选择减少副本数为为例:

curl -H "Content-Type: application/json" -XPUT 'localhost:9200/employee/_settings?pretty' -d '{
"number_of_replicas": 1 #以前副本数为2的时候出现了shards unsigned,现将副本数设置为1,恢复正常
}'

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐