Multipath多路径冗余全解析

一、什么是multipath

普通的电脑主机都是一个硬盘挂接到一个总线上,这里是一对一的关系。而到了有光纤组成的SAN环境,由于主机和存储通过了光纤交换机连接,这样的话,就构成了多对多的关系。也就是说,主机到存储可以有多条路径可以选择。主机到存储之间的IO由多条路径可以选择。

既然,每个主机到所对应的存储可以经过几条不同的路径,如果是同时使用的话,I/O流量如何分配?其中一条路径坏掉了,如何处理?还有在操作系统的角度来看,每条路径,操作系统会认为是一个实际存在的物理盘,但实际上只是通向同一个物理盘的不同路径而已,这样是在使用的时候,就给用户带来了困惑。多路径软件就是为了解决上面的问题应运而生的。多路径的主要功能就是和存储设备一起配合实现如下功能:

1. 故障的切换和恢复

2. IO流量的负载均衡

3. 磁盘的虚拟化

二、为什么使用multipath

由于多路径软件是需要和存储在一起配合使用的,不同的厂商基于不同的操作系统,都提供了不同的版本。并且有的厂商,软件和硬件也不是一起卖的,如果要使用多路径软件的话,可能还需要向厂商购买license才行。比如EMC公司基于linux下的多路径软件,就需要单独的购买license。

其中,EMC提供的就是PowerPath,HDS提供的就是HDLM,更多的存储厂商提供的软件,可参考这里。

当然,使用系统自带的免费多路径软件包,同时也是一个比较通用的包,可以支持大多数存储厂商的设备,即使是一些不是出名的厂商,通过对配置文件进行稍作修改,也是可以支持并运行的很好的。

※ 请与IBM的RDAC、Qlogic的failover驱动区分开,它们都仅提供了Failover的功能,不支持Load Balance方式。但multipath根据选择的策略不同,可支持多种方式,如:Failover、Multipath等。

三、multipath的组成

我这里以红帽x86_64为例,虽然版本比较老,但下面的配置方式基本适用后面的所有版本。

# cat /etc/redflag-release

Red Flag DC Server release 5.0 (Trinity SP2)

# uname -a

Linux localhost.localdomain 2.6.18-164.el5 #1 SMP Tue Aug 18 15:51:48 EDT 2009 x86_64 x86_64 x86_64 GNU/Linux

# rpm -qa|grep device

device-mapper-event-1.02.32-1.el5

device-mapper-1.02.32-1.el5

device-mapper-multipath-0.4.7-30.el5

可见,一套完整的multipath由下面几部分组成:

1. device-mapper-multipath

提供multipathd和multipath等工具和multipath.conf等配置文件。这些工具通过device mapper的ioctr的接口创建和配置multipath设备(调用device-mapper的用户空间库。创建的多路径设备会在/dev/mapper中);

2. device-mapper

device-mapper包括两大部分:内核部分和用户部分。

内核部分由device-mapper核心(multipath.ko)和一些target driver(dm-multipath.ko)构成。dm-mod.ko是实现multipath的基础,dm-multipath其实是dm的一个target驱动。核心完成设备的映射,而target根据映射关系和自身特点具体处理从mappered device 下来的i/o。同时,在核心部分,提供了一个接口,用户通过ioctr可和内核部分通信,以指导内核驱动的行为,比如如何创建mappered device,这些device的属性等。

用户空间部分包括device-mapper这个包。其中包括dmsetup工具和一些帮助创建和配置mappered device的库。这些库主要抽象,封装了与ioctr通信的接口,以便方便创建和配置mappered device。device-mapper-multipath的程序中就需要调用这些库;

3. scsi_id

其包含在udev程序包中,可以在multipath.conf中配置该程序来获取scsi设备的序号。通过序号,便可以判断多个路径对应了同一设备。这个是多路径实现的关键。scsi_id是通过sg驱动,向设备发送EVPD page80或page83 的inquery命令来查询scsi设备的标识。但一些设备并不支持EVPD 的inquery命令,所以他们无法被用来生成multipath设备。但可以改写scsi_id,为不能提供scsi设备标识的设备虚拟一个标识符,并输出到标准输出。

multipath程序在创建multipath设备时,会调用scsi_id,从其标准输出中获得该设备的scsi id。在改写时,需要修改scsi_id程序的返回值为0。因为在multipath程序中,会检查该直来确定scsi id是否已经成功得到。

四、配置multipath

原理看了一堆,实际配置还是比较简单的。配置文件只有一个:/etc/multipath.conf 。配置前,请用fdisk -l 确认已可正确识别盘柜的所有LUN,HDS支持多链路负载均衡,因此每条链路都是正常的;而如果是类似EMC CX300这样仅支持负载均衡的设备,则冗余的链路会出现I/O Error的错误。

multipath.conf的配置参数、默认值,可参考:

1、编辑黑名单

默认情况下,multipath会把所有设备都加入到黑名单(devnode "*"),也就是禁止使用。所以,我们首先需要取消该设置,把配置文件修改为类似下面的内容:

devnode_blacklist {

#devnode "*"

devnode "hda"

wwid 3600508e000000000dc7200032e08af0b

}

这里禁止使用hda,也就是光驱。另外,还限制使用本地的sda设备,这个wwid,可通过下面的命令获得:

# scsi_id -g -u -s /block/sda

3600508e000000000dc7200032e08af0b

2、编辑默认规则

不同的device-mapper-multipath或操作系统发行版,其默认的规则都有点不同,以RedHat x86_64为例,其path_grouping_policy默认为failover,也就是主备的方式。这明显不符合我们的要求。(HDS支持多路径负载均衡,EMC CX300等只支持Failover)。

所以,我们需要修改默认的规则:

defaults {

udev_dir /dev

path_grouping_policy multibus

failback immediate

no_path_retry fail

user_friendly_name yes

关键是path_grouping_policy一项,其他选项可参考说明文档。

3、启动服务及生成映射

# modprobe dm-multipath

# service multipathd start

# multipath -v0

4、查看复合后的设备

# multipath -ll

会看到类似下面的信息:

mpath0 (360060e80058e980000008e9800000007)

[size=20 GB][features="0"][hwhandler="0"]

\_ round-robin 0 [prio=1][active]

\_ 3:0:0:7 sdaa 65:160 [active][ready]

\_ round-robin 0 [prio=1][enabled]

\_ 4:0:0:7 sdas 66:192 [active][ready]

\_ 5:0:0:7 sdbk 67:224 [active][ready]

\_ 2:0:0:7 sdi 8:128 [active][ready]

这说明,已由四条链路sdaa/sdas/sdbk/sdi复合成一条链路,设备名为mpath0。

状态正常的话,把multipathd设置为自启动:

# chkconfig multipathd on

5、使用mpath设备

用multipath生成映射后,会在/dev目录下产生多个指向同一条链路的设备:

/dev/mapper/mpathn

/dev/mpath/mpathn

/dev/dm-n

但它们的来源是完全不同的:

/dev/mapper/mpathn 是multipath虚拟出来的多路径设备,我们应该使用这个设备;

/dev/mpath/mpathn 是udev设备管理器创建的,实际上就是指向下面的dm-n设备,仅为了方便,不能用来挂载;

/dev/dm-n 是软件内部自身使用的,不能被软件以外使用,不可挂载。

简单来说,就是我们应该使用/dev/mapper/下的设备符。对该设备即可用fdisk进行分区,或创建为pv。

6、分区或创建lvm

以前,我考虑到从系统iostat看到的都是dm-n的设备,所以一直都是直接对dm-n操作。但这会产生一个问题,就是没法分区。而对/dev/mapper/mpathn设备操作就没有这问题。只要要注意,用fdisk分区并保存后,必须刷新multipath的映射表,以便其创建分区对应的设备符,例如:

# fdisk -l /dev/mapper/mpath0

Disk /dev/mapper/mpath0: 214.7 GB,214748364800 bytes

255 heads,63 sectors/track,26108 cylinders

Units = cylinders of 16065 * 512 = 8225280 bytes

Device Boot Start End Blocks Id System

/dev/mapper/mpath0p1 1 26108 209712478+ 83 Linux

# multipath -F

# ll /dev/mapper/mpath0p1

brw-rw---- 1 root disk 253,2 5月 7 07:40 /dev/mapper/mpath0p1

同样的,mpathn或其分区都可用来做pv使用:

# pvcreate /dev/mapper/mpath0p1

# vgcreate test /dev/mapper/mpath0p1

# lvcreate -L 1g -n lv1 test

# lvdisplay

# mkfs.ext3 /dev/test/lv1

※ 注意:

根据网上的资料,有部分multipath版本存在与lvm兼容的问题。具体表现是,使用device-mapper设备创建lvm完成,重启后,虽然lvm仍存在,但/dev/mapper下的设备丢失。为了防止可能的意外,建议还是修改一下lvm的配置文件/etc/lvm/lvm.conf,加入:

types=["device-mapper",1]

7、其他

最简单的测试方法,是用dd往磁盘读写数据,然后用iostat观察各通道的流量和状态,以判断Failover或负载均衡方式是否正常:

# dd if=/dev/zero of=/dev/mapper/mpath0

# iostat -k 2

另外,如果是在由多台服务器构建集群环境中,为了让每台服务器识别的mpathn设备顺序一直,需进行wwid的绑定工作,请参考后面“自定义设备名称”中的内容。

五、答疑

1、为什么黑名单中不直接使用devnode "sda" 呢?

因为按Linux对设备的编号,当设备从sda到sdz时,后一个设备应该是sdaa。而multipath对黑名单的设置是以匹配的方式进行的,也就是说,如果你设置为devnode "sda",那么除了sda为,sdaa、sdab等的设备(通道)都会被加入到黑名单中,而禁止使用。当然,你也可以参考配置文件中的样式,以正规表达式的形式进行描述:devnode "^sda$"。

但考虑到每次重启后,udev分配的盘符可能都不同(没有做udev绑定的情况),所以,我觉得以wwid的方式处理更可靠。

2、为存储定制特定的策略

在前面的配置中,我们已经在/etc/mulitpah.conf中配置了多路径的默认path_grouping_policy为multibus。但有时候,同一台机器上如果连接了一个以上的存储时,可能默认规则并不完全适用。这时,我们可以给特定的存储定制多路径符合的策略。

a、mulipath命令

该命令提供了一个-p的参数,可以修改默认策略,参数有:

-p policy force all maps to specified policy :

failover 1 path per priority group

multibus all paths in 1 priority group

group_by_serial 1 priority group per serial

group_by_prio 1 priority group per priority lvl

group_by_node_name 1 priority group per target node

例如,执行:

# multipath -p failover -v0

有如下结果:

mpath18 (360060e8010463ef004f2b79f00000006)

[size=320 GB][features="0"][hwhandler="0"]

\_ round-robin 0 [prio=2][active]

\_ 5:0:0:6 sdaf 65:240 [active][ready]

\_ 4:0:0:6 sdv 65:80 [active][ready]

\_ round-robin 0 [enabled]

\_ 2:0:0:6 sdb 8:16 [active][ready]

\_ 3:0:0:6 sdl 8:176 [active][ready]

这说明,当你对mpath18设备读写时,sdaf、sdv 会处于active状态,都有数据流,但sdb、sdl 组成的链路是enabled,作为ready情况。这为Failover(主备)情况,仅当sdaf、sdv组成的链路出现问题时,才会切换到sdb、sdl 的链路上。

b、修改配置文件

可以在配置文件中为指定的存储定义策略。首先,可以用multipath -v3 -ll 看看存储的信息,例如,我这里的机器就同时连接了两个不同的存储:

===== path info sdaa (mask 0x5) =====

bus = 1

dev_t = 65:160

size = 10487040

vendor = HITACHI

product = OPEN-V

rev = 6006

h:b:t:l = 2:0:1:24

tgt_node_name = 0x50060e80058e9800

path checker = readsector0 (internal default)

state = 2

uid = 360060e80058e980000008e9800000058 (cache)

===== path info sdaf (mask 0x5) =====

dev_t = 65:240

size = 671088640

product = DF600F

rev = 0000

h:b:t:l = 3:0:0:6

tgt_node_name = 0x50060e8010463ef1

uid = 360060e8010463ef004f2b79f00000006 (cache)

默认情况下,multipath已经支持大部分常见的存储型号(可见multipath.conf.defaults),但不同的multipath版本可能都有些不同。这时,建议参考存储的官方文档:

devices {

device {

vendor "HITACHI" //厂商名称

product "OPEN-V" //产品型号

path_grouping_policy group_by_prio //默认的路径组策略

getuid_callout "/sbin/scsi_id -p 0x80 -g -u -s /block/%n" //获得唯一设备号使用的默认程序

path_checker readsector0 //决定路径状态的方法

path_selector "round-robin 0" //选择那条路径进行下一个IO操作的方法

prio_callout "/sbin/mpath_prio_alua /dev/%n" //获取有限级数值使用的默认程序

failback immediate //故障恢复的模式

hardware_handler "0" //确认用来在路径切换和IO错误时,执行特定的操作的模块。

no_path_retry queue //在disable queue之前系统尝试使用失效路径的次数的数值

rr_min_io 100 //在当前的用户组中,在切换到另外一条路径之前的IO请求的数目

※ 千万不要写错path_checker(可能值有:readsector0,tur,emc_clariion,hp_sw,directio)。 不清楚的,可从存储的官方资料获得。

3、自定义设备名称

默认情况下,multipath会根据multipath.conf.defaults中的定义,生成mpathn的设备名。当然,我们也可以自行定义。不过,更主要的原因是:当我们有多台服务器以相同的方式连接到存储时,每台服务器识别出来的mpathn顺序可能不同。为了组成集群,我们需要固定每台机器识别的设备名顺序是一致的(绑定wwid)。

修改配置文件,加入:

multipaths {

multipath {

wwid 360060e80058e980000008e9800000007

alias mpath0

重新刷新multipath映射表后,mpath0就与该wwid设备一一对应起来。除了别名alias外,还可以为该设备定义其他属性,请参考multipath.conf上的样式。把该配置赋值到其他同一集群的机器上,则每台机器识别的mpathn设备顺序将是一致的。

※ 注意:1、绑定后,需重新生成路径的映射表;2、当加入该wwid绑定后,没有绑定的设备将不能使用,用-ll 也无法看到这些设备,但/var/lib/multipath/bindings 中可见。

4、如何排错

# multipath -v3 -ll

# dmsetup ls

# multipathd -k

> > show config

> >reconfigure

> >show paths

> > CTRL-D

/var/lib/multipath/bindings

/dev/mapper/

# cat /sys/block/sda/device/vendor

# cat /sys/block/sda/device/model

※ 注意:

/var/lib/multipath/bindings显示的内容包括黑名单中的wwid,其mpathn顺序与multipath -ll 的结果可能不同。实际以multipath -ll 的结果为可用设备。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


文章浏览阅读903次。4.清除缓存目录(/var/cache/yum)下的软件包及旧的headers。11.列出所有已安裝但不在 Yum Repository 內的软件包信息。3.清除缓存目录(/var/cache/yum)下旧的 headers。2.清除缓存目录(/var/cache/yum)下的 headers。5.列出所有已安装但不在 Yum Repository 內的软件包。1.清除缓存目录(/var/cache/yum)下的软件包。9.列出所有可更新的软件包信息。3.列出所有可更新的软件包。_centos yum update
文章浏览阅读1.5k次。Python 是一种高级解释性编程语言,已被用于各种应用程序开发,并在近年来获得了巨大的流行。Python 可用于编写广泛的应用程序,包括 Web 开发、数据分析、科学计算、人工智能、游戏等。由于其简单易用,它是初学者的理想语言。Python广泛应用于金融、医疗保健和科技等行业,并且由于其丰富的数据分析和可视化库和工具集而受到数据科学家和研究人员的欢迎。创建本内容时 Python 的最新稳定版本是 Python 3.11。_linux安装python3.11
文章浏览阅读2.6k次。打开终端或控制台,以root或具有sudo权限的用户身份登录。根据你的Linux发行版和网络管理工具的不同,相应的命令可能略有不同。使用以下命令编辑网络配置文件,例如eth0网卡的配置文件:注意:ifcfg-eth0 可能会有不同的命名,根据实机情况确认。在编辑器中,找到以"IPADDR"开头的行,然后修改IP地址。例如,将IP地址更改为192.168.1.100_银河麒麟修改ip地址
文章浏览阅读744次,点赞24次,收藏26次。目标:通过AppSrv为InsideCli客户端网络分配地址,地址池范围:192.168.0.110-192.168.0.190/24。另外一个虚拟网卡改为192.168.0.1给Rserver服务器,添加多一个网卡,用于连接不同的网段分别选刚才选好的两个网段之后,开启各虚拟机,配置IP地址ip addr查看网卡vi /etc/sysconfig/network-scripts/ifcfg-ens33新网卡没有UUID,要生成一个uuidgen然后记下进入文件夹cd /etc/sysconfig/netwo
文章浏览阅读1.1w次,点赞8次,收藏26次。chmod命令来自于英文词组“change mode”的缩写,其功能适用于改变文件或者目录权限的命令。默认只有文件的所有者和管理员可以设置文件权限,普通用户只能管理自己的文件的权限属性。设置权限时可以使用数字法,亦可使用字母表达式,对于目录文件建议加入-R参数进行递归操作,意味着不仅对于目录本身,也对目录内的子文件/目录进行新权限的设定。_chmod修改权限
文章浏览阅读1.2k次。yum源的URL地址,本例中是文件系统的路径,以“file:///”开头。其中,是要安装的软件包的名称。:本节的名称,可以是任何名称,但是必须以“[ ]”括起来。如果能够看到光盘的设备信息,则说明系统已经检测到了光盘。注意:baseurl的值必须是光盘挂载的目录路径。:GPG公钥文件的路径,用于yum包的安全性检查。:yum源是否启用,1表示启用,0表示禁用。:是否进行GPG校验,1表示是,0表示否。打开终端,使用root用户登录。:yum源的名称,可以自定义。_centos挂载光盘
文章浏览阅读1.4k次。这会在系统中安装新的 OpenSSL 版本。如果输出结果中的版本号为 1.1.1 或更高版本,则说明 OpenSSL 已成功升级。然后将新安装的OpenSSL做软连接到这个路径。4.初始化并编译、安装。_centos 升级 openssl
文章浏览阅读4.9k次,点赞5次,收藏11次。[Linux下的软连接、软链接的方式]][[Linux使用的filesystem库来自于c++17提供的新特性]][[Linux下centos查看 GCC 、G++版本]][[Linux 下centos 查看 -std 是否支持 C17 ]]_gcc c++17
文章浏览阅读3.2k次,点赞3次,收藏9次。Linux (centos) 安装Python3.9(保姆级别)_centos安装python3.9
文章浏览阅读5.9k次,点赞4次,收藏4次。进入国内的阿里云的,这里CentOS 7提供了三种ISO镜像文件的下载:DVD ISO、Everything ISO、Minimal ISO。阿里云下载链接: http://mirrors.aliyun.com/centos/点击进入下载页面,随便选择一个下载即可(不推荐,推荐阿里云下载,见下文)阿里云下载站点(速度非常快推荐)_centos7 iso
文章浏览阅读3.9k次。运行报错_inconsistency detected by ld.so: dl-call-libc-early-init.c: 37: _dl_call_lib
文章浏览阅读782次,点赞22次,收藏24次。通过查看INSTALL文件我们可以知道安装glibc2.31的要求,需要binutils版本2.25以上,texinfo版本4.7以上,bison版本2.7以上,sed版本3.02以上,gettext0.10.36以上,Python3.4以上,GDB7.8以上,make版本4.0以上,GCC版本6.2 以上。isl-0.18版本: http://www.mirrorservice.org/sites/sourceware.org/pub/gcc/infrastructure。_rpm 更新glibc2.31
文章浏览阅读905次,点赞19次,收藏16次。操作系统运维相关操作,实用而全面_centos 共享磁盘
文章浏览阅读1.5k次。CentOS Stream的位置提到RHEL上游,解决了“孤儿”的问题。红帽在RHEL上开发的所有功能都已经在CentOS Stream上完成,生态伙伴所添加的内容都将返回到CentOS Stream中,这些新功能会在未来RHEL发布出来,避免了生态伙伴创新消失不见情况的发生,从而保护投资,保护创新。为什么强调位置的变化?红帽的创新得到了CentOS创造者Gregory Kurtzer的肯定,他曾在公开场合表示,红帽做了正确的事情,CentOS Stream的场景比CentOS更好,更适合社区的发展。_dnf: command not found
文章浏览阅读1k次,点赞3次,收藏6次。sysconf:keepalived核心配置文件所在位置,固定位置,改成其他位置则keepalived启动不了,/var/log/messages中会报错。注意:如果在第5步执行 make && make install 时,报如下错误,则可能是keepalived版本号不对,可以试试 2.1.0 以前的版本。4. 进入到解压后的文件夹内,里面会看到 configure 文件,接下来就可以使用 configure 命令进行配置了。2. 通过 ftp工具上传到 linux:/home/software/_服务器双机热备
文章浏览阅读3k次。配置iptables规则,限制用户的出口IP,这里是根据用户的uid去限制的,比如user001用户的uid是1000,配置user001用户的出口IP就是172.17.22.1,以下是示例,根据自己情况修改uid和出口IP。找到auth的配置,默认是注释了的,先放开注释(就是把首行的#去掉),然后把Authentication这列改为u,以下是修改后的截图。打开后是空文件,在这里面添加自己的代理账号和密码,格式:账号+英文空格+密码,以下是例子,自己配置自己的账号。至此恭喜你,完成了所有配置!_站群搭建socks5
文章浏览阅读815次。下载链接:https://github.com/PowerShell/PowerShell/releases。下载链接:https://github.com/PowerShell/PowerShell/_linux中pwsh安装
文章浏览阅读877次,点赞10次,收藏5次。在CentOS系统中,Apache服务器是一个常用的Web服务器软件,它可以高效地提供静态HTTP服务。现在,您已经成功地在CentOS系统中配置了Apache服务器提供静态HTTP服务。启用默认站点:确保在配置文件中启用了默认的站点配置。此外,根据您的需求,您可能还需要进一步配置Apache的其他功能和模块。在配置文件中,您可以进行各种设置以定义您的静态HTTP服务的行为。指令,以定义适当的权限和设置。例如,确保目录的权限设置为适当的读/写/执行权限。指令设置为包含您的静态文件的目录路径。_centos还能用服务器吗
文章浏览阅读676次,点赞71次,收藏64次。简单几步实现在Linux centos环境下安装部署sql server数据库,并结合cpolar内网穿透工具,创建安全隧道将其映射到公网上,获取公网地址,实现在外异地远程连接家里/公司的sqlserver数据库,而无需公网IP,无需设置路由器,亦无需云服务器。
文章浏览阅读5.5k次。在 CentOS 7 中,可以通过以下步骤来开放指定端口号:1、使用 root 或具有管理员权限的用户登录到 CentOS 7 服务器。2、使用防火墙管理工具 firewalld 进行端口开放。 firewalld 是 CentOS 7 默认的防火墙管理工具。3、检查当前防火墙的状态,确保 firewalld 服务已经运行并且正常工作。可以使用以下命令来检查:_centos7开放端口