MySQL高可用数据库内核深度优化的四重定制

《MySQL高可用数据库内核深度优化的四重定制》要点:
本文介绍了MySQL高可用数据库内核深度优化的四重定制,希望对您有用。如果有疑问,可以联系我们。

作者介绍

王松磊,现任职于UCloud,从事MySQL数据库内核研发工作.主要负责UCloud云数据库UDB的内核故障排查工作以及数据库新特性的研发工作.

近期我们的数据库团队对原生复制的多个方面进行了深度优化,提升了UDB高可用数据库的功能和性能.今天借社群这个平台,跟大家分享一二.

一、UDB高可用数据库架构

UDB以虚拟IP、HAProxy、单节点UDB数据库搭建双节点高可用架构:

  • 双节点的UDB数据库保证数据库数据的全量冗余,同时保证数据库的可用性;
  • HAProxy在同一时间只连接一个UDB节点,避免多点写入带来的数据冲突问题;
  • 双节点HAProxy保证Proxy的可用性;
  • 虚拟IP在HAProxy发生宕机时通过IP漂移的方式对HAProxy进行切换,用户不需要再次修改IP.

数据库

在上述架构中,从节点UDB的数据是否完整、是否与主库保证数据一致性是整个高可用架构的关键,所以用于数据传输的半同步复制起着至关重要的作用.针对原生的半同步复制,我们作了内核层面的深度优化.

二、UDB数据库深度优化

UDB是以开源数据库MySQL Community Server 5.7.16为基线版本,围绕高可用架构做内核深度优化.

UDB

复制流程,如上图所示,主要经过如下几个步骤:

  • MySQL Server执行SQL成功后,记录binlog;
  • Dump线程读取binlog后,发送到从机IO线程;
  • IO线程将接收到的binlog记录到relay log中,同时记录接收进度到master.info中;
  • SQL读取relay log中的日志内容进行复现,同时记录复制日志的进度到relay-log.info中.

我们在原生复制的基础上做了内核的深度优化,针对上述流程中的部分步骤,在功能和性能上做了改进,使得 UDB更加稳定.

1、Binlog日志复制优化

存在的问题

原生半同步复制存在退化问题,在网络抖动导致超时或者从库追赶主库日志进度时,复制会由半同步复制退化为异步复制.

相比于可靠的半同步复制,异步复制过程中,从库是没有办法感知接收到relay log与主库的binlog是否一致.如果发生宕机,也就没有办法确认从库数据是否与主库一致,是否可以发生数据库切换,这种不确定的情况是我们不希望看到的.

优化方案

建立双通道复制,在原有半同步复制的基础上增加一条UDB复制通道:

  • 建立一条新的复制通道与原有的复制并行,两条通道互相独立;
  • 新的复制通道不传输数据,只传输主库的SQL执行进度 (binlog的文件名和位置);
  • 新的复制通道使用半同步复制协议,但是不退化,超时后重连,只接收最新的SQL执行进度 ;
  • 新的复制通道不存在追补数据的问题,只要网络正常的情况下,从库永远可以感知SQL的执行进度.

MySQL高可用数据库内核深度优化的四重定制

如上图所示,当从库发生宕机或者网络发生故障后,主从复制停止.当从库复制恢复正常后,原生复制通道通过异步复制的方式进行数据追补,UDB复制通道只接收最新的binlog记录位置,这样可以最大限度地减少主从之间异步复制的时间.即在网络可连通的情况下,无论何时发生宕机,从库均知道与主库是否处于数据一致的状态(或者落后了多少).

2、Relay log文件记录的优化

存在的问题

在MySQL中,binlog是以event为基本单位进行记录,以MySQL 5.7 ROW格式(开启GTID)的binlog为例,一个DML(insert)会以5个event的格式记录到binlog中(其他操作均以一个或者多个event组成,不再一一罗列),分别为:

  • GTID_EVENT:记录当前事务的GTID
  • QUERY_EVENT:事务开始
  • TABLE_MAP_EVENT:操作对应的表
  • WRITE_ROW_EVENT:插入记录
  • XID_EVENT:提交事务

全部event组成一个完整的事务,完整的事务才会被SQL线程正确复现到从库上.当前IO线程接收binlog时,是以event为单位进行接收,即接收到一个event,记录到relay log中后再继续接收下一个.这种做法是低效的,也没有充分利用到MySQL本身的文件缓存.

优化方案

优化IO线程记录relay log的方式,将以event为单位记录,修改为以事务为单位进行记录.合并IO线程小的IO操作,提高IO性能.

IO线程

将单个的event写操作合并为多个event统一写操作,将小的IO操作合并成较大的IO操作,提高IO性能.

3、Master.info文件记录的优化

存在的问题

Master.info文件在搭建复制时,记录主库IP、PORT等连接主库的相关信息,在复制过程中,记录IO线程从主库接收到的binlog的文件名和位置,文件和位置会在每次记录relay log成功后更新.

在基于GTID搭建复制后,master.info中记录的binlog文件和位置不再作为复制的依据,所以master.info中记录的binlog的文件和位置不再是有效的数据,也就没有必要每次进行更新.

优化方案

在IO线程记录relay log成功后,更新master.info文件之前,添加判断.如果开启了GTID并且使用GTID作为复制的依据(auto_position=1),那么不再更新master.info中binlog的文件和位置.

其它的master.info操作仍然保留,如change master、shutdown等操作.

4、Relay log锁的优化

存在的问题

在IO线程和SQL线程复制进度相似的情况下,在操作relay log时,会使用同一块文件缓存,在读写文件缓存时,需要加锁来保证操作的正确性.而IO线程和SQL线程需要频繁地读写这块公共内存,就需要对同一把锁频繁的竞争,从而导致性能下降.

优化方案

将IO线程和SQL线程对relay log的操作拆分开来,不再使用同一块文件缓存.虽然这样做会导致SQL线程增加一次读IO操作.但是消除了对锁的竞争,大大地提高了IO线程和SQL线程整体的性能.

SQL线程

三、总结

优化后的复制流程图如下:

流程

数据库原生复制流程中包括记录binlog、记录relay log、记录master.info、relay-log.info等,针对上述流程中的部分步骤以及其它未列出的优化,在功能和性能上进行改进,UDB高可用数据库在功能和性能上均得到了明显的提升.

文章来自微信公众号:DBAplus社群

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


起步 处理器架构,参考 x86是指intel的开发的一种32位指令集 intel和amd早期的cpu都支持这种指令集 AMD比Intel率先制造出了商用的兼容x86的CPU,AMD称之为AMD64 Intel选择了设计一种不兼容x86的全新64为指令集,称之为IA-64,后来支持AMD64的指令集,
pscp pscp -P 22 C:\work\test.txt root@192.168.1.5:/home/data pscp -P 22 root@192.168.1.5:/home/data/test.txt C://work// 检索 find / -name default.config
文件处理 ls -a # 显示所有文件 ls -l # 显示详细信息 ls -d # 显示路径 mkdir /目录名称 # 创建目录 cd /目录名称 # 切换目录 pwd # 显示当前路径 rmdir /目录名称 # 删除目录 cp -rp [目录名称] [目标目录] # 复制目录到目标目录 cp
准备一台电脑(我就用联想拯救者r7000演示) 参考博客制作启动盘 插上U盘,启动电脑,一直按F2 进入如下页面后,将U盘设置为第一启动项,点击exit,保存并退出 之后进入如下页面,选择第三项 进入如下页面,选择第四项 进入如下页面,选择第一项,选中后,先不要点Enter 按e键,将inst.st
认识 Linux系统是参考了UNIX系统作为模板开发的,但没有使用UNIX的代码;是UNIX的一种,但不是衍生版 在Linux内核的基础上开发是发行版 分区 逻辑分区永远从5开始 步骤 挂载:可理解为分配盘符,挂载点即是盘符名;不同之处:Linux中是以空目录名称作为盘符 Hda 第一块硬盘 Hda
文件处理命令 以 . 开头的文件是隐藏文件 以 - 开头表示这是一个文件 以 d 开头表示是一个目录 以 l 开头表示是一个软链接 第一个root是所有者,第二个root是所属组 ls -h 以文件默认大小后缀 显示 ls -i 查看i节点(唯一标识) 所有者:只能有一个,可变更 所属组:只能有一个
参考 01 02 03 前提环境 本地安装VirtualBox,并安装CentOS8,配置网络后,window系统上putty能连接到CentOS8服务器 配置步骤 右键服务器复制 启动复制后的服务器,查看ip和hostname发现和原来的服务器一样,需要修改 hostname # 查看主机名 vi
文件搜索命令 星号匹配任意字符,问号匹配任意单个字符 -iname 根据文件名查找且不区分大小写 -ok 命名会有一个询问的步骤 如果没有找到指定文件,可输入命令:updatedb 更新文件资料库;除tmp目录不在文件资料库收录范围之内 locate -i 文件名 # 检索时不区分大小写 which
安装环境 安装最新版的Virtual Box,点击安装 下载centos8镜像 创建虚拟机,可参考 选择下载到本地的镜像 设置启动顺序 点击启动 启动过程中报错:“FATAL:No bootable medium found!” 1.没有选择iso镜像 2.光驱没有排在第一位置 3.镜像只能选择x8
Linux严格区分大小写 所有内容文件形式保存,包括硬件 Linux不靠扩展名区分文件类型 挂载:将设备文件名和挂载点(盘符)连接的过程 Linux各个目录的作用 bin表示二进制 服务器注意事项 远程服务器不允许关机,只能重启 重启时应该关闭服务 不要在服务器访问高峰运行高负载命令 远程配置防火墙
IDE连接Linux,上传下载文件 参考1 参考2 连接Linux 上传下载文件 本地项目打包后上传 查看是否上传成功,右键下载 补充 后端项目开发完成后,需clean掉临时文件target文件夹,且只推送修改过的文件 前端项目开发的过程中,需要在每个子组件中使用scoped,确保每个子组件中的编码
起步 LTS与普通版本的区别 LTS版本的发布周期更长,更加稳定 安装jdk sudo mkdir /usr/lib/jvm # 在Ubuntu中创建目录 pscp D:\安装包\linux源码包\jdk-8u291-linux-x64.tar.gz chnq@192.168.0.102:/tmp
前言 最近在b站上看了兄弟连老师的Linux教程,非常适合入门:https://www.bilibili.com/video/BV1mW411i7Qf 看完后就自己来试着玩下,正好手上有台空闲的电脑就尝试不使用虚拟机的方式安装Linux系统 安装步骤 制作启动盘 下载ISO镜像,我这里下载的是Cen
新建虚拟电脑 设置内存和处理器 设置硬盘大小 完成 设置 查看光驱 设置启动顺序 点击启动 选择第1项 进入图形安装界面 选择安装位置,开始安装 设置root密码 重启 登录 查看本地文件夹 配置网络,点击设置 查看宿主机ip C:\Users\ychen λ ipconfig 无线局域网适配器 W
源码包安装需手动下载后安装 二进制包则在package目录下 rpm命令管理rpm包 若某个rpm包依赖于某个模块,需要到网站www.rpmfind.net查询该模块依赖的包,安装这个包后自动安装模块,之后就能安装rpm包了 安装升级时使用包全名 查询卸载时使用包名 虚拟机中的Linux系统安装rp
首先进入命令模式,再输入以下命令 命令模式用于输入命令 插入模式可对文件编写操作 编辑模式下的命令是在冒号后输入 :12, 15d # 删除指定范围的行,这里是删除12到15行 :n1,n2s/old/new/g ## 表示从n1行到n2行,old表示旧的字符串 vim使用小技巧:自定义快捷键,如快
使用源码包安装,需要自己指定安装位置,通常是 /usr/local/软件名/ linux中要想启动执行文件,应使用绝对路径 /绝对路径/rpm包名 start ## 执行方式一 service rpm包名 start ## 执行方式二 使用源码包安装后,由于自定义安装路径,就不能使用service命
网络命令 在收邮件的用户中,输入 mail 可查看邮件信息,输入序列号查看详细信息 在mail命令下,输入h 查看所有邮件的列表 输入:d 序列号 # 删除邮件 last # 统计所有用户登录或重启时间,用于日志查询 lastlog # 显示包括未登录用户的登录时间 lastlog -u 用户id
若要使用yum管理,必须能连接网络,首先配置网络IP 进入yum源文件中启动容器 使用yum源头安装rpm包不需要进入package路径,同时也不需要使用包全名,会有yum自动管理 安装软件组
简介 client即是本机安装的docker,相当于git Docker_host相当于centos系统 registry则是docker仓库,相当于GitHub 镜像用于创建docker容器,一个镜像可以创建多个docker容器 容器是由镜像创建的运行实例,(镜像相当于类,容器相当于类创建的对象)