【参天引擎】华为参天引擎内核架构专栏开始更新了,多主分布式数据库的特点,类oracle RAC国产数据开始出现了

cantian引擎的介绍

专栏内容

  • 参天引擎内核架构
    本专栏一起来聊聊参天引擎内核架构,以及如何实现多机的数据库节点的多读多写,与传统主备,MPP的区别,技术难点的分析,数据元数据同步,多主节点的情况下对故障容灾的支持。

  • 手写数据库toadb
    本专栏主要介绍如何从零开发,开发的步骤,以及开发过程中的涉及的原理,遇到的问题等,让大家能跟上并且可以一起开发,让每个需要的人成为参与者。
    本专栏会定期更新,对应的代码也会定期更新,每个阶段的代码会打上tag,方便阶段学习。

开源贡献

个人主页我的主页
管理社区开源数据库
座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物.

前言

国内数据库的发展如火如荼,每年的各种大会都会听到好消息,今年除了数据库本身的各种技术演进之外,华为发布了参天引擎,而且是做为数据库的一种基座形式,也就是所有数据库可以在参天引擎基础上,构建形成多主分布式架构的数据库系统,这也就是它叫引擎的目的。

本专栏就来详细聊一聊参天引擎内部架构,以及如何适配参天引擎。

概述

据华为官网发布的新闻,题为:华为宣布CANTIAN引擎开源,携手共建数据库存储新生态,已经有万里数据库适配完成,万里数据库是基于mysql,也就是说mysql与参天引擎结合成功,达到了分布式数据库集群,基于共享存储的多主效果。

华为在数据库方向上开源了GuassDB之后,又宣布开始了参天引擎,这又是什么神器呢,今天我们就一起来看一看。

cantian引擎是什么

随着数据库国产化的推进,基础模型的数据库大多都与国外品牌有了对标产品,比如说主从,延伸出来的一主多从,读写分离等,已经很成熟,也有很多中间键可以应用开源数据库mysql,postgresql都有类型部署模式;

还有MPP模式,也就是元数据在master节点,通过切片将实际数据放在worker节点,已经有开源的citus,greenplum等数据库支持;

但是对于数据库巨头oracle的 oracle RAC产品对标产品一直没有进展,也就是说它还不能被很好的替代。

oracle RAC主要特点是高可用,不是其它一些模型能达到了,而华为cantian引擎的出现,就是干了这么一件事,可以对标oracle RAC了。

基于共享存储的架构

oracle RAC其实是一种基于共享存储的分布式集群架构,从上图可以看到,集群中的每个数据库节点都访问同一份相同的数据,同时每个数据库节点都可以进行读写操作,比如两个节点上同时可以对同一张表进行插入数据操作。

这种架构模型下,集群中一个节点故障后,其它节点完全可以接管所有业务。

参天引擎的目标是让数据库具有“分布式架构+集中式体验”的多主架构数据库,它通过client,server,存储三层,将传统单机数据库,如mysql,postgresql与client进行结合,从而改造成多主的分布式集群式数据库。

换句话说,参天引擎可以是一种标准服务,只要数据库系统与client进行改造对接后,就可以使用server,存储层,这样就可以支持多主的分布式架构。

多主分布式架构的特点

oracle RAC类型的共享存储下的分布式数据库,有什么特点,或者它的优势在那里呢?

在历年的oracle RAC白皮书中反复提到这几个特性,而且对它们进行持继的更新演进,当然也是多主分布式架构的最核心特点。

高可用

集群中的多个节点完全对称,也就是任意两个节点是一模一样的,这就是说业务可以运行在任意节点上,真实使用时只是通过负载均衡将业务分散到了各节点上,使负载达到了均衡。

各节点对称,这一特性使得当任意节点故障时,业务可以立马转移到其它节点上,这与主从架构,MPP架构完全不同。

主从架构中,只有主具有处理所有业务的能力,从节点具有处理只读业务的能力,当主节点故障时,需要重新选主,再进行业务切换;

而MPP架构中,特点区分更加明显,它具有两个节点角色,对于master角色的节点,只存储元数据,也即数据分布信息,它的高可用一般也采用一主多从的形式,故障时处理与主从是一样的;而对于worker角色的节点,它们存储了一部分分片的数据,它们一般通过多副本机制达到冗余备份的高可用,故障节点的数量不能超过副本数量,副本越多管理成本越高。

按照oracle RAC最新的版本,这个故障处理的能力已经非常丝滑,可以达到事务级别的转移,这在其它两个架构,由于架构的限制很难做到。

在这里插入图片描述

业务连续性的用户体验,这在一些关键应用中体现非常重要,这里借用oracle rac技术白皮书中的一张图来说明。

扩展性

当然对于多主架构,集群中增加一个节点,业务负载就可以立即分担;同样减少一个节点时,对应业务负载也可以转移到剩余节点上。有点像现在的云部署的感觉,通过自动化的控制,完全可以按照业务负载调整资源的使用情况。

当然,这在其它架构也是很难达到的。

应用无修改

经过几年的数据库国产化后,这一点体验比较深刻,现在都会支持单机,主从,MPP部署,但这三种都需要应用能够做一些适配,尤其MPP部署,需要这种应用的业务要完全适合此种架构,就有很多限制,比如复杂联合查询就要特别当心了,最好提前能够整改了。

而对于多主分布式架构,这些情况都不存在,不需要区分只读,读写业务,也不需要担心SQL的不支持,单机部署也开发正确,在多主分布式架构下就是可以的;

这大大简化了业务应用的开发,同时对于业务应用架构设计的成本也降低了,不需要对每种数据库的限制深入了解。

多主分布式架构的技术难点

多主的分布式架构为什么迟迟在国内没有大的推进呢,它主要有几大技术难点,每个难度都是一个重量型的开发,所以对企业,尤其是资本业讲,很难在短期得到收益。

数据库元数据的同步

对于多主的分布式系统,最先面临的就是元数据的多机同步,数据库也是一样,在多写的情况下,每个节点都会产生元数据,需要实时同步。

数据库分布式锁

多节点如果访问同一数据元素时,需要进行加锁,那这个锁不再是单机系统下的某个内核变量,而是要扩展到分布式下多节点间的锁,在多节点起到加锁互斥的效果。当然在分布式下有很多实践,但是数据库这样高频使用场景下,如何能提高性能是不得不考虑的问题。

多节点事务一致性

数据库概念专栏,分享并发控制的可串行化相关内容,那些都是单机架构下的,如何在多节点时做到事务的并发一致性,需要将封锁,时间戳,有效性确认几种方式扩展到多节点。

其中事务号,也就是事务时间戳的实现,就有好几种方式,如时钟,统一分发的序号等等。

多写下的恢复

多个节点都可以写入数据,那么故障时,如何恢复,数据的一致性又如何保障呢?

比如两个节点修改了数据,它们的先后顺序的确定,单机也是由日志的时间戳方式进行排序,而多机时,如何使用统一的日志,那竞争必然加大。

数据库概念专栏中对于恢复,分享了几种技术,如redo,checkpoint等,那对于redo,checkpoint都需要日志先落盘,或者对日志进行回收处理,在多节点间如何保障日志先于数据落盘。

多机共享文件系统

当然以上各点都是对于数据库来讲的,对于基于共享存储的多主分布式架构,还有一个重要的技术难点,就是文件系统。

假如多个节点同时对一个表文件进行写入,或者扩展,传统的ext4,xfs肯定是不行的,多节点各自部署在独立的服务器上,对应着多个操作系统,各自的文件系统元数据是不交互的,此时就会混乱。

而对于分布式文件系统,一般都会将元数据缓存在客户端,也就是每个使用者的机器上,会导致更新不及时。

参天引擎可以做什么

从华为官方发布的消息来看,已经与厂商合作适配成功了,也达到了多主分布式集群的效果,从其它媒体发布的消息来看,测试的数据还是不错。

目前看起来对于mysql进行了适配,另一个主流开源数据库postgresql还没有看到消息,其它也没有看到更多介绍的文档。

既然开源了,那接下来我们就从源码角度看看,参天引擎可以做什么,拿postgresql来适配的话,难度会有多少。

结尾

非常感谢大家的支持,在浏览的同时别忘了留下您宝贵的评论,如果觉得值得鼓励,请点赞,收藏,我会更加努力!

作者邮箱:study@senllang.onaliyun.com
如有错误或者疏漏欢迎指出,互相学习。

原文地址:https://blog.csdn.net/senllang/article/details/134915474

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


文章浏览阅读773次,点赞6次,收藏9次。【代码】c# json字符串转Oracle的insert into的小程序。
文章浏览阅读8.7k次,点赞2次,收藏17次。此现象一般定位到远端的监听服务来找问题,在远端查看监听服务状态(具体看下面的解决方案会详细呈现),服务是否开启,另外查看监听端点概要是否存在host未指向到计算名的,如无直接进入监听配置文件listener.ora内添加指向即可。2、查看监听服务状态 lsnrctl status,右边为远端端点状态,未添加host指向到计算名;1、本地及远端安装好Oracle并配置好连接,Oracle服务和监听已启动;1、远程Oracle数据库:Oracle11g R2。或者进入下述服务手动重启。,再进行远程连接即可。_ora-12541:tns:无监听程序
文章浏览阅读2.8k次。mysql脚本转化为oracle脚本_mysql建表语句转oracle
文章浏览阅读2.2k次。cx_Oracle报错:cx_Oracle DatabaseError: DPI-1047: Cannot locate a 64-bit Oracle Client library_cx_oracle.databaseerror: dpi-1047: cannot locate a 64-bit oracle client libr
文章浏览阅读1.1k次,点赞38次,收藏35次。本文深入探讨了Oracle数据库的核心要素,包括体系结构、存储结构以及各类参数。通过解析Oracle数据库的体系结构,读者可以深入了解其内部组成和工作原理。存储结构部分介绍了数据在Oracle中的存储方式,从表空间到数据文件的层层逻辑。最后,我们深入探讨了Oracle数据库中各类参数的作用和配置方法,帮助读者更好地理解和优化数据库性能。本文旨在帮助读者全面理解Oracle数据库的运作机制,为其在实践中的应用提供基础和指导。
文章浏览阅读1.5k次。默认自动收集统计信息的时间为晚上10点(周一到周五,4个小时),早上6点(周六,周日,20个小时)由于平时默认每天只收集4小时,时间有点短了,改成每天可收集8小时。oracle 18c中默认是打开的。查看当前自动收集统计信息的时间。_oracle自动收集统计信息
文章浏览阅读929次,点赞18次,收藏20次。只有assm(Automatic Shared Memory Management)模式可以使用大页,需要关闭amm(Memory Manager Process)HugePages_Free: 306 (空闲306页,已使用306-306=0页)防止oracle使用的内存交换,所以设置的大小与oracle配置的sga、pga相关。HugePages_Rsvd: 0 (操作系统承诺给oracle预留的页数)HugePages_Total: 306 (总共306页)_oracle11g 大页
文章浏览阅读801次。例如:10046:0,1,4,8,12。默认redo日志有三个,大小为50M,循环覆盖使用。redo log再覆盖之前,会被归档,形成归档日志。答:不同事件,不同级别。trace的不同级别?_oracle 日志
文章浏览阅读4.2k次,点赞84次,收藏77次。主要讲解MySQL中SQL的DDL语句,其中包括对数据库和表的一系列操作。_sql ddl 新增字段 mysql
文章浏览阅读1.1k次。ON DEMAND:仅在该物化视图“需要”被刷新了,才进行刷新(REFRESH),即更新物化视图,以保证和基表数据的一致性;ON COMMIT:一旦基表有了COMMIT,即事务提交,则立刻刷新,立刻更新物化视图,使得数据和基表一致。Method =>'C',物化视图有三种刷新方式:COMPLETE、FAST和FORCE。物化视图会占用空间,一半可用于大量数据查询时,减缓主表的查询压力使用。例如创建一个物化视图,让对接单位查询。_oracle物化视图定时刷新
文章浏览阅读713次,点赞21次,收藏18次。1.背景介绍在当今的大数据时代,数据量越来越大,传统的关系型数据库已经无法满足业务需求。因此,NoSQL数据库技术迅速崛起,成为企业和开发者的首选。Oracle NoSQL Database是Oracle公司推出的一款分布式NoSQL数据库产品,具有高性能、高可用性和易于扩展等特点。在本文中,我们将深入了解Oracle NoSQL Database的集成与开发者工具,帮助您更好地掌握这款产品的...
文章浏览阅读2.5k次,点赞2次,收藏4次。今天遇见一个问题需要将字段中包含中文字符串的筛选出来。_oracle查询包含中文字符
文章浏览阅读802次。arcmap 在oracle删除表重新创建提示表名存在解决放啊
文章浏览阅读4.3k次,点赞2次,收藏4次。Oracle连接数据库提示 ORA-12638:身份证明检索失败_ora-12638
文章浏览阅读3.4k次,点赞6次,收藏25次。etc/profile是一个全局配置文件,所有用户登录都会使用该文件构建用户环境。与windows配置环境变量是一个道理。选择Linux系统,找到适合自己系统的安装包,我的是CentOS 8 x64。接下来需要登陆Oracle账户才能下载,无账户的可以自己注册一个。Linux中export 命令用于设置或显示环境变量。模式,利用上下键到文档最后,添加以下代码。出现如图所示版本号字样,则说明安装成功。点击下载,勾选1,点击2。记住完整路径用于后面配置。找到Java并点击进去。往下翻,找到Java8。_linux安装jdk1.8
文章浏览阅读2.4w次,点赞26次,收藏109次。JDK 是的简称,也就是 Java 开发工具包。JDK 是整个 Java 的核心,其中JDK包含了 Java 运行环境(Java Runtime Envirnment,简称 JRE),Java 工具(比如 javac、java、javap 等等),以及 Java 基础类库(比如 rt.jar)。最主流的 JDK 是Oracle公司发布的 JDK,除了 Oracle JDK(商业化,更稳定)之外,还有很多公司和组织开发了属于自己的 JDK,比较有名的有IBM JDK(更适合 IBM) 和OpenJDK。_jdk安装教程
文章浏览阅读7.5w次。出现 “java.sql.SQLNonTransientConnectionException:Could not create connection to database server” 的错误通常是由于无法连接到数据库服务器引起的。_java.sql.sqlnontransientconnectionexception: could not create connection to
文章浏览阅读849次,点赞7次,收藏10次。在ClickHouse中创建用户、数据库并进行权限分配是一个重要的管理任务,它涉及到安全性和访问控制。下面是一个基本的指南来帮助你完成这些操作:1. 创建数据库首先,需要创建一个数据库。使用以下命令:CREATE DATABASE IF NOT EXISTS your_database_name;将 your_database_name 替换为你想要的数据库名。2. 创建用户接下来,创建一个新用户。使用以下命令:CREATE USER your_username IDENTIFIED WIT_在clickhouse中如何创建用户 赋权
文章浏览阅读1.2k次,点赞53次,收藏39次。本文是一篇关于Oracle数据库安装和使用的博文摘要。作者以轻松幽默的笔调介绍了自己在实验中掌握的Oracle数据库基本操作,包括使用组件查看命令、配置数据库监听器等。作者也分享了在实验中遇到的一些有趣问题,如SQL语句缺少分号导致的意外错误。此外,作者还强调了登录sys用户和启动实例加载数据库的注意事项,并鼓励读者面对挑战时保持乐观,不断提升自己的能力。整体风格风趣严谨,引人入胜。
文章浏览阅读820次,点赞17次,收藏16次。KingbaseES、xml、dbms_xmlgen、SETSKIPROWS、人大金仓、KingbaseES兼容Oracle包dbms_xmlgen的功能是通过SQL查询将关系表中数据转化为XML文档。转化方式一共有两种:(1)通过查询字符串直接转化。(2)通过上下文句柄转化。对于通过查询字符串直接转化的方式,无法跳过若干行进行查询,只能直接将表格中的所有数据转化为XML文档。