NoSQL数据库管理系统和模型的比较

介绍

当大多数人想到数据库时,他们通常会想到传统的关系数据库模型,其中包括由行和列组成的表。虽然关系数据库管理系统仍然处理着互联网上的大部分数据,但近年来,随着开发人员寻求绕过关系模型的限制,替代数据模型变得更加普遍。这些非关系数据库模型,各自具有独特的优势、劣势和用例,已被归类为NoSQL数据库

本文将介绍一些常用的NoSQL数据库模型。它将权衡它们的优势和劣势,并提供一些数据库管理系统的示例以及每种数据库的潜在用例。

关系数据库及其限制

数据库是逻辑建模的信息集群,或数据。而数据库管理系统(DBMS)是与数据库交互的计算机程序。DBMS允许您控制对数据库的访问、写入数据、运行查询以及执行与数据库管理相关的任何其他任务。尽管数据库管理系统经常被称为“数据库”,但这两个术语并不完全可互换。数据库可以是任何数据集合,不仅仅是存储在计算机上的数据,而DBMS是允许您与数据库交互的特定软件。

所有数据库管理系统都有一个基础模型,用于结构化数据的存储和访问。关系数据库管理系统(RDBMS)是一种采用关系数据模型的DBMS。在这种模型中,数据被组织成表,在RDBMS的上下文中更正式地称为关系。关系数据库管理系统通常使用结构化查询语言(SQL)来管理和访问数据库中保存的数据。

从历史上看,关系模型一直是管理数据的最广泛使用的方法,直到今天,许多最流行的数据库管理系统实现了关系模型。然而,关系模型存在一些限制,在某些用例中可能会有问题。

例如,横向扩展关系数据库往往很困难。横向扩展,或扩展,是向现有堆栈添加更多机器以分散负载并允许更多流量和更快处理的做法。这通常与纵向扩展相对,后者涉及升级现有服务器的硬件,通常是通过增加更多的RAM或CPU。

横向扩展关系数据库很难的原因在于,关系模型旨在确保一致性,这意味着查询同一数据库的客户端将始终看到最新的数据。如果要在多台机器上横向扩展关系数据库,由于客户端可能向一个节点写入数据而不是其他节点,并且在初始写入和其他节点更新以反映更改之间可能会有延迟,因此很难确保一致性。

RDBMS所提出的另一个限制是,关系模型旨在管理结构化数据,或者与预定义数据类型对齐或至少以某种预定方式组织的数据,使其易于排序和搜索。然而,随着个人计算机的普及和互联网在1990年代初的兴起,非结构化数据 —— 例如电子邮件、照片、视频等 —— 变得更加普遍。

随着这些限制变得更加约束,开发人员开始寻找替代传统关系数据模型的方法,从而导致NoSQL数据库的流行增长。

关于NoSQL

NoSQL这个标签本身有一个相当模糊的定义。"NoSQL"是由Carlo Strozzi于1998年创造的,作为他当时新的NoSQL数据库的名称,之所以选择这个名字,仅仅是因为它不使用SQL来管理数据。

这个术语在2009年之后获得了新的含义,当时Johan Oskarsson组织了一次开发人员聚会,讨论像Cassandra和Voldemort这样的“开源、分布式和非关系数据库”的传播。Oskarsson将这次聚会命名为“NOSQL”,从那时起,这个术语被用作任何不采用关系模型的数据库的总称。有趣的是,Strozzi的NoSQL数据库实际上采用了关系模型,这意味着原始的NoSQL数据库不符合当代NoSQL的定义。

因为"NoSQL"通常指的是不采用关系模型的任何DBMS,所以有几种与NoSQL概念相关的操作数据模型。以下表格包括了几种这样的数据模型,但请注意这不是一个全面的列表:

操作数据模型 示例DBMS
键值存储 Redis,MemcacheDB
列式数据库 Cassandra,Apache HBase
文档存储 MongoDB,Couchbase
图数据库 OrientDB,Neo4j

尽管这些不同的底层数据模型,大多数NoSQL数据库共享几个特征。首先,NoSQL数据库通常被设计为在牺牲一致性的情况下最大化可用性。在这方面,一致性指的是任何读操作将返回数据库中写入的最新数据。在为强一致性设计的分布式数据库中,写入到一个节点的任何数据将立即在所有其他节点上可用;否则,将会发生错误。

相反,NoSQL数据库通常旨在实现最终一致性。这意味着新写入的数据最终(通常在几毫秒内)在数据库的其他节点上可用,尽管不一定是立即可用。这有利于提高数据的可用性:即使您可能看不到最新写入的数据,您仍然可以查看它的早期版本,而不是收到错误。

关系数据库旨在处理符合预定义模式的规范化数据。在DBMS的上下文中,规范化数据是指以一种消除冗余的方式组织数据 —— 这意味着数据库占用尽可能少的存储空间 —— 而模式是数据库中数据结构的概要。

虽然NoSQL数据库能够处理规范化数据,并且能够在预定义模式内对数据进行排序,但它们各自的数据模型通常允许比关系数据库强加的更大的灵活性。因此,NoSQL数据库因为能够更好地存储半结构化和非结构化数据而享有盛誉。然而,考虑到这一点,由于NoSQL数据库没有预定义的模式,通常需要由数据库管理员定义数据应该如何组织和访问,以最符合他们应用程序的方式。

现在您已经了解了NoSQL数据库是什么,以及它们与关系数据库的不同之处,让我们更仔细地看一些更广泛实施的NoSQL数据库模型。

键值数据库

键值数据库,也称为键值存储,通过存储和管理关联数组来工作。关联数组,也称为字典哈希表,由一组键值对组成,其中键作为唯一标识符,用于检索关联的值。值可以是简单对象,如整数或字符串,也可以是更复杂的对象,如 JSON 结构。

与关系数据库相比,后者定义由预定义数据类型的行和列表组成的数据结构,键值数据库将数据存储为单个集合,没有任何结构或关系。连接到数据库服务器后,应用程序可以定义一个键(例如,the_meaning_of_life),并提供一个匹配的值(例如,42),以后可以通过提供键来以相同的方式检索。键值数据库将其中保存的任何数据视为不透明的块;应用程序需要理解数据的结构。

键值数据库通常被描述为高性能、高效和可扩展。键值数据库的常见用例包括缓存、消息队列和会话管理。

一些流行的开源键值数据存储包括:

数据库 描述
Redis 一个内存数据存储,用作数据库、缓存或消息代理,支持各种数据结构,从字符串到位图、流和空间索引。
Memcached 通用内存对象缓存系统,经常用于通过在内存中缓存数据和对象来加速数据驱动的网站和应用程序。
Riak 具有高级本地和多集群复制功能的分布式键值数据库。

列式数据库

列式数据库,有时称为列导向数据库,是将数据存储在列中的数据库系统。这可能与传统的关系数据库类似,但与将列组合成表不同,每个列存储在系统存储中的单独文件或区域中。

列式数据库中存储的数据按记录顺序显示,这意味着一个列中的第一个条目与其他列中的第一个条目相关。这种设计允许查询只读取它们需要的列,而不必读取表中的每一行,并在存储在内存中的不需要的数据后丢弃。

由于每个列中的数据类型相同,它允许各种存储和读取优化策略。特别是,许多列式数据库管理员实施了压缩策略,如游程编码,以最小化单个列占用的空间。这可以带来读取速度的好处,因为查询需要遍历的行数更少。不过,列式数据库的一个缺点是加载性能往往较慢,因为每个列必须单独写入,并且数据通常保持压缩状态。特别是增量加载以及单个记录的读取在性能方面可能代价高昂。

列式数据库自上世纪60年代以来就存在。然而,自2000年代中期以来,列式数据库在数据分析方面变得更加广泛使用,因为列式数据模型非常适合快速查询处理。它们在应用程序需要频繁执行聚合函数(例如查找列中的平均值或总和)的情况下也被视为有利。一些列式数据库管理系统甚至能够使用 SQL 查询。

一些流行的开源列式数据库包括:

数据库 描述
Apache Cassandra 一个设计用于最大化可伸缩性、可用性和性能的列存储。
Apache HBase 支持大量数据的结构化存储的分布式数据库,旨在与 Hadoop 软件库配合使用。
ClickHouse 一个容错的 DBMS,支持实时生成分析数据和 SQL 查询。

文档导向数据库

文档导向数据库,或文档存储,是一种以文档形式存储数据的 NoSQL 数据库。文档存储是键值存储的一种:每个文档都有一个唯一标识符 —— 其键 —— 文档本身作为值。

这两种模型的区别在于,在键值数据库中,数据被视为不透明,数据库不知道或不关心其中保存的数据;应用程序需要理解存储的数据。然而,在文档存储中,每个文档包含一些元数据,为数据提供了一定程度的结构。文档存储通常配备了 API 或查询语言,允许用户根据它们包含的元数据检索文档。它们还允许复杂的数据结构,因为可以在其他文档中嵌套文档。

与关系数据库不同,其中给定对象的信息可能分布在多个表或数据库中,文档导向数据库可以将给定对象的所有数据存储在单个文档中。文档存储通常将数据存储为 JSON、BSON、XML 或 YAML 文档,有些可以存储二进制格式,如 PDF 文档。一些使用 SQL 的变体、全文搜索或它们自己的本机查询语言进行数据检索,而其他一些具有多种查询方法。

近年来,文档导向数据库的流行度大幅增长。由于其灵活的模式,它们在电子商务、博客和分析平台以及内容管理系统中得到了广泛应用。文档存储被认为具有高度可扩展性,分片是一种常见的水平扩展策略。它们还非常适合存储大量无关的、结构不同的复杂信息。

一些流行的开源文档数据库存储包括:

数据库 描述
MongoDB 一个通用的、分布式的文档存储,是世界上目前使用最广泛的文档导向数据库。
Couchbase 最初称为 Membase,一个基于 JSON 的、与 Memcached 兼容的文档数据库存储。作为多模型数据库,Couchbase也可以作为键值存储使用。
Apache CouchDB Apache 软件基金会的一个项目,CouchDB 将数据存储为 JSON 文档,并使用 JavaScript 作为其查询语言。

图数据库

图数据库 可以被视为文档存储模型的一个子类,因为它们将数据存储在文档中,并且不要求数据遵循预定义的模式。然而,不同之处在于图数据库通过突出显示个别文档之间的关系,为文档模型添加了额外的层次。

为了更好地理解图数据库的概念,重要的是要理解以下术语:

  • 节点节点 是图数据库跟踪的个体实体的表示。它在某种程度上相当于关系数据库中的 记录,或者文档存储中的 文档。例如,在一个音乐录制艺术家的图数据库中,一个节点可能代表一个单独的表演者或乐队。
  • 属性属性 是与个别节点相关的相关信息。以我们的录制艺术家示例为基础,一些属性可能是“主唱”,“爵士”,或“白金唱片艺术家”,具体取决于数据库中相关的信息。
  • :也被称为 关系 是表示两个节点如何相关的概念,是图数据库的一个关键概念,它使它们与关系型数据库和文档存储有所不同。边可以是 有向无向
    • 无向:在无向图中,节点之间的边存在只是为了显示它们之间的连接。在这种情况下,边可以被视为“双向”关系 —— 没有暗示一个节点如何与另一个节点相关的差异。
    • 有向:在有向图中,边可以根据关系的起始方向具有不同的含义。在这种情况下,边是“单向”关系。例如,有向图数据库可能指定从 Sammy 到 The Seaweeds 的关系,显示 Sammy 为该乐队制作了一张专辑,但可能不显示从 The Seaweeds 到 Sammy 的等效关系。

由于图数据库如何链接和组织相关信息,某些操作在图数据库中执行起来要简单得多。这些数据库通常用于重要的情况,例如需要能够从数据点之间的关系中获得见解的情况,或者在用户可用的信息取决于他们与其他人的连接的应用程序中。它们在欺诈检测、推荐引擎和身份和访问管理应用程序中得到了广泛的应用。

一些流行的开源图数据库包括:

数据库 描述
Neo4j 一个符合 ACID 的 DBMS,具有本地图存储和处理。截至本文撰写时,Neo4j 是全球最流行的图数据库。
ArangoDB 不仅仅是一个图数据库,ArangoDB 是一个多模型数据库,将图、文档和键值数据模型统一在一个 DBMS 中。它具有 AQL(一种类似于 SQL 的本地查询语言)、全文搜索和排名引擎。
OrientDB 另一个多模型数据库,OrientDB 支持图、文档、键值和对象模型。它支持 SQL 查询和 ACID 事务。

结论

在本教程中,我们只介绍了当今使用的一些 NoSQL 数据模型。一些 NoSQL 模型,如对象存储,多年来已经见证了不同程度的使用,但在某些用例中仍然是关系模型的可行替代方案。其他模型,如对象关系数据库和时间序列数据库,将关系型和 NoSQL 数据模型的元素融合在一起,形成了两端之间的一种中间地带。

NoSQL 数据库类别非常广泛,并且持续不断地发展。如果您对学习更多关于 NoSQL 数据库管理系统和概念感兴趣,我们鼓励您查看我们的 NoSQL 相关内容库。

原文地址:https://blog.csdn.net/xuanunix/article/details/135921278

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


文章浏览阅读752次。关系型数据库关系型数据库是一个结构化的数据库,创建在关系模型(二维表模型)基础上,一般面向于记录SQL语句(标准数据查询语言)就是一种基于关系型数据库的语言,用于执行对关系型数据库中数据的检索和操作主流的关系数据库包括Oracle、Mysql、SQL Server、Microsoft Access、DB2等非关系型数据库NoSQL(nOSQL=Not Only SQL),意思是“不仅仅是SQL”,是非关系型数据库的总称。除了主流的关系型数据库外的数据库,都认为是非关系型主流的NoSQ.._redis是非关系型数据库吗
文章浏览阅读687次,点赞2次,收藏5次。商城系统中,抢购和秒杀是很常见的营销场景,在一定时间内有大量的用户访问商场下单,主要需要解决的问题有两个:1. 高并发对数据库产生的压力;2. 竞争状态下如何解决商品库存超卖;高并发对数据库产生的压力对于第一个问题,使用缓存来处理,避免直接操作数据库,例如使用 Redis。竞争状态下如何解决商品库存超卖对于第二个问题,需要重点说明。常规写法:查询出对应商品的库存,判断库存数量否大于 0,然后执行生成订单等操作,但是在判断库存是否大于 0 处,如果在高并发下就会有问题,导致库存_php库存结余并发
文章浏览阅读1.4k次。MongoTemplate开发spring-data-mongodb提供了MongoTemplate和MongoRepository两种方式访问MongoDB,MongoRepository的方式访问较为简单,MongoTemplate方式较为灵活,这两种方式在Java对于MongoDB的运用中相辅相成。_springboot插入指定的mongodb数据库
文章浏览阅读887次,点赞10次,收藏19次。1.背景介绍1. 背景介绍NoSQL数据库是一种非关系型数据库,它的特点是可以存储非结构化的数据,并且可以处理大量的数据。HBase是一个分布式、可扩展的列式存储系统,它是基于Google的Bigtable设计的。HBase是一个开源的NoSQL数据库,它的核心功能是提供高性能的随机读写访问。在本文中,我们将对比HBase与其他NoSQL数据库,例如Redis、MongoDB、Cass...
文章浏览阅读819次。MongoDB连接失败记录_edentialmechanisn-scram-sha-1
文章浏览阅读470次。mongodb抽取数据到ES,使用ELK内部插件无法获取数据,只能试试monstache抽取mongodb数据,但是monstache需要mongodb replica set 模式才能采集数据。############monstache-compose文件。#replicas set 启动服务。# 默认备份节点不能读写,可以设置。# mydb指的是需要同步的数据库。#登录主mongodb初始化rs。#primary 创建用户。# ip地址注意要修改。# ip地址注意要修改。_monstache csdn
文章浏览阅读913次,点赞4次,收藏5次。storage:fork: trueadmin登录切换数据库注意: use 代表创建并使用,当库中没有数据时默认不显示这个库删除数据库查看表清单> show tables # 或者 > show collections表创建db.createCollection('集合名称', [options])table1字段类型描述capped布尔(可选)如果为 true,则创建固定集合。固定集合是指有着固定大小的集合,当达到最大值时,它会自动覆盖最早的文档。_mongodb5
文章浏览阅读862次。Centos7.9设置MongoDB开机自启(超全教程,一条龙)_mongodb centos开机启动脚本
文章浏览阅读1.3k次,点赞6次,收藏21次。NoSQL数据库使用场景以及架构介绍
文章浏览阅读856次,点赞21次,收藏20次。1.背景介绍1. 背景介绍NoSQL数据库是一种非关系型数据库,它的设计目标是为了解决传统关系型数据库(如MySQL、Oracle等)在处理大量不结构化数据方面的不足。NoSQL数据库可以处理大量数据,具有高性能、高可扩展性和高可用性。但是,与关系型数据库不同,NoSQL数据库没有固定的模式,数据结构也不一定是表格。在NoSQL数据库中,数据存储和查询都是基于键值对、列族、图形等不同的...
文章浏览阅读416次。NoSQL定义:非关系型、分布式、开放源码和具有横向扩展能力的下一代数据库。由c++编写的开源、高性能、无模式的基于分布式文件存储的文档型数据库特点:高性能、高可用性、高扩展性、丰富的查询支持、可替换已完场文档某个指定的数据字段应用场景:社交场景:使用mongodb存储用户信息游戏场景:用户信息,装备积分物流场景:订单信息,订单状态场景操作特点:数据量大;读写操作频繁;价值较低的数据,对事物性要求不高开源、c语言编写、默认端口号6379、key-value形式存在,存储非结构化数据。_nosql
文章浏览阅读1.5k次,点赞3次,收藏2次。Exception in thread "main" redis.clients.jedis.exceptions.JedisConnectionException: Failed to create socket. at redis.clients.jedis.DefaultJedisSocketFactory.createSocket(DefaultJedisSocketFactory.java:110) at redis.clients.jedis.Connection.connect(Conne_redis.clients.jedis.exceptions.jedisconnectionexception: failed to create so
文章浏览阅读6.5k次,点赞3次,收藏12次。readAnyDatabase(在所有数据库上都有读取数据的权限)、readWriteAnyDatabase(在所有数据库上都有读写数据的权限)、userAdminAnyDatabase(在所有数据库上都有管理user的权限)、dbAdminAnyDatabase(管理所有数据库的权限);:clusterAdmin(管理机器的最高权限)、clusterManager(管理和监控集群的权限)、clusterMonitor(监控集群的权限)、hostManager( 管理Server);_mongodb创建用户密码并授权
文章浏览阅读593次。Redis是一个基于内存的键值型NoSQL数据库,在实际生产中有着非常广泛的用处_搭建本地redis
文章浏览阅读919次。Key 的最佳实践[业务名]:[数据名]:[id]足够简短:不超过 44 字节不包含特殊字符Value 的最佳实践:合理的拆分数据,拒绝 BigKey选择合适数据结构Hash 结构的 entry 数量不要超过 1000(默认是 500,如果达到上限则底层会使用哈希表而不是 ZipList,内存占用较多)设置合理的超时时间批量处理的方案:原生的 M 操作Pipeline 批处理注意事项:批处理时不建议一次携带太多命令。Pipeline 的多个命令之间不具备原子性。_redis高级实战
文章浏览阅读1.2k次。MongoDB 递归查询_mongodb数据库 递归
文章浏览阅读1.2k次。通过实际代码例子介绍:如何通过MongoTemplate和MongoRepository操作数据库数据_springboot操作mongodb
文章浏览阅读687次,点赞7次,收藏2次。首先欢迎大家阅读此文档,本文档主要分为三个模块分别是:Redis的介绍及安装、RedisDesktopManager可视化工具的安装、主从(哨兵)模式的配置。_redis 主从配置工具
文章浏览阅读764次。天下武功,无坚不摧,唯快不破!我的名字叫 Redis,全称是 Remote Dictionary Server。有人说,组 CP,除了要了解她外,还要给机会让她了解你。那么,作为开发工程师的你,是否愿意认真阅读此心法抓住机会来了解我,运用到你的系统中提升性能。我遵守 BSD 协议,由意大利人 Salvatore Sanfilippo 使用 C 语言编写的一个基于内存实现的键值型非关系(NoSQL)..._redis 7.2 源码
文章浏览阅读2k次。MongoDB 的增删改查【1】_mongodb $inc