如何为自己的应用选择数据库?有这些考虑因素

节选翻译自 Michal Toiba 的博客

微软前不久宣布推出分布式关系数据库 Azure Cosmos DB for PostgreSQL,使 Azure 成为第一个在单一数据库服务中同时支持关系和 NoSQL(非关系)数据的云平台。这意味着 Azure Cosmos DB 开发者在构建云原生应用时拥有极大的灵活性——使用 Azure Cosmos DB 自己的 NoSQL 数据库以及其他数据库(比如 MongoDB 和 Apache Cassandra),或者使用越来越流行的 PostgreSQL 工具和扩展来处理关系数据。那么问题来了,您如何为自己的应用选择数据库?本文将通过探讨开发者在构建应用时应考虑的一些主要因素来深入探讨。

按照传统来讲,答案很简单:如果开发者需要大规模实现高吞吐量,或非常大的数据库,或两者都需要,那么他们会选择 NoSQL 数据库。由于关系数据库一般只会向上扩展,不会向外扩展,因此会达到一个极限,并且一旦超过这个极限就无法处理更多的请求或数据。因此,开发者会普遍选择 NoSQL 数据库进行水平扩展。而如果开发者需要应用的 ACID 合规性和数据准确性,他们则会选择关系数据库。

随着 Azure Cosmos DB for PostgreSQL 等分布式关系数据库的推出,现在可以两全其美了——开发者可以享受 NoSQL 数据库的横向扩展能力、灵活性和性能,以及关系数据库的 ACID 合规性和丰富的 SQL 查询。

决定使用哪个数据库时要考虑的因素

何时使用哪个数据库系统通常取决于用例和各种考虑因素,例如数据库结构、并发性、查询、可扩展性和迁移等等。

请注意,没有开发者的工作负载会只属于上表中的某一个类别,需要根据实际情况进行权衡。我们将在下面查看其中的一些注意事项。

数据库结构

如果您的数据是半结构化或非结构化的,并且工作负载需要大规模可预测的延迟,那么您应该考虑使用 NoSQL 数据库。例如,随着客户群的增长,需要快速响应时间和可预测的低延迟的个性化或推荐引擎。NoSQL 数据库可以大规模处理来自各种来源的不同类型的数据,并为持续创新和改善客户体验提供高度的灵活性。

如果您的数据是结构化的、具有固定的架构,并且您的工作负载需要事务一致性,那么关系数据库是一个不错的选择。例如,金融应用程序具有高度结构化的数据并且需要数据完整性。关系数据库提供了在保持 ACID 属性的同时快速扩展的能力。

并发

如果您的工作负载是动态的、不可预测的并且可以访问大量数据,例如物联网和设备传感器应用程序,请考虑使用 NoSQL 数据库。NoSQL 数据库非常适合这些类型的应用程序,因为它们发送大量数据并且通常全天候运行。这些应用受益于 NoSQL 数据库的即时可扩展性和弹性,这是处理写入密集型数据摄取所必需的。对于存储设备读出的系统,您可能不需要 ACID 保证,但需要从不同设备写入数据库的写入乘法性能。例如,每 5 分钟读取一次温度的智能温度计。假设你有一千个温度计,但只有几百个用户在看它们,意味着你的写入比读取多得多,这使得 NoSQL 数据库成为理想选择。

另一方面,假设您的写入次数较少,读取次数较多,比如在社交媒体应用中,某个受欢迎的人正在发布内容。如果您可以将查询分为只读查询和写入查询,在关系数据库中可能会更容易,其中写入可以由一台机器处理,然后您可以无限制地扩展读取并且不会丢失 ACID 特性。因此,如果您的工作负载量是每秒数千个事务,例如每秒更新数千次和每秒读取数万次的社交媒体应用,那么关系数据库可能是个不错的选择,具有可扩展副本的集群可以支持这一点。

查询

NoSQL 数据库非常适合数据关系可以去规范化和具体化的应用程序。通过去规范化,需要更少的表连接,可以更快地执行查询和检索数据,这使得 NoSQL 数据库成为需要实时分析和具有大数据集的工作负载(例如欺诈检测应用程序)的强大选择。NoSQL 数据库与模式无关,开发者可以灵活地利用来自多个来源的数据并实时检测异常。

规范化和定义的约束有助于加强数据完整性和安全性,并避免数据重复。关系数据库非常适合这些类型的应用程序,因为它们基于不同数据项之间的关系,能够进行复杂的查询和数据分析。

可扩展性

如果您的工作负载需要高可用性并且具有需要低延迟数据访问的地理分布用户,可以考虑使用 NoSQL 数据库。例如,NoSQL 系统非常适合具有庞大且不断增长的目录和库存的在线零售/电子商务应用程序。

正如本文开头提到的,分布式关系数据库或分布式 SQL 数据库是一类新兴的数据库系统,它结合了 NoSQL 系统的横向扩展特性和关系数据库的 ACID 特性。在 Azure Cosmos DB 中,分布式 PostgreSQL 支持允许企业处理大量数据并扩展操作工作负载,以在机器上的集群上执行,完全符合 ACID 标准。

可以受益于分布式 PostgreSQL 功能的一组应用程序是多租户 SaaS。正在构建多租户应用程序的数字原住民可以将 Postgres 扩展到数百万租户,而无需重新构建他们的应用程序。他们可以受益于具有高可用性的租户隔离等功能,随着应用程序的增长优化成本和性能。

了解 Azure Cosmos DB 的 NoSQL 和关系功能的更多信息,点我查看我们的官方文档~

原文地址:https://blog.csdn.net/helendemeng/article/details/128970659

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


文章浏览阅读752次。关系型数据库关系型数据库是一个结构化的数据库,创建在关系模型(二维表模型)基础上,一般面向于记录SQL语句(标准数据查询语言)就是一种基于关系型数据库的语言,用于执行对关系型数据库中数据的检索和操作主流的关系数据库包括Oracle、Mysql、SQL Server、Microsoft Access、DB2等非关系型数据库NoSQL(nOSQL=Not Only SQL),意思是“不仅仅是SQL”,是非关系型数据库的总称。除了主流的关系型数据库外的数据库,都认为是非关系型主流的NoSQ.._redis是非关系型数据库吗
文章浏览阅读687次,点赞2次,收藏5次。商城系统中,抢购和秒杀是很常见的营销场景,在一定时间内有大量的用户访问商场下单,主要需要解决的问题有两个:1. 高并发对数据库产生的压力;2. 竞争状态下如何解决商品库存超卖;高并发对数据库产生的压力对于第一个问题,使用缓存来处理,避免直接操作数据库,例如使用 Redis。竞争状态下如何解决商品库存超卖对于第二个问题,需要重点说明。常规写法:查询出对应商品的库存,判断库存数量否大于 0,然后执行生成订单等操作,但是在判断库存是否大于 0 处,如果在高并发下就会有问题,导致库存_php库存结余并发
文章浏览阅读1.4k次。MongoTemplate开发spring-data-mongodb提供了MongoTemplate和MongoRepository两种方式访问MongoDB,MongoRepository的方式访问较为简单,MongoTemplate方式较为灵活,这两种方式在Java对于MongoDB的运用中相辅相成。_springboot插入指定的mongodb数据库
文章浏览阅读887次,点赞10次,收藏19次。1.背景介绍1. 背景介绍NoSQL数据库是一种非关系型数据库,它的特点是可以存储非结构化的数据,并且可以处理大量的数据。HBase是一个分布式、可扩展的列式存储系统,它是基于Google的Bigtable设计的。HBase是一个开源的NoSQL数据库,它的核心功能是提供高性能的随机读写访问。在本文中,我们将对比HBase与其他NoSQL数据库,例如Redis、MongoDB、Cass...
文章浏览阅读819次。MongoDB连接失败记录_edentialmechanisn-scram-sha-1
文章浏览阅读470次。mongodb抽取数据到ES,使用ELK内部插件无法获取数据,只能试试monstache抽取mongodb数据,但是monstache需要mongodb replica set 模式才能采集数据。############monstache-compose文件。#replicas set 启动服务。# 默认备份节点不能读写,可以设置。# mydb指的是需要同步的数据库。#登录主mongodb初始化rs。#primary 创建用户。# ip地址注意要修改。# ip地址注意要修改。_monstache csdn
文章浏览阅读913次,点赞4次,收藏5次。storage:fork: trueadmin登录切换数据库注意: use 代表创建并使用,当库中没有数据时默认不显示这个库删除数据库查看表清单> show tables # 或者 > show collections表创建db.createCollection('集合名称', [options])table1字段类型描述capped布尔(可选)如果为 true,则创建固定集合。固定集合是指有着固定大小的集合,当达到最大值时,它会自动覆盖最早的文档。_mongodb5
文章浏览阅读862次。Centos7.9设置MongoDB开机自启(超全教程,一条龙)_mongodb centos开机启动脚本
文章浏览阅读1.3k次,点赞6次,收藏21次。NoSQL数据库使用场景以及架构介绍
文章浏览阅读856次,点赞21次,收藏20次。1.背景介绍1. 背景介绍NoSQL数据库是一种非关系型数据库,它的设计目标是为了解决传统关系型数据库(如MySQL、Oracle等)在处理大量不结构化数据方面的不足。NoSQL数据库可以处理大量数据,具有高性能、高可扩展性和高可用性。但是,与关系型数据库不同,NoSQL数据库没有固定的模式,数据结构也不一定是表格。在NoSQL数据库中,数据存储和查询都是基于键值对、列族、图形等不同的...
文章浏览阅读416次。NoSQL定义:非关系型、分布式、开放源码和具有横向扩展能力的下一代数据库。由c++编写的开源、高性能、无模式的基于分布式文件存储的文档型数据库特点:高性能、高可用性、高扩展性、丰富的查询支持、可替换已完场文档某个指定的数据字段应用场景:社交场景:使用mongodb存储用户信息游戏场景:用户信息,装备积分物流场景:订单信息,订单状态场景操作特点:数据量大;读写操作频繁;价值较低的数据,对事物性要求不高开源、c语言编写、默认端口号6379、key-value形式存在,存储非结构化数据。_nosql
文章浏览阅读1.5k次,点赞3次,收藏2次。Exception in thread "main" redis.clients.jedis.exceptions.JedisConnectionException: Failed to create socket. at redis.clients.jedis.DefaultJedisSocketFactory.createSocket(DefaultJedisSocketFactory.java:110) at redis.clients.jedis.Connection.connect(Conne_redis.clients.jedis.exceptions.jedisconnectionexception: failed to create so
文章浏览阅读6.5k次,点赞3次,收藏12次。readAnyDatabase(在所有数据库上都有读取数据的权限)、readWriteAnyDatabase(在所有数据库上都有读写数据的权限)、userAdminAnyDatabase(在所有数据库上都有管理user的权限)、dbAdminAnyDatabase(管理所有数据库的权限);:clusterAdmin(管理机器的最高权限)、clusterManager(管理和监控集群的权限)、clusterMonitor(监控集群的权限)、hostManager( 管理Server);_mongodb创建用户密码并授权
文章浏览阅读593次。Redis是一个基于内存的键值型NoSQL数据库,在实际生产中有着非常广泛的用处_搭建本地redis
文章浏览阅读919次。Key 的最佳实践[业务名]:[数据名]:[id]足够简短:不超过 44 字节不包含特殊字符Value 的最佳实践:合理的拆分数据,拒绝 BigKey选择合适数据结构Hash 结构的 entry 数量不要超过 1000(默认是 500,如果达到上限则底层会使用哈希表而不是 ZipList,内存占用较多)设置合理的超时时间批量处理的方案:原生的 M 操作Pipeline 批处理注意事项:批处理时不建议一次携带太多命令。Pipeline 的多个命令之间不具备原子性。_redis高级实战
文章浏览阅读1.2k次。MongoDB 递归查询_mongodb数据库 递归
文章浏览阅读1.2k次。通过实际代码例子介绍:如何通过MongoTemplate和MongoRepository操作数据库数据_springboot操作mongodb
文章浏览阅读687次,点赞7次,收藏2次。首先欢迎大家阅读此文档,本文档主要分为三个模块分别是:Redis的介绍及安装、RedisDesktopManager可视化工具的安装、主从(哨兵)模式的配置。_redis 主从配置工具
文章浏览阅读764次。天下武功,无坚不摧,唯快不破!我的名字叫 Redis,全称是 Remote Dictionary Server。有人说,组 CP,除了要了解她外,还要给机会让她了解你。那么,作为开发工程师的你,是否愿意认真阅读此心法抓住机会来了解我,运用到你的系统中提升性能。我遵守 BSD 协议,由意大利人 Salvatore Sanfilippo 使用 C 语言编写的一个基于内存实现的键值型非关系(NoSQL)..._redis 7.2 源码
文章浏览阅读2k次。MongoDB 的增删改查【1】_mongodb $inc