缓存雪崩、击穿、穿透

我们都知道,用户数据一般都是存储在数据库中,而数据库的数据是落地于磁盘的,如果我们读取数据库的数据那是很慢的。一旦,用户访问量上来,就很容易引起数据库崩溃。所以,我们一般会加入一层缓存避免直接访问数据库,而redis就是不错的缓存层。因为redis是内存数据库,所以存放redis中的数据跟存放在内存中的数据差不多。

但是,引入缓存层会引来三大问题:

缓存雪崩、缓存击穿、缓存穿透

 这也是我们今天要解决的问题,要知道它们怎么发生的,然后该怎么解决。

缓存雪崩

什么是缓存雪崩

就是当大量缓存数据在同一时间过期(失效)或者redis故障宕机时,这时候有大量的用户请求,而都无法在redis中处理,于是都直接去请求访问数据库,从而数据库的压力剧增,严重的会导致数据库宕机,从而引发一系列的连锁反应,导致整个系统崩溃,这就是缓存雪崩。如下图:

18891bd01a744551941429766a70848c.png

缓存雪崩

 从概念和上图可以知道,导致缓存雪崩的原因有:

1. 同一时间大量的缓存数据过期(失效)

2. redis故障宕机

那么如何去解决这个问题呢?我们就从这两个原因入手。

同一时间大量的缓存数据过期(失效)

对于同一时间大量的缓存数据过期引发的缓存雪崩的解决办法如下:

1. 均匀设置过期时间:就是将key的过期时间后面加上一个随机数(比如随机1-5分钟),让key均匀的失效

 

2. 互斥锁或者队列:这样保证缓存单线程写,但这种方案可能会影响并发量。当然最好在互斥锁也加入超时时间,防止锁一直不释放,导致堵塞

 

3. 使用后台程序定时更新数据:热点数据可以考虑不失效,后台异步更新缓存(就是后台定时的检测缓存是否失效而淘汰和更新缓存数据,也可以业务线程通知后台的方式让后台更新缓存),适用于不严格要求缓存一致性的场景

 

4. 双key策略:主key设置过期时间,备key不设置过期时间,当主key失效时,直接返回备key值(即只有一个请求去更新缓存,在这期间有别的请求到来就使用旧值返回)。更新缓存的时候,同时更新两个key的数据

redis故障宕机

对于redis故障宕机引发的缓存雪崩的解决办法如下:

1. 构建缓存高可用集群:即可以通过主从模式实现

2. 当缓存雪崩发生时,服务熔断、限流、降级等措施保障

服务熔断机制:暂停业务应用对缓存服务的访问,直接返回错误,不用再继续访问数据库,从而降低对数据库的访问压力,保证数据库系统的正常运行,然后等到 Redis 恢复正常后,再允许业务应用访问缓存服务。

请求限流机制:只将少部分请求发送到数据库进行处理,再多的请求就在入口直接拒绝服务,等到 Redis 恢复正常并把缓存预热完后,再解除请求限流的机制。

缓存击穿

缓存雪崩是指只大量热点key同时失效的情况,而如果是单个热点数据过期了(失效),此时有大量的请求访问了该热点数据,在缓存无法读取到数据,而直接访问数据库数据库很容易就被高并发的请求冲垮,这就是缓存击穿。如下图:

239122e6456b295a0fbabfefe6a80c09.jpeg

缓存击穿

 从定义上看,我们看出缓存雪崩和缓存击穿很相似,只不过缓存击穿是一个热点key失效,而缓存雪崩是大量热点key失效。因此,可以认为缓存击穿是缓存雪崩的一个子集。

缓存击穿的解决方案:

1. 互斥锁方案,保证同一时间只有一个业务线程更新缓存,未能获取互斥锁的请求,要么等待锁释放后重新读取缓存,要么就返回空值或者默认值。单机通过synchronized或lock来处理,分布式环境采用分布式锁

 

2. 不给热点数据设置过期时间,由后台异步更新缓存,或者在热点数据准备要过期前,提前通知后台线程更新缓存以及重新设置过期时间。适用于不严格要求缓存一致性的场景

 

3.”提前“使用互斥锁(Mutex Key):在value内部设置一个比缓存(Redis)过期时间短的过期时间标识,当异步线程发现该值快过期时,马上延长内置的这个时间,并重新从数据库加载数据,设置到缓存中去。

缓存穿透

从上面的介绍我们知道缓存雪崩或击穿,只是数据不在缓存中(失效),但是数据库是有的,只要把数据库的数据加载入缓存即可解决。但是如果数据库也没有怎么办呢?这就是下面要谈论的问题了。

当用户访问的数据,即不在缓存中,也不在数据库中。导致请求在访问缓存时,发现缓存缺失,再去访问数据库时,发现数据库中也没有要访问的数据,则不写入缓存。这就导致每次请求都会到底层数据库进行查询,缓存也失去了意义。当高并发或有人利用不存在的Key频繁攻击时,数据库的压力骤增,甚至崩溃,这就是缓存穿透。如下图:

c5f45358eb82351e3abfc0885d48fce6.jpeg

缓存穿透

那么怎么混出现这种情况呢?主要有两个方面:

1. 业务操作上失误:原来数据是存在的,但由于某些原因(误删除、主动清理等)在缓存和数据库层面被删除了,但前端或前置的应用程序依旧保有这些数据

 

2. 黑客恶意攻击:利用不存在的Key或者恶意尝试导致产生大量不存在的业务数据请求

如果出现上面这个情况,我们如何解决呢?

1. 缓存空值(null)或默认值

2. 业务逻辑前置校验

3. 用户黑名单限制

4. 使用布隆过滤器快速判断数据是否存在,避免通过查询数据库来判断数据是否存在

缓存空值(null)或默认值

当我们在业务中发现缓存击穿情况时,我们可以针对相应的查询数据在缓存中设置一个空值或者默认值,当后续有相对应的业务请求过来时,则可以直接从缓存中取出数据返回给应用端,不再需要访问数据库。但是要注意的是,在缓存中设置这样的空值(默认值)的时候,要为其设置相应的过期时间(不宜过长)。同时也要注意,如果我们操作数据库的时候,写入或者更新到有该key的数据,则一定记得更新缓存数据,防止数据不一致的出现。

业务逻辑前置校验

我们在写业务请求相关的接口时要对数据的合法性进行校验,即检查请求参数是否合理、是否包含非法值、是否恶意请求、请求字段是否存在,这样可以提前阻止非法请求。

用户黑名单限制

当发现异常的时候,我们可以实时监控访问的对象和数据,分析用户行为,针对故意请求、爬虫或攻击者,进行特定用户的限制。

使用布隆过滤器快速判断数据是否存在,避免通过查询数据库来判断数据是否存在

我们在写数据的时候,使用布隆过滤器进行标记(相当于设置白名单),当业务请求到来的数据,如果在缓存中找不到对应的数据,那么可以先通过查询布隆过滤器判断数据是否在白名单内,如果不存在,就不用通过查询数据库来判断数据是否存在。这样即使发生了缓存穿透,大量的请求也只会查询缓存(redis)和布隆过滤器,而不会去查数据库,从而保证数据库的稳定性。

什么是布隆过滤器?

布隆过滤器由「初始值都为 0 的位图数组」和「 N 个哈希函数」两部分组成。当我们在写入数据库数据时,在布隆过滤器里做个标记,这样下次查询数据是否在数据库时,只需要查询布隆过滤器,如果查询到数据没有被标记,说明不在数据库中。

布隆过滤器会通过 3 个操作完成标记:

  • 第一步,使用 N 个哈希函数分别对数据做哈希计算,得到 N 个哈希值;

  • 第二步,将第一步得到的 N 个哈希值对位图数组的长度取模,得到每个哈希值在位图数组的对应位置。

  • 第三步,将每个哈希值在位图数组的对应位置的值设置为 1;

举个例子,假设有一个位图数组长度为 8,哈希函数 3 个的布隆过滤器。

8213cf57514429a17eaa6e6a2a0031a6.png

在数据库写入数据 x 后,把数据 x 标记在布隆过滤器时,数据 x 会被 3 个哈希函数分别计算出 3 个哈希值,然后在对这 3 个哈希值对 8 取模,假设取模的结果为 1、4、6,然后把位图数组的第 1、4、6 位置的值设置为 1。当应用要查询数据 x 是否数据库时,通过布隆过滤器只要查到位图数组的第 1、4、6 位置的值是否全为 1,只要有一个为 0,就认为数据 x 不在数据库中

布隆过滤器由于是基于哈希函数实现查找的,高效查找的同时存在哈希冲突的可能性,比如数据 x 和数据 y 可能都落在第 1、4、6 位置,而事实上,可能数据库中并不存在数据 y,存在误判的情况。

所以,查询布隆过滤器说数据存在,并不一定证明数据库中存在这个数据,但是查询到数据不存在,数据库中一定就不存在这个数据

当然,可能针对缓存穿透的情况,也有可能是其他的原因引起,可以针对具体情况,采用对应的措施。

总结

本文介绍了在使用缓存时经常会遇到的三种异常情况:缓存穿透、缓存雪崩和缓存击穿。整理如下:

ca7041083d294035a53064e48717474e.png

针对不同的缓存异常场景,可选择不同的方案来进行处理。当然,除了上述方案,我们还可以限流、降级、熔断等服务层的措施,也可以考虑数据库层是否可以进行横向扩展,当缓存异常发生时,确保数据库能够抗住流量,不至于让整个系统崩溃。

 

 

 

 

原文地址:https://blog.csdn.net/sanylove/article/details/127885951

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


文章浏览阅读752次。关系型数据库关系型数据库是一个结构化的数据库,创建在关系模型(二维表模型)基础上,一般面向于记录SQL语句(标准数据查询语言)就是一种基于关系型数据库的语言,用于执行对关系型数据库中数据的检索和操作主流的关系数据库包括Oracle、Mysql、SQL Server、Microsoft Access、DB2等非关系型数据库NoSQL(nOSQL=Not Only SQL),意思是“不仅仅是SQL”,是非关系型数据库的总称。除了主流的关系型数据库外的数据库,都认为是非关系型主流的NoSQ.._redis是非关系型数据库吗
文章浏览阅读687次,点赞2次,收藏5次。商城系统中,抢购和秒杀是很常见的营销场景,在一定时间内有大量的用户访问商场下单,主要需要解决的问题有两个:1. 高并发对数据库产生的压力;2. 竞争状态下如何解决商品库存超卖;高并发对数据库产生的压力对于第一个问题,使用缓存来处理,避免直接操作数据库,例如使用 Redis。竞争状态下如何解决商品库存超卖对于第二个问题,需要重点说明。常规写法:查询出对应商品的库存,判断库存数量否大于 0,然后执行生成订单等操作,但是在判断库存是否大于 0 处,如果在高并发下就会有问题,导致库存_php库存结余并发
文章浏览阅读1.4k次。MongoTemplate开发spring-data-mongodb提供了MongoTemplate和MongoRepository两种方式访问MongoDB,MongoRepository的方式访问较为简单,MongoTemplate方式较为灵活,这两种方式在Java对于MongoDB的运用中相辅相成。_springboot插入指定的mongodb数据库
文章浏览阅读887次,点赞10次,收藏19次。1.背景介绍1. 背景介绍NoSQL数据库是一种非关系型数据库,它的特点是可以存储非结构化的数据,并且可以处理大量的数据。HBase是一个分布式、可扩展的列式存储系统,它是基于Google的Bigtable设计的。HBase是一个开源的NoSQL数据库,它的核心功能是提供高性能的随机读写访问。在本文中,我们将对比HBase与其他NoSQL数据库,例如Redis、MongoDB、Cass...
文章浏览阅读819次。MongoDB连接失败记录_edentialmechanisn-scram-sha-1
文章浏览阅读470次。mongodb抽取数据到ES,使用ELK内部插件无法获取数据,只能试试monstache抽取mongodb数据,但是monstache需要mongodb replica set 模式才能采集数据。############monstache-compose文件。#replicas set 启动服务。# 默认备份节点不能读写,可以设置。# mydb指的是需要同步的数据库。#登录主mongodb初始化rs。#primary 创建用户。# ip地址注意要修改。# ip地址注意要修改。_monstache csdn
文章浏览阅读913次,点赞4次,收藏5次。storage:fork: trueadmin登录切换数据库注意: use 代表创建并使用,当库中没有数据时默认不显示这个库删除数据库查看表清单> show tables # 或者 > show collections表创建db.createCollection('集合名称', [options])table1字段类型描述capped布尔(可选)如果为 true,则创建固定集合。固定集合是指有着固定大小的集合,当达到最大值时,它会自动覆盖最早的文档。_mongodb5
文章浏览阅读862次。Centos7.9设置MongoDB开机自启(超全教程,一条龙)_mongodb centos开机启动脚本
文章浏览阅读1.3k次,点赞6次,收藏21次。NoSQL数据库使用场景以及架构介绍
文章浏览阅读856次,点赞21次,收藏20次。1.背景介绍1. 背景介绍NoSQL数据库是一种非关系型数据库,它的设计目标是为了解决传统关系型数据库(如MySQL、Oracle等)在处理大量不结构化数据方面的不足。NoSQL数据库可以处理大量数据,具有高性能、高可扩展性和高可用性。但是,与关系型数据库不同,NoSQL数据库没有固定的模式,数据结构也不一定是表格。在NoSQL数据库中,数据存储和查询都是基于键值对、列族、图形等不同的...
文章浏览阅读416次。NoSQL定义:非关系型、分布式、开放源码和具有横向扩展能力的下一代数据库。由c++编写的开源、高性能、无模式的基于分布式文件存储的文档型数据库特点:高性能、高可用性、高扩展性、丰富的查询支持、可替换已完场文档某个指定的数据字段应用场景:社交场景:使用mongodb存储用户信息游戏场景:用户信息,装备积分物流场景:订单信息,订单状态场景操作特点:数据量大;读写操作频繁;价值较低的数据,对事物性要求不高开源、c语言编写、默认端口号6379、key-value形式存在,存储非结构化数据。_nosql
文章浏览阅读1.5k次,点赞3次,收藏2次。Exception in thread "main" redis.clients.jedis.exceptions.JedisConnectionException: Failed to create socket. at redis.clients.jedis.DefaultJedisSocketFactory.createSocket(DefaultJedisSocketFactory.java:110) at redis.clients.jedis.Connection.connect(Conne_redis.clients.jedis.exceptions.jedisconnectionexception: failed to create so
文章浏览阅读6.5k次,点赞3次,收藏12次。readAnyDatabase(在所有数据库上都有读取数据的权限)、readWriteAnyDatabase(在所有数据库上都有读写数据的权限)、userAdminAnyDatabase(在所有数据库上都有管理user的权限)、dbAdminAnyDatabase(管理所有数据库的权限);:clusterAdmin(管理机器的最高权限)、clusterManager(管理和监控集群的权限)、clusterMonitor(监控集群的权限)、hostManager( 管理Server);_mongodb创建用户密码并授权
文章浏览阅读593次。Redis是一个基于内存的键值型NoSQL数据库,在实际生产中有着非常广泛的用处_搭建本地redis
文章浏览阅读919次。Key 的最佳实践[业务名]:[数据名]:[id]足够简短:不超过 44 字节不包含特殊字符Value 的最佳实践:合理的拆分数据,拒绝 BigKey选择合适数据结构Hash 结构的 entry 数量不要超过 1000(默认是 500,如果达到上限则底层会使用哈希表而不是 ZipList,内存占用较多)设置合理的超时时间批量处理的方案:原生的 M 操作Pipeline 批处理注意事项:批处理时不建议一次携带太多命令。Pipeline 的多个命令之间不具备原子性。_redis高级实战
文章浏览阅读1.2k次。MongoDB 递归查询_mongodb数据库 递归
文章浏览阅读1.2k次。通过实际代码例子介绍:如何通过MongoTemplate和MongoRepository操作数据库数据_springboot操作mongodb
文章浏览阅读687次,点赞7次,收藏2次。首先欢迎大家阅读此文档,本文档主要分为三个模块分别是:Redis的介绍及安装、RedisDesktopManager可视化工具的安装、主从(哨兵)模式的配置。_redis 主从配置工具
文章浏览阅读764次。天下武功,无坚不摧,唯快不破!我的名字叫 Redis,全称是 Remote Dictionary Server。有人说,组 CP,除了要了解她外,还要给机会让她了解你。那么,作为开发工程师的你,是否愿意认真阅读此心法抓住机会来了解我,运用到你的系统中提升性能。我遵守 BSD 协议,由意大利人 Salvatore Sanfilippo 使用 C 语言编写的一个基于内存实现的键值型非关系(NoSQL)..._redis 7.2 源码
文章浏览阅读2k次。MongoDB 的增删改查【1】_mongodb $inc