分布式系统问题之时钟问题

作者:程序员阿sir 来源:程序员阿sir

上一篇文章介绍了网络问题。这一篇文章将进一步介绍另一个难题:时2. 时钟问题

1. 时钟问题

时钟对应用而言是非常重要的,很多指标可以通过时钟来衡量。比如每秒的请求数量、平均请求时间等等,这些数据是由时间间隔 (Duration) 来表示的。另一类比如文章发表时间、缓存什么时候过期等等,这些是由时间点 (Points in Time) 来表示的。

在分布式系统中,由于请求都是有网络延迟的,我们也不知道网络延迟有多久,所以在涉及到多个机器,每个机器记了一件事情的发生时间,我们可能不能确定事情的发生顺序,因为网络延迟是不确定的,如果是时间非常相近的事件可能还遇到了时钟问题。

另外由于每个机器都有自己的时钟,这个机器时钟由硬件决定,因此可能存在一定的差别。可以通过网络时间协议 (Network Time Protocal) 来缓解时钟不同步的问题,或通过GPS等服务来获取精确的网络时间。

1.1. 单调时钟和墙上时钟 (Monotonic Versus Time-of-Day Clocks)

现代计算机至少包含两种时钟:墙上时钟 (Wall-clock Time)(就是一般的钟表对应的时钟)、单调时钟。本质上他们都表示时间,但是目的不同。

墙上时钟 (Wall-clock Time)

墙上时钟根据日历返回当前的日期和时间,与我们日常理解的时钟概念一致。比如Java中的System.currentTimeMillis()表示从1970年1月1日以来的毫秒数。

墙上时钟通常使用NTP来进行时钟同步,但是如果本地时钟远远快于NTP服务器可能会跳到不正确的时间点。加上墙上时钟忽略了闰秒,导致它不太适合被用于计算时间间隔 (Elapsed Time)。

单调时钟 (Monotonic Clocks)

单调时钟更适合计算时间间隔 (Duration, Time Interval),比如超时时间或者服务器响应时间。比如Java中的System.nanoTime()返回的就是单调时钟。单调时钟保证时间数字总是变大。

如果NTP检测到本地石英比时间服务器上更快或更慢,NTP会调整本地石英的振动频率。默认情况下,NTP允许改变频率的最大幅度是。但是NTP不会直接调整单调时钟的值。单调时钟的精度很高,通常可以测量微秒级别的时间间隔。

注意单调时钟的值没有意义,比较不同节点上的单调时钟的值也没有意义,因为它们表示的含义和基准可能都不相同。一般情况下单调始终用于测量一段任务的持续时间。

1.2. 时钟同步和准确性 (Clock Synchronization and Accuracy)

单调时钟不需要同步,但是墙上时钟需要根据NTP服务器做出调整。但是墙上时钟和NTP也很可能无法对准,比如由于石英钟本身的震荡漂移 (Drifts)或者NTP同步时的网络延迟等等。数据表明,当通过网络进行时间同步时,误差至少达到35毫秒,最差时的误差甚至超过1秒。另外某些用户可能故意调整本地时钟,设置为错误的日期(比如为了规避游戏的时间检查等等)。因此墙上时钟可能是非常不准确的。

如果一个问题是依赖于时钟同步的,那我们需要考虑如果不同步会对应用带来哪些问题。

比如一个常见的问题是:跨节点的事件排序。如果它高度依赖于时钟同步,就可能导致问题。比如下面的例子:

另一个使用时钟可能导致问题的例子是:假设数据库每个分区只有一个主节点,只有主节点可以接受写入。那么其他节点该如何确信当前主节点还是主节点呢?一种思路是主节点从其他节点获取一个租约 (Lease),当租约没有超时的时候,则当前节点可以处理请求,否则不可以。伪代码如下:

while (true) {

request = getIncomingRequest();

// Ensure that the lease always has at least 10 seconds remaining

if (lease.expiryTimeMillis - System.currentTimeMillis() < 10000) {

lease = lease.renew();

}

if (lease.isValid()) {

process(request);

}

} 如果当前租约还是有效的,离结束还有13秒,而 lease.isValid()消耗了15秒,这样当 process(request) 开始执行时,租约已经过期了,可能其他节点成为了主节点。这样就导致当前节点不是主节点,但是依然执行了处理写入请求的操作。这就导致了问题。

而这种情况可能是由于进程暂停 (Process Pause)导致的。可能由于很多原因导致进程暂停,比如垃圾回收 (GC)。

总结

分布式系统可能遇到网络问题、时钟问题等。而且分布式系统的关键特点就是部分失效。所以在分布式环境下,我们的目标就是建立一个能够容忍部分失败的软件系统。

为了做到这一点,首先要先能检测错误,这个也不简单,因此分布式算法大多依赖超时来确定服务是否正常。但是超时无法区分是网络问题还是节点故障。如果因为临时的网络原因被误认为是发生了节点故障,就导致这个节点被“冤枉”了,可能造成服务不稳定。

检测到错误之后,系统如何能容忍错误也是一个难题。在分布式环境里,各个节点之间都是通过网络来进行通信的,而网络本身就不可靠。因此单个节点可能不能做出正确的决策,需要多个节点共同投票来进行决策。

参考文献

[1] Kleppmann, Martin. Designing data-intensive applications: The big ideas behind reliable, scalable, and maintainable systems. " O'Reilly Media, Inc.", 2017.

原文地址:https://www.toutiao.com/article/7041723124005470756/

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


所以很多人都会选择将这些生活琐事来交给智能化产品,在众多产品中,扫拖机器人所给我们带来的便利性最强,扫地、拖地全都一气呵成,不需要人为过多干预,不过目前大多数扫拖机器人对于双手解放得不彻底。而石头作为
“昨天的经历都将成为明天的力量。” 将绝大部分精力都奉献给璃月港的刻晴,可以说是《原神》中的高人气角色了,虽然是常驻角色,并且对于普通玩家来说……刻师傅别刮了……不过作为开服就存在的角色,还有独特的剑法
最近,全球知名的通信产业盛会MWC 2024(2024世界移动通信大会)正式召开,其中,联发科以“连接AI宇宙”(Connecting the AI-verse)为主题,为大众展示出一系列在AI和移动通信技术等领域的最新突破,吸引了大量行业
今年上半年有很多值得关注的机型,其中华为最新的影像旗舰华为P70 Art也自然受到了业界不少的关注目光,目前关于这款机型的轮廓图已经在网上曝光。
目前,2024世界移动通信大会(MWC)正在西班牙巴塞罗那举行,值得一提的是,此次大会参展中国厂商非常多,包括华为、中兴、小米、荣耀等等多家厂商均在其列。
就在去年,真我推出了11 Pro+,用一个2亿像素传感器和zoom变焦功能,开启了中端手机影像的长焦大战,而后友商才姗姗来迟的跟进了2亿像素传感器。
【手机之家新闻】一年一度的MWC已经于当地时间2月26日在巴塞罗那正式开展,在本次MWC2024上全球各大厂商齐聚一堂,展出自家最新的技术与产品,其中中兴就参展本次MWC2024,并且展出了诸多面向企业端的产品,而旗下的
近日,联发科在MWC 2024(2024 世界移动通信大会)上展出了一系列令人瞩目的AI和移动通信技术突破,以“连接AI宇宙”(Connecting the AI-verse)的展厅吸引了无数业界精英和媒体的目光。特别是其现场的生成式AI技术
虽然目前国内已经有不少厂商入局折叠屏产品,但是努比亚却迟迟没有入局。不过在近日举办的MWC 2024展会上,努比亚发布了自家首款折叠屏手机——努比亚Flip,预计国内很快也会上市。
MWC 2024正在西班牙巴塞罗那举办,和往年一样,荣耀这次依旧携众多新产品、新技术参会。荣耀Magic6 Pro、荣耀Magic V2 RSR保时捷设计的机型在海外正式发布,并且还展示了魔法大模型、任意门等诸多新技术。
MWC 2024正在西班牙巴塞罗那如火如荼地举行,其中小米也参加了今年的大会,在会上发布了在国内大受欢迎的小尺寸旗舰——小米14。值得一提的是,高通公司CEO安蒙甚至亲临发布会现场为这款机型助阵。
《原神》是一直以来在机圈深受欢迎的游戏,在充满幻想的提瓦特大陆上,你可以邂逅不少性格迥异、能力独特的伙伴。而一加Ace系列一直就拥有非常强烈的电竞属性,也是畅玩《原神》的热门机型,而在本月,一加Ace 3将推
有不少网友发现,今年新机的发布时间相对于往年大幅提前,很多厂商在春节之前密集发布了自己最新的中高端机型,给人一种年后没什么新机可发了的感觉。不过魅族全新的大杯机型——魅族21 PRO非常值得期待,魅族科技也
2022年7月,小米12S Ultra正式发布,这款产品率先将1英寸大底主摄引入到移动影像领域,同时凭借鲜明的徕卡影调给人留下深刻的印象,同时这款产品也被视为了影像旗舰地位的机型。如果从那时算起,到现在差不多已经快过
随着智能手机的日益普及和智能化进程的加速,智能穿戴设备成为了人们关注的焦点。各大智能手机厂商纷纷进军智能穿戴市场,试图在这一新兴领域抢占先机。
早在去年秋天,HyperOS操作系统发布的时候,小米便勾勒出了“人车家全生态”的美好蓝图,而在这其中,小米的多终端统一战略是核心,目前已经有不少小米产品预装或者接受到了HyperOS操作系统的推送,在过去几个月的时
今年雷军将把更多的精力放在小米汽车上,所以接下来的手机业务将由刚刚兼任小米品牌总经理卢伟冰接管。同时雷军也在微博上表示小米2024年开年旗舰——小米14 Ultra即将在近期发布,并且将有卢伟冰进行讲解。另外,卢
新的一年有龙则灵,有愿必达。自1月19日起,荣耀加码“新年荣耀,一起成龙”年货节,在全国荣耀线下门店上线了“新年许愿处”、“龙运当头”等趣味活动,吸引大批消费者到店打卡许愿,戴龙头迎好运。与此同时,为了回
小米在官网微博中已经透露了关于小米14 Ultra信息,所以新机上市应该不会太晚。根据德国莱茵的官方消息,目前小米14 Ultra(型号为24030PN60G)获得了莱茵无频闪认证,表明这款手机可以有效减轻屏幕给用户带来的视觉疲
2月22日,上海广播电视台与华为举办鸿蒙合作签约仪式,宣布其官方客户端看看新闻APP将基于HarmonyOS NEXT鸿蒙星河版启动鸿蒙原生应用开发,为用户提供更加极致的新闻资讯服务体验。此次合作标志着上海广播电视台成为全国