一个 Python Bug 干倒了估值 1.6 亿美元的公司

整理 | 苏宓

出品 | CSDN(ID:CSDNnews)

2011 年,风险投资家、原 Netscape 创始人 Marc Andreesen 的一句「软件正在吞噬世界」,警醒众人。自此一切可编程的大门逐渐开启。然而在百花齐放软件驱动产品的背后,往往一个 Bug,极有可能瓦解所有。

近日,一位科技博主分享了一则早年间真实发生的一个 Bug 事件,因为一个“灾难性”的软件版本发布间接地导致了曾可以与 Reddit 匹敌的科技网站 Digg 分崩离析,最终让这家曾经估值高达 1.6 亿美元的公司被以 50 万美元价格收购。

作为亲身经历者,软件工程师 Will Larson 在 2018 年以《Digg's v4 launch: an optimism born of necessity.》一文,回顾了当初 Digg 公司的发展情况与个人参与的整个遭遇。万万没想到的是,经历了两年改版重写,再到耗时一个月的寻找 Bug,最终的问题竟是与 Python 的一个函数有关,然而彼时再想修复,似乎一切已为时已晚。借此,通过这篇文章也想给奋战在一线的开发者避一避坑。

背景

这家名为 Digg 的公司,成立于 2004 年,是一个以科技为主的新闻站点。与当时其他新闻网站有所不同的是,Digg 允许用户把自己搜集的新闻和其他互联网内容汇聚在一起进行提交,然后 Digg 通过内部算法机制将新闻抓取到网站的首页,用于展示。

来自维基百科

这样做有一个好处就是,Digg 将文章的筛选权利交给了用户,可以让他们自己筛选出最受关注和有价值的文章,然后通过订阅方式,订阅数量高的就会自动被推荐上首页,由此让更多的人看到。在时下这种新颖的做法,也让很多用户有了参与感,Digg 的规模也逐渐扩大。

当然,所有事情也有两面性,也所谓「树大招风」。

Will Larson 在 2018 年发布的博文里提到:“过去一年里,Digg 过得异常艰难。我们的 CEO 在我加入的前一天离开了;高级工程师们鬼使神差地离开了公司,并拉走了他们剩在公司的朋友们,降低了公司的生产力;具有欺诈性的团伙规避了我们的算法,利用投票与订阅的方式,出售我们网站头版的访问权,并威胁我们要及时修改算法以防止他们的滥用;我们的开发者环境配置工具坏了,没有人知道如何修复它们,所以我们给新员工重新分配了近期离职同事的僵尸虚拟机。”

要说一家发展前景良好的公司,为何会沦落如此,一方面,必然有其内部的战略问题,另一方面,也与外部的竞争环境有关。Will Larson 称,受到外部的影响因素之一便是与 2011 年 Google 推出了 Panda “反垃圾网站”算法有关。

那时,Google Panda 的主要目的是将质量低、含有垃圾内容的网页或网站排名降低,使得高质量的内容得到应有的合理排名。

虽然 Google Panda 算法本身是利好质量高的网站,但是 Will Larson 表示,“当时 Digg 已经被 Google Panda 算法更新破坏了。由于该搜索更新花了一个月的时间才慢慢生效,Digg 的命运就此也发生了巨大逆转:我们从第一个也是唯一一个盈利的月份开始下跌,一直跌到网站月流量被砍掉一半。前一个月,公司在五年的盈利道路上达到了顶峰,下一个月,公司处于自由落体状态,即将从弱势地位进行融资。”

为了重振旗鼓,也为了改变现状。Digg 决定对网站的 v3.5 进行重写,将发布 Digg v4 版本。

不过时间转瞬过去了两年,Digg 因重重变故,导致新版本一拖再拖。然而,Digg v4 版本是该公司回归互联网巨头竞争的战场中唯一的机会,如果错失,可能也就错过了整个时代。后来,经过公司内部的商议,他们决定将没有完全准备好的 Digg v4 紧急上线。

重写 Digg v4 的办公现场,来源 Will Larson 博客

殊不知,这一仓促的决定也注定了其仓促的收场结局。

Python 函数的默认参数的一次失败案例

慢慢地问题开始显现。

彼时的上午 10 点左右,有人问研发团队什么时候开始切换新版本,工程师回答称:"我们已经开始重新配置 V3 服务器了。" 不过,由于容量太小了,该团队决定重新映像所有现有的服务器,然后在新的软件栈中重新配置。

切换工作正式开启,不过一些奇怪的事情发生了。切换过程中,新的网站并没有真正地出现。运营团队匆匆忙忙地发布了一个维护页面,整个团队陷入了沉思。因为,他们并没有一个回滚计划。然后有一个工程师给出了或许是唯一可能的选择:继续向前切换。

他们也的确这么做了,一个小时后,当全部量切换完成,旧网站页面取而代之的是 Digg v4 版本,所有人员也长舒一口气。

不过刚高兴没多久,大家发现多数的页面呈现无法加载的状态。初期,该研发团队将问题定位为 Cassandra 集群,因此他们扩大了对 memcache 的使用,作为保护 Cassandra 的一个写通缓存。

几个小时之后,访客页面没有问题,但是已经登录的用户却仍然看到报错的页面,如 MyNews,该页面类似于“个人中心”,会呈现用户与每篇文章互动的记录以及个性化的新闻页面。无奈之下,研发团队将登录用户的默认页面改为 TopNews,这样使得用户登录之后可以使用网站。

次日,MyNews 已经彻底无法访问,网站每隔四个小时之后就会出现故障。除此之外,还有几十个小问题也在不断出现。

于是,他们再次做了一个大胆的决定——从头开始写 MyNews 页面。起初,该团队以为 Cassandra 的缓存击穿了 memcache,破坏了相关功能。后来他们用 Redis 重写了,并实施了一个分片的 Redis 集群,并成功将原来的迁移到新开发上。

遗憾的是,研发团队还是需要每隔四个小时就手动启动每个进程。

简单来看,相当于问题的根源还是没有找到,只是用了一种麻烦的替代方案来短暂支持。没想到的是,这个 Bug 耗费了该团队一个月的时间来追踪。

好在最终还是发现了问题的所在。Digg 的 API 服务器是一个 Python Tornado 服务,它将 API 调用到 Python 后端层,即 Bobtail(前端是 Bobcat),其中一个最经常被访问的端点是用来通过用户的名字或 ID 来检索用户。因为它支持按名字或 ID 检索,所以它把两个参数的默认值都设置为空列表。

def get_user_by_ids(ids=[])然而,Python 只在函数第一次被评估时初始化默认参数,这意味着每次调用函数时都会使用同一个列表。

在这种情况下,每次调用时,用户的 ID 和名字都被附加到默认列表中。几个小时后,这些列表开始在每次请求中检索数以万计的用户,甚至压垮了 memcache 集群,导致了页面崩掉。

通过一个简单的例子可以直接看出:

def f(l=[]):

l.append(1)

print(l)

f

f

f

输出

[1]

[1, 1]

[1, 1, 1]

最后

事情最后的结局是,Digg 团队修复了该漏洞,Digg v4 完全正常启动。而距离此事过去了一周后,Digg 迎来了最后一任 CEO;一个月后,Digg 开启第三轮裁员;一年后,Digg 公司被 Chartbeat 的母公司 Beatworks 以 50 万美金的价格收购。

谁曾想,Digg 也是互联网的宠儿,估值曾达到过 1.6 亿美元,登上过《商业周刊》的封面,Google 也曾计划以 2 亿美元将它收入囊中。殊不知,正是这一次的失败改版让 Digg 迅速损失了人气,以及内部一些管理问题,让竞品迅速超越。自此,一家创业明星公司就此陨落。

Will Larson 在文末写道,「Digg V4 有时会被作为灾难性发布的例子,隐含的教训是我们不应该发布它。我曾经一度同意这个观点,但现在我认为我们推出的决定是正确的。因为,我们的流量明显下降,每个月都在损失一大笔钱。如果我们能在推出伟大的东西和糟糕的东西之间做出选择,肯定会更倾向于推出伟大的东西,但我们却选择了最后一次挥棒。」

另外,他还表示,“即使是现在,我也不确定当初那样一个有才干的团队是如何进行这种愚蠢的展示的。”

归根结底,这是程序员一次技术失败导致的惨痛教训。也有不少网友评论道,「动态类型一时爽,代码重构火葬场」。

参考链接:

https://lethain.com/digg-v4/?continueFlag=0a23bc7c424c6abc75f97cbaaa2d55ff

https://weibo.com/u/1642628345

原文地址:https://www.toutiao.com/article/7137982289731912231/

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Python中的函数(二) 在上一篇文章中提到了Python中函数的定义和使用,在这篇文章里我们来讨论下关于函数的一些更深的话题。在学习C语言函数的时候,遇到的问题主要有形参实参的区别、参数的传递和改变、变量的作用域。同样在Python中,关于对函数的理解和使用也存在这些问题。下面来逐一讲解。一.函
Python中的字符串 可能大多数人在学习C语言的时候,最先接触的数据类型就是字符串,因为大多教程都是以"Hello world"这个程序作为入门程序,这个程序中要打印的"Hello world"就是字符串。如果你做过自然语言处理方面的研究,并且用Python
Python 面向对象编程(一) 虽然Python是解释性语言,但是它是面向对象的,能够进行对象编程。下面就来了解一下如何在Python中进行对象编程。一.如何定义一个类 在进行python面向对象编程之前,先来了解几个术语:类,类对象,实例对象,属性,函数和方法。 类是对现实世界中一些事物的封装,
Python面向对象编程(二) 在前面一篇文章中谈到了类的基本定义和使用方法,这只体现了面向对象编程的三大特点之一:封装。下面就来了解一下另外两大特征:继承和多态。 在Python中,如果需要的话,可以让一个类去继承一个类,被继承的类称为父类或者超类、也可以称作基类,继承的类称为子类。并且Pytho
Python中的函数(一) 接触过C语言的朋友对函数这个词肯定非常熟悉,无论在哪门编程语言当中,函数(当然在某些语言里称作方法,意义是相同的)都扮演着至关重要的角色。今天就来了解一下Python中的函数用法。一.函数的定义 在某些编程语言当中,函数声明和函数定义是区分开的(在这些编程语言当中函数声明
在windows下如何快速搭建web.py开发框架 用Python进行web开发的话有很多框架供选择,比如最出名的Django,tornado等,除了这些框架之外,有一个轻量级的框架使用起来也是非常方便和顺手,就是web.py。它由一名黑客所创建,但是不幸的是这位创建者于2013年自杀了。据说现在由
将Sublime Text 2搭建成一个好用的IDE 说起编辑器,可能大部分人要推荐的是Vim和Emacs,本人用过Vim,功能确实强大,但是不是很习惯,之前一直有朋友推荐SUblime Text 2这款编辑器,然后这段时间就试了一下,就深深地喜欢上这款编辑器了...
Python中的模块 有过C语言编程经验的朋友都知道在C语言中如果要引用sqrt这个函数,必须用语句"#include<math.h>"引入math.h这个头文件,否则是无法正常进行调用的。那么在Python中,如果要引用一些内置的函数,该怎么处理呢?在Python中
Python的基础语法 在对Python有了基础的认识之后,下面来了解一下Python的基础语法,看看它和C语言、java之间的基础语法差异。一.变量、表达式和语句 Python中的语句也称作命令,比如print "hello python"这就是一条语句。 表达式,顾名思义,是
Eclipse+PyDevʽjango+Mysql搭建Python web开发环境 Python的web框架有很多,目前主流的有Django、Tornado、Web.py等,最流行的要属Django了,也是被大家最看好的框架之一。下面就来讲讲如何搭建Django的开发环境。一.准备工作 需要下载的
在windows下安装配置Ulipad 今天推荐一款轻便的文本编辑器Ulipad,用来写一些小的Python脚本非常方便。 Ulipad下载地址: https://github.com/limodou/ulipad http://files.cnblogs.com/dolphin0520/u...
Python中的函数(三) 在前面两篇文章中已经探讨了函数的一些相关用法,下面一起来了解一下函数参数类型的问题。在C语言中,调用函数时必须依照函数定义时的参数个数以及类型来传递参数,否则将会发生错误,这个是严格进行规定的。然而在Python中函数参数定义和传递的方式相比而言就灵活多了。一.函数参数的
在Notepad++中搭配Python开发环境 Python在最近几年一度成为最流行的语言之一,不仅仅是因为它简洁明了,更在于它的功能之强大。它不仅能够完成一般脚本语言所能做的事情,还能很方便快捷地进行大规模的项目开发。在学习Python之前我们来看一下Python的历史由来,"Pytho
Python中的条件选择和循环语句 同C语言、Java一样,Python中也存在条件选择和循环语句,其风格和C语言、java的很类似,但是在写法和用法上还是有一些区别。今天就让我们一起来了解一下。一.条件选择语句 Python中条件选择语句的关键字为:if 、elif 、else这三个。其基本形式如
关于raw_input( )和sys.stdin.readline( )的区别 之前一直认为用raw_input( )和sys.stdin.readline( )来获取输入的效果完全相同,但是最近在写程序时有类似这样一段代码:import sysline = sys.stdin.readline()
初识Python 跟学习所有的编程语言一样,首先得了解这门语言的编程风格和最基础的语法。下面就让我们一起来了解一下Python的编程风格。1.逻辑行与物理行 在Python中有逻辑行和物理行这个概念,物理行是指在编辑器中实际看到的一行,逻辑行是指一条Python语句。在Python中提倡一个物理行只
当我们的代码是有访问网络相关的操作时,比如http请求或者访问远程数据库,经常可能会发生一些错误,有些错误可能重新去发送请求就会成功,本文分析常见可能需要重试的场景,并最后给出python代码实现。
1.经典迭代器 2.将Sentence中的__iter__改成生成器函数 改成生成器后用法不变,但更加简洁。 3.惰性实现 当列表比较大,占内存较大时,我们可以采用惰性实现,每次只读取一个元素到内存。 或者使用更简洁的生成器表达式 4.yield from itertools模块含有大量生成器函数可
本文介绍简单介绍socket的常用函数,并以python-kafka中的源码socketpair为例,来讲解python socket的运用
python实践中经常出现编码相关的异常,大多网上找资料而没有理解原理,导致一次次重复错误。本文对常用Unicode、UTF-8、GB2312编码的原理进行介绍,接着介绍了python字符类型unicode和str以及常见编解码错误UnicodeEncodeError和UnicodeDEcodeEr