失败之环

照片由Marc Renk

一般来说,失败只是令人尴尬的。

但是,如果你的失败导致银行、航空公司和公司遭受严重破坏,造成数十亿美元的损失以及毁灭性的破坏,那该怎么办?

发冷。

明智的人会从别人的错误中吸取教训。

所以让我们积累一些智慧,回顾一下软件历史上最大的失败。

呀,嘘

雅虎曾多次遭遇数据泄露和黑客攻击。

2014 年 12 月,雅虎安全团队报告称黑客已获取至少5 亿雅虎账户的凭证。黑客攻击发生在 2014 年,但直到 2016 年才被公开。

值得庆幸的是,银行账户和密码等敏感的财务数据并未遭到破坏。

问题依然存在:为什么花了这么长时间才确认黑客攻击事件及其规模?

Facebook 收购 N'app

2019 年,Facebook 遭遇了严重的中断,导致 Facebook 系列应用程序(包括Instagram、WhatsApp和Messenger )受到影响。

24 小时后,该公司恢复了正常运营,并将问题归咎于“例行维护”。据 Facebook 报道,服务器配置更改引发了一系列连锁问题。

现在让我们想象一下,当企业主无法获得他们的数字圣杯时,他们会有多么沮丧。

故障航空公司

2019 年 11 月,英国航空公司的计算机故障导致数千名乘客被困在地面长达 24 小时。航班延误和进一步取消是由该航空公司所说的“技术问题”造成的。

但那并不是一个孤立事件。同年 8 月,另一起 IT 故障导致 100 多个航班被取消,35,000 名乘客的出行计划也陷入混乱。

哦,说到混乱。

Github 和你呢?

是的,即使是超级技术人员也并非无敌的。

2017 年 1 月 31 日,GitHub 旗下产品之一:在线服务GitLab.com发生重大备份恢复故障。

此次故障是由于主数据库服务器的数据意外删除而导致的。更糟糕的是,由于配置错误,备份已经很久没有进行了。

结果导致该公司丢失了一些生产数据,包括对项目、评论、用户帐户等数据库数据的修改。总共有 300 GB 的客户数据丢失。

令人惊奇的停电

数以千计的在线服务将其数据存储在 AWS 的数据中心。

这意味着即使是一个小小的技术故障也可能导致 Netflix、Slack、Airbnb、Pinterest、Reddit、Quora 甚至 NASA 瘫痪。

因此,其中许多公司在 2020 年 11 月发生的长时间 AWS 中断期间受到了影响。

该公司表示,此次事件是在其前端 Kinesis 服务器群“少量增加容量”之后发生的。

制定计划

你无法逃脱网络钓鱼攻击或勒索软件。

但在发生令人尴尬的紧急情况时,您至少可以通过回滚产品或功能来降低风险。

功能标志可帮助您安全地测试生产中的功能,并通过用户细分控制每个人的体验。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论