照片由Marc Renk
一般来说,失败只是令人尴尬的。
但是,如果你的失败导致银行、航空公司和公司遭受严重破坏,造成数十亿美元的损失以及毁灭性的破坏,那该怎么办?
发冷。
明智的人会从别人的错误中吸取教训。
所以让我们积累一些智慧,回顾一下软件历史上最大的失败。
呀,嘘
雅虎曾多次遭遇数据泄露和黑客攻击。
2014 年 12 月,雅虎安全团队报告称黑客已获取至少5 亿雅虎账户的凭证。黑客攻击发生在 2014 年,但直到 2016 年才被公开。
值得庆幸的是,银行账户和密码等敏感的财务数据并未遭到破坏。
问题依然存在:为什么花了这么长时间才确认黑客攻击事件及其规模?
Facebook 收购 N'app
2019 年,Facebook 遭遇了严重的中断,导致 Facebook 系列应用程序(包括Instagram、WhatsApp和Messenger )受到影响。
24 小时后,该公司恢复了正常运营,并将问题归咎于“例行维护”。据 Facebook 报道,服务器配置更改引发了一系列连锁问题。
现在让我们想象一下,当企业主无法获得他们的数字圣杯时,他们会有多么沮丧。
故障航空公司
2019 年 11 月,英国航空公司的计算机故障导致数千名乘客被困在地面长达 24 小时。航班延误和进一步取消是由该航空公司所说的“技术问题”造成的。
但那并不是一个孤立事件。同年 8 月,另一起 IT 故障导致 100 多个航班被取消,35,000 名乘客的出行计划也陷入混乱。
哦,说到混乱。
Github 和你呢?
是的,即使是超级技术人员也并非无敌的。
2017 年 1 月 31 日,GitHub 旗下产品之一:在线服务GitLab.com发生重大备份恢复故障。
此次故障是由于主数据库服务器的数据意外删除而导致的。更糟糕的是,由于配置错误,备份已经很久没有进行了。
结果导致该公司丢失了一些生产数据,包括对项目、评论、用户帐户等数据库数据的修改。总共有 300 GB 的客户数据丢失。
令人惊奇的停电
数以千计的在线服务将其数据存储在 AWS 的数据中心。
这意味着即使是一个小小的技术故障也可能导致 Netflix、Slack、Airbnb、Pinterest、Reddit、Quora 甚至 NASA 瘫痪。
因此,其中许多公司在 2020 年 11 月发生的长时间 AWS 中断期间受到了影响。
该公司表示,此次事件是在其前端 Kinesis 服务器群“少量增加容量”之后发生的。
制定计划
你无法逃脱网络钓鱼攻击或勒索软件。
但在发生令人尴尬的紧急情况时,您至少可以通过回滚产品或功能来降低风险。
功能标志可帮助您安全地测试生产中的功能,并通过用户细分控制每个人的体验。
评论