2024CTIS-文章详情页顶部

人为指令错误导致亚马逊云大宕机,云上未来真的那么靠谱吗?

亚马逊的云服务才停机几小时,世界就开始慌乱。由于大量的公司依赖亚马逊的网络服务,以至于一些互联网用户声称“一半的互联网都已崩溃”。

美国东部时间上周二下午,亚马逊在东海岸的一个云数据中心发生故障后导致大规模的互联网中断,历经4小时,美国太平洋时间14: 08,亚马逊才宣布S3恢复正常。 这一故障导致数千个网站和应用程序完全无法使用,全球大量的用户和公司因此陷入混乱。

根据亚马逊在线状态报告,亚马逊的简易存储服务(Amazon S3, Simple Storge Service)有超过3.5小时无法发送和接收客户的数据。

网络公司similartech称,近15万个网站在这一事故中受到影响。虽然很少有公司的服务彻底停掉,但是大量的公司的文件共享被中断,网页馈送加载存储在Amazo S3云上的数据遇到麻烦。

在这次事故中,大流量网站Slack,Trello, Soundcloud、Medium、Quora、 Spotify、 Pinterest、Buzzfeed等都受到影响。Soundcloud、Business Insider、imgur、Mashable和科技网站Verge 也中招,一些网站甚至因该事故完全消失了。

美国Top100的网络零售商中,有54个在网页打开速度上降低20%以上。苹果公司在其官方网站上报告了其应用商店,音乐流服务和其他产品因此次网络中断可能出现的问题。美国证券交易委员会网站也受到了影响,亚马逊自营的电商平台反而逃过一劫。由于时差原因,使用亚马逊云服务的中国厂商并没有受到波及。

据悉,亚马逊在北弗吉尼亚州的一个数据中心是该事故的源头。

彭博社消息,这是由于员工操作不当造成的。该员工从S3子系统中,向一台远程服务器输入了一个“常规命令”。本来他是要停掉S3子系统中一些小型服务器,结果数字出错,误伤了一大批主力关键服务器,而后者分管索引和全区的存储元数据。亚马逊公布调查结果的同时承诺,将作出调整,优化S3关键子系统的恢复时间。

亚马逊的云计算服务平台AWS为亚马逊创造了大量的收入来源,它已使这个曾经只是靠网络售书而出名的零售商转型成了技术平台。

Amazon的简易存储服务(S3)为远端服务器上的公司存储文件和数据,它是亚马逊最大的服务项目。使用S3 Web 应用程序开发人员可以使用它存储数字资产,包括图片、视频、音乐和文档。根据SimilarTech.com的数据,S3存储了3到4万亿多条数据,被近15万家网站使用,有超过50万的客户,包括ESPN和AOL等。

这次网络故障问题影响了“前端”操作(即用户可以看到的网站和应用程序的界面)以及发生在看不见的后端数据处理。一些较小的在线服务,如Trello,Scribd和IFTTT,因为网络中断彻底停掉了一段时间, 而一些用户报告显示,最严重的问题出现在文件共享环节。

亚马逊云不是第一次出问题了。2015年,亚马逊的DynamoDB服务(一个基于云的数据库)就遇到了类似问题,给Netflix和Medium造成了影响。2011年,亚马逊位于北弗吉尼亚一个数据中心也曾出现故障。 但对于这类问题,一般云服务提供商都有解决方法可以使事情快速恢复。

Moor Insights&Strategy公司的分析师Patrick Moorhead评论本周事件时表示:“真正令我惊讶的是,他们没有后备计划。通常,备份服务器能转移数据,故障发生后的几分钟内,服务可以在备份的服务器上继续进行。”

根据亚马逊截至2016年12月31日的第四季度财报,亚马逊占据了云计算市场40%以上的市场。2016年AWS全年营收达122亿美元,比去年同期增长了55%,超过了原定100亿美元销售额目标。此外,它的运营利润为31亿美元,也超出亚马逊预期。

云市场硕大无比的体量及它未来可能的发展无疑令人振奋,但本周的意外提醒了用户, 连在业内人士眼中向来可靠的亚马逊云服务产品都会出错,市面上没有哪家云是完全可靠的。

最明智的作法是,将数据存储在亚马逊服务器上的多个位置,甚至转移到其他云端服务提供商,或是企业采用混合云或私有云的方案,分担可能的风险。

对其它提供云服务的竞争者来说,这也是个学习的黄金机会, 很多更大的公司可以看看他们的应用架构,并问问自己:怎么可以让自己服务更可靠一点?(本文首发钛媒体,综合自外网,编译/元婕、王昊)

本文系作者 元婕 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 真的,把鸡蛋都放一个篮子里会很惨!

    回复 2017.03.06 · via android
  • 这一巴掌打的,又红又疼。

    回复 2017.03.06 · via pc
  • 一开头的本周二搞错了吧,还没到呢,

    回复 2017.03.06 · via iphone

快报

更多

12:55

谷歌将投资30亿美元在美国新建及扩建现有数据中心

12:52

生态环境部:推动深化生态综合补偿,完善市场化多元化补偿

12:40

香港积金易平台6月投入运作

12:33

券商及基金公司五一放假安排要遵守全国调休规定?求证:不实

12:27

AITO汽车回应问界M7 Plus事故:事发时安全气囊正常打开 动力电池包特性均正常

12:22

国内首个“国际化友好景区”共建计划在黄山启动

12:15

商务部:大力发展数字贸易,推动数字贸易改革创新发展

12:13

商务部:实施数字消费提升行动,打造“4+N”网络消费矩阵

12:11

商务部:组织跨境电商综试区开展平台和卖家出海等专项行动

12:04

商务部电子商务司负责人解读《数字商务三年行动计划(2024-2026年)》

11:39

广州一季度GDP为7161.14亿元 同比增长3.6%

11:33

5月1日起广州等三个城市试行车险“互碰快赔”

11:28

单周112亿资金借道ETF入场,机构:预计市场将维持震荡格局

11:27

中国贸促会:加大力度推进全国贸促系统“千团出海”行动

11:20

福建发布新一批惠台利民政策措施

11:20

宁德时代计划2027年小批量生产全固态电池

11:16

东风公司东风汽车(武汉)有限公司原党委书记吕传文接受纪律审查和监察调查

11:14

李想时隔57天发微博:感谢雷军的认可,赠送一台理想L6 Max

11:13

南昌住建局:正在酝酿新的支持购房政策,将于近期推出

11:13

5月1日起,粤港澳两地牌车辆管理推出四项便利措施

4

扫描下载App