2013年8月26日、Amazon Web Serviceを利用しているいくつかの有名サービス(Instagram、Vine、Netflix、Heroku等)が停止するという事態に陥りました。
※Instagramは写真版Twitterと呼ばれ、利用者数は1億3000万人超
※Vineは短時間動画(6秒)共有アプリであり、利用者数は4000万人超
※Netflixは動画ストリーミングサイトであり、利用者数は3000万人弱
※HerokuはFacebookアプリの著名なホスティングサービス
Tech Crunchによれば、米国東部時間の午前4時にInstagramで最初に影響が出たのは、いくつかの加工写真共有に関してでした。その後、影響は拡大し、30分後にはVineもサービス提供に支障が生じています。
AWSのサービス運行状況は以下のダッシュボードで確認できます。
http://status.aws.amazon.com/
こうしてみると、Amazon EC2(クラウド基盤)の北部バージニアにてここ最近障害が頻発しているのが分かりますね。このダッシュボード上で、Amazonは次のコメントを発しています。
2:21 PM PDT We have identified and fixed the root cause of the performance issue. EBS backed instance launches are now operating normally. Most previously impacted volumes are now operating normally and we will continue to work on instances and volumes that are still experiencing degraded performance.
2:45 PM PDT We have identified and fixed the root cause of the connectivity issue affecting load balancers in a single availability zone. The connectivity impact has been mitigated for load balancers with back-end instances in multiple availability zones. We continue to work on load balancers that are still seeing connectivity issues.
要は、問題事象はパフォーマンスの低下であり、原因はロードバランサの接続に障害が生じたせいだったという話です。
さらに詳しい情報は今後出てくるものと思いますが、アマゾンが持つデータセンターで一番障害が発生しているイメージを持たれているのは、この北部バージニアのデータセンターであり、大手Webサービスも複数稼働しているために障害影響も大きいということで、個人的に気になったので取り上げました。
なお、これまでに北部バージニアデータセンターが歩んできた受難の歴史を参考列挙します。
【2011年4月】
・Amazon AWS の障害を総括する
http://agilecatcloud.com/2011/04/25/amazon-aws-%E3%81%AE%E9%9A%9C%E5%AE%B3%E3%82%92%E7%B7%8F%E6%8B%AC%E3%81%99%E3%82%8B%E3%81%A8%E3%80%81%E3%82%AF%E3%83%A9%E3%82%A6%E3%83%89%E3%81%AE%E5%8B%9D%E5%88%A9%E3%81%8C%E8%A6%8B%E3%81%88%E3%81%A6/
【2012年7月】
・アマゾンのウェブサービスに障害 - 暴風雨による停電の影響、サードパーティも道連れに
http://wirelesswire.jp/Watching_World/201207021021.html
【2012年10月】
・Amazonのクラウド、EC2でパフォーマンス低下障害発生中
http://jp.techcrunch.com/2012/10/23/20121022aws-ec2-issues-in-north-virginia-affect-heroku-reddit-and-others-heroku-still-down/
【2012年12月】
・Amazon、クリスマスイブにEC2の障害発生 また北バージニアで
http://www.itmedia.co.jp/news/articles/1212/25/news047.html
別の場所でデータセンターを探した方が良いのではないかと思ってしまうほどですが、よくよく考えてみると、これよりももっと頻繁にシステム障害を起こしているデータセンターなんて、オンプレミスの世界ならたくさんありますよね。これだけの障害で済んでいるのは、やはりAWSを支える堅牢なアーキテクチャのおかげなのでしょう。
posted by 吉澤準特 at 12:57
|
Comment(0)
|
TrackBack(0)
|
業界裏話