Amazon, bir grup web sitesinin iki gün önce feshedilmesine neden olan olay hakkında Perşembe günü daha fazla yanıt sundu.
Şirketin bulut servisleri tarafından yapılan bir postmortem uyarınca, Pazartesi sabahı sabah saat 9.37’de bir Amazon çalışanı bir konunun hata ayıklamaya çalışırken bir komuta yanlışlıkla vurdu. Bu komut, Amazon Web Services’in Kuzey Virginia’daki büyük sunucu kümelerini kapattı ve sorunların domino etkisine neden oldu.
Bu S3 bulut depolama sunucularına dayanan diğer hizmetler bozuldu. Ayrıca, bu kadar çok sunucu kapasitesinin ortadan kaldırılması için tam bir sistem yeniden başlatılması gerekiyor ve bu beklenenden daha uzun sürdü. Etkilenen siteler Quora, Imgur, IFTTT, Giphy ve Slack.
Amazon, konuyu sabah saat 2’ye kadar düzeltti.
Sorun şu ki, İnternetin ne kadarının artık önde gelen bulut servis sağlayıcısı AWS’ye ve AWS’deki küçük bir insan hatasının büyük etkilerine bağlı olduğu vurgulanmıştır.
“Bu olayın müşterilerimiz için yarattığı etkiden ötürü özür dilemek istiyoruz, Amazon S3’le olan uzun kayıtlarımızla gurur duyuyoruz ancak bu hizmetin müşterilerimize, uygulamalarına ve son kullanıcılarına ve işletmelerimize ne kadar kritik olduğunu biliyoruz.” dedi
AWS, benzer bir aksilikten kaçınmak için Perşembe günü ek güvenlik kontrolleri ve kurtarma sürelerini iyileştirmenin yolları eklediğini açıkladı.
“Bu, yanlış bir girdinin gelecekte benzer bir olayı tetiklemesini önleyecektir” dedi.
Başka bir deyişle, başka bir yanlış yazılım hatasından kurtarılabiliriz.