Developpez.com

Le Club des Développeurs et IT Pro

Cloud AWS : Amazon donne des explications sur l'incident survenu dans Amazon S3 le 28 février dernier

Une erreur humaine en serait la cause

Le 2017-03-03 11:57:42, par Malick, Community Manager
Nous vous annoncions récemment qu'en Amérique du Nord, les services relatifs au cloud computing d'Amazon étaient affectés par un important dysfonctionnement survenu le 28 février dernier en début de soirée. Cet incident qui a duré plus de quatre heures à savoir entre 18 h 45 et 22 h 49 a empêché plusieurs utilisateurs d'accéder normalement aux différents services d'Amazon S3. Suite à ce problème, plusieurs utilisateurs s'étaient approchés des médias comme Twitter pour se plaindre. Face à ces plaintes, Amazon avait réagi en affirmant que le dysfonctionnement a été causé par un taux d'erreurs très élevé sur le service de stockage S3 qui est hébergé au niveau des datacenters d'Amazon situés dans la Côte Est des USA. Le problème a finalement été résolu par Amazon un peu plus tard dans la soirée entraînant ainsi le rétablissement du fonctionnement normal d'Amazon Simple Storage Service (Amazon S3).

Pour éclairer l'opinion sur cet incident de très grande envergure qui a touché les services d'Amazon S3, Amazon vient de publier sur son site des explications sur l'origine du problème. Selon ce dernier, l'incident qui a rendu inaccessible une très grande partie des services d'Amazon S3 a été le résultat d'une erreur humaine. Amazon affirme que c'est un employé de l'équipe d'Amazon S3 qui, pour résoudre un problème dans le système de facturation, a voulu mettre un certain nombre de serveurs hors ligne via l'exécution de lignes de code. Cependant, au moment de passer à l'acte, l'employé aurait saisi un code incorrect ; ce qui a occasionné la mise en état hors ligne d'un plus grand nombre de serveurs comparé à ce qui était prévu.

Suite à cet évènement malheureux, Amazon présente toutes ses excuses à l'ensemble de ses clients et promet de faire le nécessaire en apportant des changements majeurs sur son système afin d'éviter qu'un tel incident ne se reproduise à l'avenir. « Bien que nous soyons fiers de la disponibilité continue sur la durée du service Amazon S3, nous n'ignorons pas combien ce service est critique pour nos clients, leurs applications, leurs utilisateurs et leurs business (ou affaires) », a ajouté Amazon.

« Amazon Web Services (AWS) est le plus important service de cloud au monde. Cette gigantesque perturbation met en évidence la dépendance croissante des entreprises qui ont opté pour le stockage de leurs données dans le cloud afin d'obtenir des coûts compétitifs et un service sécurisé », a déclaré l'éditeur en ligne Reuters.

Source : Amazon - Reuters

Et vous ?

Que pensez-vous des explications fournies par Amazon ?

Voir aussi

Cloud AWS : Amazon S3 touché par de fortes perturbations ce 28 février, rendant ainsi plusieurs sites et services inaccessibles
  Discussion forum
13 commentaires
  • TiranusKBX
    Expert confirmé
    avoir de gros doigts ne doit pas aider
  • Aeson
    Nouveau Candidat au Club
    Cette gigantesque perturbation met en évidence la dépendance croissante des entreprises qui ont opté pour le stockage de leurs données dans le cloud afin d'obtenir des coûts compétitifs et un service sécurisé
    Cloud ou OnPremise le risque est toujours present. Des cas comme celui la ca arrive tous les jours dans le DC du monde entier. La question est de savoir ou le risque est le plus bas et quelle solution correspond aux besoin et au budget.
  • psychadelic
    Expert confirmé
    Ben voila ce que c'est de travailler directement en ligne de commande sans interface graphique pour la gestion de truc sensibles.

    En Bash une simple erreur de frappe peut s'avérer fatale !