OVH : l'hébergeur assure que la panne qu'il a connue est entièrement de sa faute
Après avoir accusé le matériel d'EMC

Le , par Coriolan, Chroniqueur Actualités
Jeudi dernier, plus de 50 000 sites Web qui ont opté pour une offre d'hébergement mutualisé ont été affectés par une panne chez OVH. Cet incident a laissé les sites inaccessibles pendant plusieurs heures, une crise d’envergure pour l’hébergeur roubaisien qui n’a pas connu d’incident pareil depuis 2006.

Cette panne a été liée à une baie de stockage EMC VNX 5400 utilisée pour stocker une partie des bases de données des hébergements mutualisés au datacenter de Paris (il s'agit d'un ensemble composé de 96 disques SSD configurés en active/active sur plusieurs baies physiques). Plus de trois millions de sites web répartis sur deux datacenters utilisent cette offre d’hébergement mutualisé d’OVH.

Au début de l’incident, le PDG d’OVH Octave Klaba a pointé du doigt le matériel EMC suite aux soucis rencontrés avec la baie de 96 disques EMC : « Il ne veut plus redémarrer, nous avons contacté le constructeur et essayons de trouver une solution pour récupérer les données hébergées sur cette baie », écrivait-il.

Il faut savoir que ces disques SSD sont configurés en active/active sur plusieurs baies physiques, une façon d’éviter la catastrophe et assurer un service opérationnel tout le temps même au cas où une baie physique tombe en panne. Mais malheureusement pour OVH, ils ont eu des soucis avec les deux baies physiques en même temps, un scénario très rare et qui « n’arrive jamais », affirme Octave Klaba sur Twitter.

Après avoir accusé EMC dans son message initial, OVH informe désormais que cette panne est entièrement de sa faute. « La technologie d'EMC n'est pas à l'origine de l'incident. Nos datacentres ne sont pas adaptés pour héberger ce type d'infrastructure. Seules certaines salles sont spécialement préparées pour ce genre d'hébergement, mais cette baie de Stockage n'y a pas été hébergée ce qui est l'origine du problème. »

Suite à cette ambiguïté de la communication d’OVH, on ne sait pas si l’hébergeur est vraiment responsable de cette panne (et s’est donc trompé d’analyse) ou bien il a dû rétropédaler suite à la pression d’EMC. Une chose est sûre, l’hébergeur informe que cette panne va servir de leçon pour l’hébergeur et qu’il va communiquer les changements qui vont s’opérer dès la fin de cet incident pour éviter de revivre la prochaine panne de cette ampleur dans 10 ans encore.

Cette crise constitue un coup dur pour OVH qui vient de lever 300 millions d’euros pour accélérer son développement à l’international, notamment sur le marché américain.

Source : OVH

Et vous ?

Avez-vous été affecté par cette panne ?

Voir aussi :

OVH : l'hébergeur français met la main sur le cloud public de VMware, pour accélérer son implantation aux États-Unis
OVH victime de la plus violente attaque DDoS jamais enregistrée, par un botnet de caméras connectées qui n'étaient pas sécurisées
OVH va lever 300 millions d'euros, l'hébergeur va ouvrir son capital à des investisseurs tiers pour accélérer son développement à l'international


Vous avez aimé cette actualité ? Alors partagez-la avec vos amis en cliquant sur les boutons ci-dessous :


 Poster une réponse

Avatar de XanatosAO XanatosAO - Membre du Club https://www.developpez.com
le 04/07/2017 à 9:02
Impacté sur deux sites clients « non critique » (même si pour les clients c'est toujours critique et ça se comprend).
A part attendre, il n'y a pas grand chose d'autre à faire vu que les données n'étaient pas accessibles.

D'ailleurs je ne sais pas si OVH propose des offres avec redondance des serveurs ? pour justement pallier à cela.
Avatar de Paul TOTH Paul TOTH - Expert éminent sénior https://www.developpez.com
le 04/07/2017 à 9:32
je trouve cet article intéressant...j'aime bien notamment cette réflexion

Sur les forums, on a ainsi vu des clients se plaindre de perdre des milliers d’euros de chiffre d’affaires du fait de la panne. Ces clients devraient dès maintenant se poser la question de savoir si un hébergement vendu entre 1,5 et 6 €, sans aucune garantie de disponibilité de et SLA, était la meilleure option pour leur précieux site d'e-commerce.

Avatar de hotcryx hotcryx - Membre émérite https://www.developpez.com
le 04/07/2017 à 11:20
C'est déjà la 3e grosse catastrophe de serveurs avec précédemment un admin qui a tout effacé les données clients de son entreprise et le gros plantage de gitlab en début d'année.
Avatar de Patrick Ruiz Patrick Ruiz - Chroniqueur Actualités https://www.developpez.com
le 08/07/2017 à 7:30
Panne OVH : l’hébergeur Web revient sur le dernier incident
Avec plus de détails

Le 29 juin dernier, des dizaines de milliers de sites Web hébergés chez OVH sont passés hors ligne pendant une période prolongée, ce qui a mobilisé les équipes d’OVH pour ramener la situation à la normale. Parallèlement aux actions sur le terrain, l’hébergeur avait brièvement évoqué une panne survenue sur une baie du constructeur EMC. On en sait un peu plus depuis hier puisque OVH a refait surface avec un billet de blog plus détaillé sur l’incident.

« Nous avons eu un incident sur l’une des baies de stockage EMC VNX 5400 que nous utilisons pour stocker une partie des bases de données des hébergements mutualisés à P19 », s’était alors exprimé OVH à propos des origines de l’incident telles que communiquées le 30 juin dernier. Et d’ajouter que « seules certaines salles sont spécialement préparées pour ce genre d’hébergement, mais cette baie de stockage n’y a pas été hébergée, ce qui est à l’origine du problème ».

La dernière communication d’OVH évoque des soucis avec le système de refroidissement à eau de la salle dans laquelle la baie de stockage EMC VNX 5400 à l’origine de la panne avait été logée.

« À 18 h 48, le jeudi 29 juin, dans la salle 3 du datacenter P19, en raison d’une fissure sur un tuyau en plastique souple de notre système de watercooling, une fuite de liquide de refroidissement entraîne la présence de fluide dans l’une des deux baies de stockage propriétaires, lesquelles n’étaient pas refroidies par ce procédé, mais se trouvaient à proximité immédiate. Cela a eu pour conséquence directe la détection d’un défaut électrique entraînant l’arrêt complet de la baie », peut-on y lire.

La baie EMC VNX 5400, mise hors service par les systèmes de protection électrique, n’a pas pu être contrôlée à temps en raison d’une défaillance du système d’alerte audio relié aux sondes de détection de liquide en son sein. OVH évoque le fait qu’une mise à jour de ce système, réalisée le jour même où l’incident s’est produit, n’a pas fonctionné correctement. Le premier technicien n’a donc pu arriver sur les lieux que onze minutes après la détection de la fuite, ce qui a certainement eu un impact important sur la panne.

Entre établissement de l’ampleur des dégâts, rapatriement d’une baie similaire depuis Roubaix sur le site de Paris et restauration des données, il a fallu à OVH un peu plus de 24 heures pour que la situation revienne à la normale à 23 h 40 le vendredi soir.

Bien évidemment, OVH s’excuse pour les désagréments causés et promet un « geste commercial » pour dédommager ses clients de l’indisponibilité du service pendant près de 24 heures. Ces derniers se verront accorder une prolongation de leur offre d’hébergement de deux mois.

OVH annonce également des réaménagements internes dans le dessein de passer du matériel propriétaire vers l’open source, ce qui, d’après lui, permettra une meilleure maîtrise sur les aspects hardware et software de sa chaîne de production.

Source : OVH

Et vous ?

Qu’en pensez-vous ?

Voir aussi :

OVH victime de la plus violente attaque DDoS jamais enregistrée par un botnet de caméras connectées qui n'étaient pas sécurisées
Avatar de jm_zz jm_zz - Nouveau membre du Club https://www.developpez.com
le 14/07/2017 à 0:12
Sans aucune rancune.
Moi je vous remercie de nous expliciter votre incident
Il y a des mystères récents pe : le bug massif TeamViewer que personne n à pour le moment explicite mais vous au moins vous nous faîtes grandir
Oui cela peut arriver ( pour ceux qui explicitement savent ce qu est un bug) merci OVH ! Vous faîtes grandir la communauté et avez toute ma confiance bien plus que bien d autres du monde it
Avatar de jm_zz jm_zz - Nouveau membre du Club https://www.developpez.com
le 14/07/2017 à 0:15
Citation Envoyé par hotcryx  Voir le message
C'est déjà la 3e grosse catastrophe de serveurs avec précédemment un admin qui a tout effacé les données clients de son entreprise et le gros plantage de gitlab en début d'année.

Quid de l étiqu it ?
Contacter le responsable de la rubrique Accueil