L’enquête avait pour objectif d’identifier les causes précises de cet incident, d’étudier les processus d’alerte et d’émettre des recommandations pour en tirer tous les enseignements nécessaires.Le 2 juin, de 16h45 à minuit, les services voix d’Orange ainsi que l’accès à certains services d’urgence ont été perturbés sur le plan national. Pendant cette période environ 11 800 appels, soit 11 % du total d’appels, n’ont pas été acheminés vers les services d’urgence. L’enquête confirme qu’il s’agit bien d’un dysfonctionnement logiciel.Le dysfonctionnement a porté sur l’interconnexion entre les services voix mobile, voix surIP d’une part et ceux hébergés sur le réseau commuté (la plupart des numéros d’urgenceétant sur cette technologie)d’autre part,suite à une opération de modernisation et d’augmentation capacitaire du réseau,débutée début mai,pour répondre à l’accroissement du trafic. L’interconnexion repose sur une plateforme de calls servers. Un dysfonctionnement de la plateforme de service est intervenu et a provoqué les perturbations. Ce dysfonctionnement est la conséquence d’un bug dans les logiciels des calls servers. Ce bug s’est activé suite à des commandes usuelles de reconnexion, perturbant le fonctionnement global des calls servers malgré leur redondance entre les six sites distincts.Cette défaillance logicielle est désormais identifiée par le partenaire fournisseur des équipements concernés et un correctif a été adressé.Les équipes d’Orange ont identifié le dysfonctionnement logiciel immédiatement, grâce aux systèmes d’alerte internes, et ont alors engagé les premières opérations techniques, qui n’ont malheureusement pas permis de rétablir immédiatement le service. La complexité de la panne, la variété des technologies et des architectures réseau des services d’urgence ont retardé le diagnostic. Une fois l’analyse établie, la résolution s’est effectuée en quelques heures grâce à la mobilisation d’une centaine d’experts.Malgré la mobilisation des équipes techniques, le retard dans l’activation de la cellule de crise managériale a entraîné une communication tardive vers toutes les parties prenantes. Le 3 juin, en accord avec le comité interministériel de crise, Orange a mis en place une cellule d’accueil visant à traiter au cas par cas les situations locales résiduelles remontées par les préfectures. Cette cellule a été maintenue en veille jusqu’au lundi 7 juin.L’enquête reconnaît l’implication immédiate et la forte mobilisation des acteurs techniques dès l’apparition des premières perturbations et la collaboration avec les autorités pour revenir à la normale. Il est néanmoins relevé la nécessité d’améliorer la rapidité de la diffusion de l’information vers les différentes parties prenantes de cette crise: les pouvoirs publics, les services d’urgence et les médias. Il ressort de l’enquête de l’Inspection générale du Groupe, plusieurs recommandations structurantes: renforcer la supervision de bout en bout des services vitaux et des numéros d’urgence ; réduire de deux heures à 30 minutes maximum le délai de déclenchement d’une cellule de crise, en cas de perturbation touchant les appels aux services d’urgence et services vitaux au niveau national ; accompagner les services de l’État dans l’accélération de la migration vers la technologie IP des centres d’appel des services publics et des entreprises en RTC, pour renforcer la résilience de ces équipements ; proposer de mettre en place un numéro dédié, disponible 24h sur 24h et 7 jours sur 7, pour les parties prenantes (services de l’État, CHU, samu...) en cas de dysfonctionnement sur les numéros d’urgence ; proposer l’utilisation, en concertation avec chaque acteur concerné, d’un mécanisme de diffusion massive par SMS de consignes d’usage en cas de panne affectant les services d’urgence ; poursuivre une analyse comparative de l’évènement avec des incidents similaires intervenus dans d’autres pays européens comme en Allemagne, au Royaume-Uni, en Belgique ou encore aux États-Unis.En tant que Président de la GSMA, Stéphane Richard proposera de mettre en place, au niveau mondial, la création d’une cellule chargée de répertorier et analyser les dysfonctionnements réseau entresensibles afin de partager les retours d’expérience opérateurs. Cet évènement rare rappelle le caractère crucial et essentiel des réseaux.Orange est conscient de cette responsabilité, renouvelle ses excuses à toutes les personnes directement ou indirectement touchées par ce dysfonctionnement, et reste pleinement mobilisé pour fournir à ses clients des services de qualité.Le contrôle de la sécurité et de l'intégrité du réseau et des services d'Orange demandé par le gouvernement français suivra. Il est piloté par l'Agence nationale de sécurité des systèmes d'information (Anssi). Ses conclusions sont attendues dans un délai de deux mois. Le PDG d'Orange Stéphane Richard, qui avait présenté des excuses publiques juste après l'incident, doit par ailleurs être auditionné mercredi par la commission des Affaires économiques de l'Assemblée nationale.Source : Orange