Incendie d'OVH à Strasbourg : l'agilité de Customs Bridge

Dans la nuit du Mardi 9 au Mercredi 10 Mars, le centre de données Strasbourgeois SGB2 d’OVH prend feu.

3,6 millions de sites web se retrouvent hors-ligne, et parmi eux, certains serveurs de Customs Bridge. Heureusement, et grâces aux compétences techniques de notre service informatique, nous étions prêts à rapidement basculer sur une alternative. En effet, depuis le début du mois de Mars, l’équipe technique de Customs Bridge travaille sur la mise en place d’une approche au développement appelée l’Intégration Continue/Déploiement Continu (CI/CD). Cette pratique, permettant aux équipes de produire et mettre en ligne fréquemment et automatiquement des mises-à-jour, permit à notre équipe de restaurer nos services avant la fin de la matinée.

L’intégration continue est une pratique de développement logiciel qui permet d’éviter les conflits entres les différents collaborateurs travaillant sur un même logiciel. Elle permet de rapidement s’assurer que ces mises-à-jour sont publiables et de les mettre en ligne rapidement. Construire une suite de tests automatisée ainsi que paramétrer un moteur de production demande un travail conséquent, travail qu’il était temps de faire pour Customs Bridge au vu de notre développement. En même temps, nous devons continuer d’augmenter la fréquence de publication des améliorations et des nouvelles fonctionnalités, tout en gardant un haut niveau de qualité de service. Ce système fît donc son baptême du feu ce 10 Mars matin. Après avoir fait l’état des lieux, nos services perdus furent automatiquement réinstallés sur des serveurs Gravelinois. Après un simple changement d’adresses Web, nous étions de nouveau en ligne, 2 heures après avoir pris connaissance de l’incident. Alors, sauf accident nucléaire, nous espérons qu’OVH n’aura pas de problème avec son data center de Gravelines. On touche du bois, pourvu qu’il soit ignifugé!

Ce type d’évènement nous rappelle qu’il est de la responsabilité de tous de palier à tous les évènements et de prévoir des plans de continuité de service. Prévoir des services et backups redondants en différents points géographiques, si possible chez différents fournisseurs de service apportent une plus grande résilience face à des évènements limités géographiquement et/ou des attaques ciblant un fournisseur spécifique.

Il est impossible de palier à toutes les éventualités, mais construire son infrastructure tout en gardant en tête les différents risques permet de gagner en rapidité de réaction. C’est ce que nous nous évertuons à faire chez Customs Bridge, et avons démontré notre réactivité lors de cet incident.