Boujour à tous, si comme moi, votre site web à affiché une erreur 503 sur ces dernières semaines, vous avez probablement été impacté par l’incendie qui à eu lieu sur le Datacenter d’OVH à Strasbourg (mercredi 10 mars 2021).
Heureusement personne n’a été blessée dans cet incendie. On ne peut pas en dire autant des données. Beaucoup seront irrécupérables…
Oui, ça peut arriver de perdre des données avec le cloud. Il faut comprendre que derrière le “cloud” se trouve des serveurs physiques positionnés dans des datacenters physiques eux aussi (désolé de vous décevoir mais le cloud ce n’est pas magique 😜).
- Mais alors, comment peut on se prémunir de ce genre d’incidents ? Quelle sont les solutions ? 🤔
Dans un premier temps, il va falloir consulter les offres de Plan de Reprise d’Activité (PRA) proposé par votre hébergeur. C’est payant, mais ça peut dans des cas comme celui-ci, sauver votre entreprise ou votre business. Pensez aussi à effectuer des sauvegardes externes, ou souscrire à une solution de sauvegarde, directement auprès de votre hébergeur.
Deuxièmement, penser à l’Infrastructure as Code (IaC) à l’aide d’outils comme Ansible ou Terraform. Ces technologies vont vous permettre de transformer la configuration de votre infrastructure en code (fichiers de configuration, adresses IP, ressources des machines… bref, tout y passe 😜). On peut en tirer deux grands avantages. Le premier, la capacité à versionner votre infrastructure. Si le déploiement ne se passe pas comme prévu, il est très aisé de revenir en arrière, à une version antérieure. Ça permet aussi, de détruire et de recréer à la volée vos machines avec leur configuration. Une seul ligne de commande est suffisante pour rétablir votre architecture.
On va alors entrer dans une démarche dites Pet vs Cattle. C’est à dire que l’on ne voit plus son serveur comme un animal de compagnie, que l’on va “chouchouter” tout au long de sa vie. Mais nous allons être vers une approche dite “Cattle”. Cette gestion industrielle de machines toutes identiques, sans personnalité que l’on n’hésite pas à détruire. Nous pouvons faire l’analogie suivante, la gestion d’une ferme de 1 000 vaches plutôt que de vos 4 chats pas exemple.
Vous devez vous entrainer à détruire et récréer vos VMs, juste pour vérifier que déjà, vous être en capacité de le faire, puis, de valider le PRA dont on a parlé au début de cet article.
Conclusion
Si vous savez détruire et recréer votre infrastructure sans perte de données (grâce a l’IaC ou des procédures de backup et restauration), ce genre de problématiques aura peu d’impact. Il faut s’entrainer et tester ces procédures régulièrement. Car le jour ou l’on en a besoin il sera trop tard… 😰
Je tiens à féliciter les pompiers présents sur place ce mercredi 10 mars 2021, ainsi qu’OVH pour la transparence et la gestion de cet incident. Un grand bravo ! 👏🏻
Comments are closed.