Pourquoi cette transformation ?
Face à la complexité croissante des systèmes et aux exigences de qualité, G2S a fait évoluer le rôle d’ingénieur d’exploitation vers celui de Site Reliability Engineer (SRE). Le SRE est une discipline née chez Google qui combine ingénierie logicielle et exploitation des systèmes pour garantir la fiabilité, la performance et la scalabilité des services informatiques. Objectif : passer d’une approche réactive à une démarche proactive, centrée sur la fiabilité, l’automatisation et la performance.
Les 3 piliers de la transformation à G2S
• Observabilité : éviter les incidents en analysant les signaux faibles et en prenant des mesures préventives. Il s’agit aussi de comprendre les causes racines des incidents grâce à la corrélation des logs, métriques et traces. G2S a déployé une solution d’Observabilité avec un écosystème d’outillage notamment autour de Dynatrace et Elastic.
• Culture : adopter un état d’esprit orienté qualité et fiabilisation. Le SRE, c’est une nouvelle manière de penser la fiabilité.
• Collaboration Dev & Ops : casser les silos et travailler ensemble dès la conception pour intégrer la fiabilité et la performance au cœur des projets.
Les leviers pour réussir
• Automatisation et réduction des tâches manuelles répétitives pour gagner en efficacité. A G2S, nous implémentons l’auto-remédiation des alertes les plus courantes. C’est le cas par exemple des alertes de consommation d’espace disque sur les filesystems qui sont automatiquement remédiées. De même des services sont automatiquement relancés comme certains streaming évènementiels.
• Pilotage par les SLO (Service Level Objective) et Error Budgets : définir des objectifs mesurables pour la fiabilité. Ainsi à G2S, les applications les plus critiques disposent de SLO permettant de piloter la qualité de l’application en se rapprochant le plus possible de l’expérience utilisateur. Les consommations de budgets d’erreurs trop importantes génèrent des alertes de manière à intervenir au plus vite et corriger.
• Formation et acculturation : mettre en place des sessions dédiées pour embarquer les équipes et diffuser les bonnes pratiques. A G2S, des évènements de promotion de la démarche SRE et de l’observabilité ont été réalisés sur la majeure partie des sites de G2S. Environs 300 collaborateurs et collaboratrices G2S ont pu participer à des conférences et démonstrations.
Des réussites concrètes
Depuis 2 ans, des projets majeurs G2S ont permis de mettre en place les pratiques SRE à l’échelle de l’entreprise. Citons par exemple le nouveau poste du commercial et l’application de gestion des parcours clients.
Le projet du nouveau poste du commercial a introduit une culture de la mesure propres à la démarche SRE avec des SLO (Service Level Objectives) et des dashboards Dynatrace.
• Détection proactive des anomalies avant impact utilisateur. Mise en place d’une observabilité avancée pour détecter les signaux faibles.
• Mise en place d’alertes intelligentes pour anticiper les dégradations.
• Collaboration renforcée entre Dev et Ops pour ajuster les seuils de fiabilité.
• Mise en place des indicateurs d’expérience utilisateur afin d’être encore plus proche de ce que vivent réellement nos utilisateurs.
Le projet d’application de gestion des parcours clients a intégré l’observabilité et les pratiques SRE dans les parcours clients afin de les fiabiliser.
• Suivi en temps réel des performances des parcours transactionnels.
• Alertes ciblées pour corriger rapidement les anomalies.
• Coopération MOE / exploitation pour garantir la qualité des opérations critiques.
Ces projets sont deux beaux exemples de réussite, mais ce n’est qu’un début, nous progressons également de manière significative sur l’observabilité du ressenti utilisateur, entre autres sur nos solutions GED.
Et demain ?
G2S poursuit le développement des pratiques SRE, notamment au travers du déploiement de l’observabilité et de ses cas d’usage. Avec l’intensification des pratiques DevOps, ce ne seront plus uniquement les projets et applications majeures qui bénéficieront de l’accompagnement d’un SRE mais bel et bien tous les nouveaux projets et applications cœur de métier de nos clients.