Postée il y a 11 jours
Contexte de la missionDans le cadre de la transformation numérique et de l?amélioration continue des services digitaux, une entreprise leader dans le secteur de l?énergie recherche un(e) expert(e) en Observabilité et APM. L?objectif de la mission est de renforcer les capacités de surveillance avancée et d?optimisation de la performance applicative en exploitant une plateforme basée sur Splunk Cloud et ses solutions d?observabilité (Splunk Observability Cloud, IT Service Intelligence, SignalFx).
Le(la) consultant(e) interviendra au sein d?une équipe dédiée à la supervision des infrastructures et applications critiques, contribuant ainsi à la résilience et à la disponibilité des services IT.
Objectifs et livrables1. Développement et optimisation de la plateforme Splunk CloudConfigurer et maintenir la plateforme Splunk en fonction des besoins métier et techniques.
Développer des tableaux de bord, recherches avancées et alertes pour une visualisation optimale des données IT.
Intégrer et corréler des sources de données variées (logs, métriques, traces) issues de différentes stacks technologiques (Java, Python, Node.js, PHP).
2. Implémentation des solutions d?observabilitéConfigurer et exploiter les modules Splunk Observability : Infrastructure Monitoring, APM, RUM et Synthetic Monitoring.
Intégrer OpenTelemetry pour collecter des métriques, traces et logs.
Paramétrer et déployer des agents de supervision (ex : Fluentd) pour les environnements Cloud (ECS, EC2).
Surveiller la performance applicative et détecter les anomalies en temps réel.
Implémenter Splunk Log Observer pour une analyse avancée des logs.
Mettre en place Splunk RUM afin d?analyser l?expérience utilisateur sur les applications web et mobiles.
Déployer des tests synthétiques pour anticiper et prévenir les dégradations de services.
3. Mise en place et gestion d?ITSI (IT Service Intelligence)Implémenter et configurer ITSI pour la supervision des services critiques.
Développer des indicateurs clés de performance (KPI) et des mécanismes de corrélation d?événements.
Élaborer des plans d?action basés sur les insights ITSI pour optimiser la disponibilité et la résilience des services IT.
4. Intégration avec des outils tiersConnecter Splunk à des solutions externes telles qu?AWS CloudWatch, Datadog ou Prometheus pour enrichir la visibilité.
Automatiser les workflows d?intégration et de surveillance via Terraform.
5. Amélioration continue et innovationProposer et implémenter des solutions avancées pour améliorer l?observabilité et la performance des systèmes.
Intégrer Splunk Observability dans les pipelines CI/CD pour identifier les problèmes en amont.
Produire des rapports stratégiques sur les KPI et objectifs de niveau de service (SLO).
6. Formation et support aux équipesAccompagner les équipes internes dans l?utilisation des solutions Splunk et ITSI.
Fournir un support technique avancé pour résoudre les incidents liés à l?observabilité et l?APM.
C
Profil candidat:
ompétences requisesExpertise technique :Maîtrise des solutions d?observabilité et de supervision IT (Splunk ou solutions équivalentes).
Excellentes connaissances des concepts d?observabilité (logs, métriques, traces).
Expertise en environnement Cloud et supervision des architectures cloud-native.
Bonne maîtrise des langages de développement (Python, Java?).
Compétences avancées en scripting (Python, Bash, etc.).
Expérience avec les outils d?automatisation et d?Infrastructure as Code (Terraform).
Connaissances des méthodologies ITIL et des bonnes pratiques de gestion des services IT.
Compétences comportementales :Autonomie, esprit d?initiative et force de proposition.
Excellentes capacités de communication orale et écrite.
Capacité à évoluer dans un environnement agile et en forte transformation.
Sens du service, esprit d?équipe et dynamisme.
Organisation et rigueur dans le suivi des projets.
Niveau d?expertise attendu
Niveau requis AWS Expert
Solutions de supervision et observabilité Expert
Développement (Python, Java?)Expert
Scripting (Python, Bash, etc.)ExpertSplunk (Cloud, ITSI, Observability)Expert