Postée il y a 14 jours
Rôle et responsabilité
Le Directeur SRE est responsable de la conception et de la mise en ?uvre des environnements nécessaire à une plateforme offrant des services critiques avec de forts volumes dans un Cloud privé opéré par IBM. Il assure le déploiement, la configuration et l?exploitation des services et est le garant de la sécurité et de la qualité des services.
Leadership et Gestion d'Équipe
Diriger et encadrer l'équipe SRE
Accompagner la montée en compétences des membres de l'équipe
Définir les objectifs de l'équipe et suivre leur réalisation
Accompagner la mobilisation des équipes pour le succès du projet «?Move To Cloud?»
Promouvoir une culture de l?amélioration continue et de l?excellence opérationnelle
Mise à disposition des environnements Cloud :
Concevoir et mettre en ?uvre des environnements dans un Cloud privé (technologie IBM)
Industrialiser le provisioning et la gestion des environnements (inc. Infrastructure As Code)
Assurer la connectivité des environnements à son écosystème
Optimiser l'utilisation des ressources Cloud pour maximiser l'efficacité et contrôler/optimiser les coûts (FINOPS)
Assurer le pilotage du projet de mise à disposition d?environnements Cloud
Assurer le pilotage des plannings, couts, qualités & risques
Gestion des processus et des outils liés à l?exploitation (à l?issue de la finalisation de la phase de Delivery et dans un cas de modèle processeur) :
Définir et mettre en place les processus d?exploitation ainsi que les outils associés (ex : ITSM)
Définir et suivi de l?organisation d?exploitation (inc. astreintes)
Mettre en place et maintenir les procédures de gestion des incidents et des problèmes
Surveiller et améliorer la fiabilité, la disponibilité et les performances des services
Garant de la maîtrise des risques et de la conformité des services :
Définir et mettre en place les processus de suivi et gestion des exigences en termes de conformité et de cyber-sécurité
Gestion industrielle des Applications en Production (modèle processeur)
Mettre en place et suivre les tableaux de bord de suivi de l?exploitation
Superviser & industrialiser le déploiement, la configuration et la maintenance des applications en production
Planifier et coordonner les mises à jour et les nouvelles versions des applications en production
Assurer la qualité des services via une surveillance continue des performances et une gestion industrielle des incidents
Assurer la gestion des ressources (« Capacity Management ») en garantissant l?adéquation des infrastructures selon l?évolution du trafic
Garantir les activités de support de Niveau 1 et 2
Automatisation et Amélioration Continue
Mettre en place une culture de l?amélioration continue pour améliorer les performances de la plateforme
Promouvoir et mettre en ?uvre l'automatisation des tâches récurrentes et des processus
Promouvoir la mise en place et l?amélioration des outils de surveillance et d'alerte pour anticiper et prévenir les incidents
Profil candidat:
Compétences requises
Techniques :
Maîtrise de l?exploitation
Maîtrise des technologies/architectures Cloud?et des langages de déploiement associés (Terraform, Helm)
Chaines CICD (ex: Gitlab, Github?)
Kubernetes, Kafka, Postgre?
Solides connaissances en architecture des systèmes d?information
Personnelles :
Leadership et capacité à motiver une équipe
Excellentes compétences en communication écrite et orale
Sens de l?organisation et rigueur
Capacité à gérer le stress et les priorités
Anglais
Autres?:
Pilotage projet IT (planning, budget, qualité?)
Qualifications et expériences
Formation :
Diplôme d?ingénieur
Expérience professionnelle :
Minimum 10 ans d'expérience en IT, avec au moins 5 ans dans un rôle SRE ou de responsable de production informatique