ingénieur Fiabilité de Sites / Site Reliability Engineer

ALGER

  • الفئات: المعلوماتية والتكنولوجيا
  • المنطقة: الجزائر
  • وضع في: 12-12-2023 à 06:30:13
الوصف
L’ingénieur SRE est chargé de surveiller, d'automatiser et d'améliorer la fiabilité, les performances et la disponibilité des systèmes dans une organisation. Il travaille sur des tâches telles que la prévention des incidents, la gestion de l'infrastructure, la création de systèmes de surveillance pour assurer un fonctionnement efficaces des systèmes informatiques.

Mission :
Objectifs de ce rôle :
  •  Gérer l'environnement de production en surveillant la disponibilité et en adoptant une vue globale sur l'état des systèmes.
  •  Créer des solutions et des systèmes pour gérer l'infrastructure informatique et les applications métier.
  •  Améliorer la fiabilité, qualité et les délais de mise en production des solutions logicielles
  •  Mesurer et optimiser les performances de l’infrastructure système, pour bien dimensionner les capacités et d'anticiper les besoins des clients pour innover et pour une amélioration continue.
  •  Fournir un support opérationnel et une ingénierie primaire pour plusieurs applications logicielles distribuées.
Responsabilités :
  •  Recueillir et analyser les métriques des systèmes d'exploitation ainsi que des applications pour faciliter l'optimisation des performances et la recherche de pannes.
  •  Collaborer avec les équipes de développement pour améliorer les services grâce à des procédures de test et de publication rigoureuses.
  •  Participer aux conseils en conception de systèmes, à la gestion de la plateforme et à la planification des capacités.
  •  Créer des systèmes et des services durables grâce à l'automatisation et aux améliorations
  •  Équilibrer la vitesse et la fiabilité du développement des fonctionnalités avec des objectifs de niveau de service bien définis


Profil :
Compétences et qualifications requises :;
  • ;Ingénieur, Master ou plus en informatique (Systèmes d’information, IA, ingénierie logiciel)
  • ;Capacité à programmer (structuré et Orienté objet) à l'aide d'un ou plusieurs langages de haut niveau, tels que Python, Java, C/C++, Ruby et JavaScript.
  • ;Expérience avec les technologies de stockage distribué telles que NFS, HDFS, Ceph Dynamic les cadres de gestion dynamique des ressources (Apache Mesos, Kubernetes, Yarn).
  • ;Approche proactive pour identifier les problèmes, les goulots d'étranglement des performances et les domaines à améliorer
  • ;Expérience Solide en Gestion des Systèmes d’exploitation Windows servers, Linux
  • ;Maîtrise des langages de script tels que Python, Shell ou Perl.
  • ;Expérience avec des outils de gestion de configuration comme Ansible, Puppet ou Chef.
  • ;Familiarité avec les plateformes cloud comme AWS, Azure ou Google Cloud.
  • ;Compréhension des principes et protocoles de mise en réseau (TCP/IP, HTTP, DNS, etc.).
  • ;Connaissance des technologies de conteneurisation (Docker, Kubernetes) et des outils d'orchestration.
  • ;Expertise dans les outils de surveillance et de journalisation tels que Prometheus, Grafana, ELK stack ou Splunk.
  • ;Solides compétences en résolution de problèmes et en dépannage, avec la capacité d’analyser et de résoudre des problèmes techniques complexes.
  • ;Excellentes compétences en communication et en collaboration pour travailler efficacement avec des équipes inter fonctionnelles.
  • ;Grande attention aux détails et capacité à travailler dans un environnement dynamique et en évolution rapide
معلومات الإتصال
المزيد من عروض العمل