Familiale
Île-de-France
Publié il y a 1 semaine

Notre client est un acteur Cloud, opérateur souverain et durable de l’Expérience en tant que Service qui offre à ses clients des environnements technologiques de confiance.

Nous recherchons un Ingénieur Stockage.

Vos missions :
Conception et mise en œuvre de solutions de stockage IA
– Définir l’architecture stockage (objets, blocs, fichiers) pour les besoins d’IA et du cloud.
– Dimensionner les clusters afin de soutenir les charges GPUintensives.
– Déploiement d’un stockage objet exaoctetcompatible S3
– Créer et maintenir un service objet (MinIO, Ceph RGW, etc.) capable de s’étendre à l’exaoctet.
– Intégrer ces clusters dans les environnements clients (public, privé, hybride).
– Exploitation des technologies hauteperformance
– Utiliser RDMA, GPU Direct Storage, SPDK et les systèmes de fichiers distribués (Ceph, Lustre, BeeGFS, DAOS)
– Optimiser le chemin de données GPU ↔ stockage pour minimiser latence et CPU overhead.
– Fiabilité, durabilité et observabilité
– Mettre en place des mécanismes de réplication, d’érasurecoding, de snapshots et de sauvegarde/PRA.
– Développer tableaux de bord (Prometheus / Grafana) et indicateurs (latence I/O, débit, taux d’erreur).
– Support opérationnel et dépannage
– Surveiller les systèmes en production, analyser les alertes, corriger les incidents.
– Gestion du ticketing Niveau 2.
– Collaboration et suivi client/fournisseur :
– Travailler avec les équipes Ops, Cloud, Sécurité et les fournisseurs de matériel (NVIDIA, NetApp, PureStorage…).
– Assurer le suivi des demandes d’évolution et des SLA avec les clients internes/externes.
– Analyse télémétrie & amélioration continue
– Collecter et exploiter les métriques et traces (DCGM Exporter, logs, flux télémétriques).
– Proposer des optimisations (tuning PFC/ECN, réglage du BIOS, configuration du réseau RDMA).
– Documentation :
– Rédiger procédures, diagrammes d’architecture et tenir à jour le wiki Confluence/NetBox.
– Veille technologique
– Suivre les évolutions de SPDK, GPUDirect Storage, protocoles objet à grande échelle et standards RDMA.
– Réaliser des proofofconcept (NVMeoF, RDMA over Converged Ethernet).

Périmètre d’intervention : Europe, Amérique du Nord, Asie

Profil requis :
Formation : ingénieur ou équivalent BAC+5.
Expérience professionnelle antérieure :
– Expérience professionnelle : Minimum 2 ans d’expérience en environnement de
production sur le stockage objet ou les systèmes de fichiers distribués.
– Compétences techniques souhaitées :
o Solide expérience avec stockage objet (S3, MinIO, Ceph RGW) ou Systèmes de fichiers distribués (Ceph, Lustre, BeeGFS, DAOS).
o Maîtrise d’un langage de programmation système : Go, C ou Rust.
o Connaissance approfondie des protocoles de stockage (S3, NFS, NVMeoF, RDMA).

Compétences complémentaires (au moins 2 parmi les suivantes) :
o Plateforme GPU : NVIDIA DGX/HGX, NVLink/NVSwitch, GPU Operator (K8s)
o Stockage : NetApp, PureStorage, BeeGFS, Ceph, Lustre, ZF, NFSv4.1/pNFS
o Réseau stockage : InfiniBand HDR/NDR, Ethernet Spectrum (RoCEv2),
ConnectX6/7, tuning PFC/ECN.
o Automatisation : Ansible, Terraform, Git/GitLab CI.
o Administration Linux (kernel tuning, udev)
o Outils de supervision : Prometheus, Grafana, DCGM Exporter, Zabbix, NetBox.

Langue : maîtrise du français et de l’anglais obligatoire.
Softskills :
– Analyse & résolution de problèmes complexes
– Esprit d’équipe et bonnes capacités de communication
– Autonomie, sens de l’initiative

Caractéristiques de l'emploi

Référence offre

AB10IS

Postuler en ligne

Un email valide est requis.