
ARCHITECTE INFRA CLOUD & GPU INTELLIGENCE ARTIFICIELLE (F/H)
Référence : 2025-1949712
- Fonction publique : Fonction publique de l'État
-
Employeur :
Secrétariat général - Service du numérique
Ministère de la Justice - Secrétariat Général - Direction du numérique - Localisation : 35 rue de la gare 75019 PARIS
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert aux titulaires et aux contractuels
- Expérience souhaitée Confirmé
-
Rémunération Fourchette indicative pour les contractuels Non renseignée Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non
- Télétravail possible Oui
Vos missions en quelques mots
Rattaché(e) au département Infrastructures et des Services du Socle (ISS) et placé(e) sous la responsabilité du chef de département, vous intervenez en tant qu'Architecte Infra Cloud et GPU. À ce titre, vous devrez apporter votre expertise dans l’utilisation de GPU dans un contexte principalement Cloud mais aussi On premise. Vous devrez avoir une compréhension approfondie de l'architecture Cloud et GPU et être en capacité d’évaluer les performances de la pile matérielle et logicielle.
Vos principales missions (liste non-exhaustive) seront de :
• Concevoir et déployer une infrastructure GPU scalable et performante pour l’inférence des LLMs, capable de supporter jusqu’à plusieurs dizaines de milliers d’utilisateurs ;
• Mettre en place des mécanismes robustes de gestion des quotas, rate limiting et sécurité avancée ;
• Implémenter des solutions de monitoring et observabilité avancées (Prometheus, Grafana) ;
• Etablir les choix de système d’exploitation et des middlewares associés à ce contexte ;
• Effectuer une veille technologique sur les meilleures pratiques de déploiement à grande échelle de modèles LLM (Triton, vLLM, Ray Serve)
• Assurer un support interne de niveau 3 sur ces produits ;
• Superviser le choix des frameworks, outils et technologies en collaboration avec les data scientists, ML engineers et devOps ;
• Garantir la scalabilité, la maintenabilité et la sécurité de l’infrastructure ;
• Évaluer l’impact technique et fonctionnel des choix architecturaux ;
• Mettre en place et développer des outils d'analyse et d'amélioration des performances ;
• Maitriser les couts d’usage et identifier et proposer des optimisations ;
• Assurer l’optimisation continue (load balancing, auto-scaling) et la haute disponibilité des systèmes ;
Profil recherché
Intéressé(e) par le monde judiciaire et par le fonctionnement de la justice en France, vous êtes diplômé(e) d'une école d'ingénieur ou équivalent universitaire. Vous justifiez également 5 ans d’expérience dans un poste similaire.
Niveau d'études minimum requis
- Niveau Niveau 7 Master/diplômes équivalents
Compétences attendues
Expérience dans le déploiement à grande échelle de systèmes distribués (multi-GPU, multi-modèles) ;
• Environnements matériels : processeurs, GPU, serveurs multiprocesseurs, interfaces de communication ;
• Compétences solides en sécurité et architecture Cloud (IAAS, CAAS)
• Environnement de développement liés aux GPUs : C/C++, CUDA, ROCM ;
• Système d'exploitation Linux : administration système, scripts d'automatisation (Bash, python, etc.), DHCP, Diskless, PXE ;
• Environnements de mesure et de gestion du rendement : logiciels de mesure de performances, outils de développement et de débogage système ;
• Connaissance du noyau et des sous-systèmes majeurs ;
• Maîtrise avancée des architectures microservices et conteneurisation (OpenShift, Kubernetes) ;
• Connaissance des pratiques CI/CD et Infrastructure as Code (Terraform, Kubernetes, GitLab) ;
• Connaissance des bases de données vectorielles (FAISS, Pinecode) ;
• Connaissance des langages Python, Java, Scala ;
• Connaissance en machine learning, deep learning ;
• Connaissance en gestion de modèles IA (MLOps, MLFlow, SageMaker…) ;
• Connaissance en data engineering (Spark, Kafka, Airflow) ;
• Connaissance en sécurité des systèmes IA (authentification protection des modèles, RGPD) ;
• Connaissances des process de Production et d'exploitation process ITIL ;
• Anglais technique est requis.
Localisation
Éléments de candidature
Documents à transmettre
Personnes à contacter
Qui sommes-nous ?
Au sein de la Direction du Numérique (DNUM), le Département « Infrastructures et Services du Socle (ISS) » déployé sur 3 sites (Paris, Rivery et Nantes) est reparti sur 5 bureaux. Il assure la conception, la réalisation et le maintien en condition opérationnelle et de sécurité du socle technologique des services d’infrastructures de production, l’exploitation des applications nationales ainsi que le support aux utilisateurs au niveau national.
Le département ISS est :
• responsable du périmètre des offres de solutions "cloud computing" interministérielles et privées
• définit, met en œuvre le maintien en condition opérationnelle et de sécurité et la mise à disposition des outils de la chaine CI/CD, de la solution Open shift et des services s'appuyant sur le socle
• offre un point de contact unique de support informatique pour le ministère, le grand public et les professions du droit
• met en valeur les données du ministère en les publiant sur l'open Data de l'état et en proposant des outils d'aide à la décision à travers de nouvelles approches de data science et d'intelligence artificielle
• acteur central de la transformation numérique de la justice, ISS, produit, exploite et intègre les outils numériques répondant à l'objectif d'une justice plus lisible, plus accessible
• est en charge de l’hébergement des centres informatiques du ministère de Nantes et d'Osny
• déploie des ressources informatiques nécessaires au fonctionnement des projets métiers
Descriptif du service
Acteur central de la transformation numérique de la justice, ISS vise à produire, exploiter, intégrer des solutions et outils numériques sécurisés et agiles répondant à l’objectif d’une justice plus lisible, plus accessible et plus efficace.
Le département est composé des bureaux suivants :
• Pilotage et performances (BPP)
• Centre de services national (CSN)
• Expertise technique et des infrastructures (ETI)
• Expertise des Services de Production (ESP)Centre de Compétences Tests • Centre de Compétences Tests (CCT)
À propos de l'offre
-
• Participation ponctuelle à des opérations en heures non-ouvrées
• Possible participation au dispositif d’astreinte de niveau 3
• Ce poste est soumis à l’habilitation de niveau « Confidentiel Défense » -
Vacant à partir du 10/06/2025
-
Architecte technique