ARCHITECTE INFRA CLOUD ET GPU & INFERENCE IA H/F
Référence : 2026-2312702
- Fonction publique : Fonction publique de l'État
-
Employeur :
Secrétariat général - Service du numérique
Secrétariat général - Direction du numérique - Localisation : 35 rue de la gare 75019 PARIS
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert aux titulaires et aux contractuels
- Expérience souhaitée Confirmé
-
Rémunération Fourchette indicative pour les contractuels Non renseignée Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non
- Télétravail possible Oui
Vos missions en quelques mots
Rattaché(e) au département Infrastructures et des Services du Socle (ISS) et placé(e) sous la responsabilité du chef de bureau Ingénierie, Réseau, Infrastructure et Systèmes (IRIS), vous intervenez en tant qu'architecte infra cloud et GPU & inférence IA. Votre rôle sera d’apporter votre expertise dans l’utilisation de GPU et de service d’inférence d’inférence VLLM dans un contexte principalement Cloud (VM ou K8S Managé) et d’intégration de service LLMaaS. Vous devrez avoir une compréhension approfondie de l'architecture Cloud et GPU et être en capacité d’évaluer les performances de la pile matérielle et logicielle.
À ce titre, vos principales missions (liste non-exhaustive) seront de :
• Concevoir et déployer une infrastructure GPU scalable et performante pour l’inférence des LLMs, capable de supporter jusqu’à plusieurs dizaines de milliers d’utilisateurs en diret ou via des services API
• Mettre en place un dispositif permettant gérer un parc Modèle LLM instanciés et optimiser leur déploiement.
• Concevoir et articuler les gateway et API d’inférence et de RAG (BDD Vectorielle Elastic) à destination des Applicatif tiers.
• Mettre en place des mécanismes robustes de gestion des guardrails, quotas, rate limiting, gestion de file d’attente et sécurité avancée IAM
• Implémenter des solutions de monitoring et observabilité avancées (Prometheus, Grafana).
• Etablir les choix de système d’exploitation et des middlewares de associés à ce contexte.
• Effectuer une veille technologique sur les meilleures pratiques de déploiement à grande échelle de modèles LLM
• Assurer un support interne de niveau 3 sur ces produits.
• Superviser le choix des frameworks, outils et technologies en collaboration avec les data scientists, ML engineers et devOps
• Garantir la scalabilité, la maintenabilité et la sécurité de l’infrastructure
• Évaluer l’impact technique et fonctionnel des choix architecturaux
• Mettre en place et développer des outils d'analyse et d'amélioration des performances
• Maitriser les couts d’usage et identifier et proposer des optimisations.
• Assurer l’optimisation continue (load balancing, auto-scaling) et la haute disponibilité des systèmes.
• Effectuer une veille technologique sur les meilleures pratiques de déploiement à grande échelle de modèles LLM (Triton, vLLM, Ray Serve)
Profil recherché
Intéressé(e) par le monde judiciaire et par le fonctionnement de la justice en France, vous êtes diplômé(e) d'une école d'ingénieur ou équivalent universitaire. Vous justifiez également d'au moins 5 ans d’expérience dans un poste similaire.
Niveau d'études minimum requis
- Niveau Niveau 7 Master/diplômes équivalents
Compétences attendues
Compétences requises
• Expérience dans le déploiement à grande échelle de systèmes distribués (multi-GPU, multi-modèles).
• Environnements matériels : processeurs, GPU, serveurs multiprocesseurs, interfaces de communication ;
• Compétences solides en sécurité et architecture Cloud (IAAS, CAAS)
• Système d'exploitation Linux : administration système, scripts d'automatisation (Bash, python, etc.), DHCP, Diskless, PXE ;
• Environnements de mesure et de gestion du rendement : logiciels de mesure de performances, outils de développement et de débogage système ;
• Connaissance du noyau et des sous-systèmes majeurs ;
• Maîtrise avancée des architecture microservices et conteneurisation (OpenShift, Kubernetes)
• Connaissance des pratiques CI/CD et Infrastructure as Code (Terraform, Kubernetes, GitLab, ArgoCD).
• Connaissance des bases de données vectorielles (Elactic, )
• Connaissance des langages Python, Java, Scala
• Connaissance en machine learning, deep learning
• Connaissance en gestion de modèles IA (MLOps, MLFlow, Hugingface…)
• Connaissance en data engineering (Spark, Kafka, Airflow)
• Connaissance en sécurité des systèmes IA (authentification, protection des modèles, RGPD)
• Connaissances des process de Production et d'exploitation process ITIL
Qualités attendues
• Esprit ouvert & Capacité d'initiative
• Vous faites preuve d'un leadership technique reconnu
• Capacités relationnelles (conduite de réunion, négociation)
Localisation
Éléments de candidature
Documents à transmettre
Qui sommes-nous ?
Au sein de la Direction du Numérique (DNUM), le Département « Infrastructures et Services du Socle (ISS) » déployé sur 3 sites (Paris, Rivery et Nantes) est reparti sur 5 bureaux. Il assure la conception, la réalisation et le maintien en condition opérationnelle et de sécurité du socle technologique des services d’infrastructures de production, l’exploitation des applications nationales ainsi que le support aux utilisateurs au niveau national.
Le département ISS est :
• responsable du périmètre des offres de solutions "cloud computing" interministérielles et privées
• définit, met en œuvre le maintien en condition opérationnelle et de sécurité et la mise à disposition des outils de la chaine CI/CD, de la solution Open shift et des services s'appuyant sur le socle
• offre un point de contact unique de support informatique pour le ministère, le grand public et les professions du droit
• met en valeur les données du ministère en les publiant sur l'open Data de l'état et en proposant des outils d'aide à la décision à travers de nouvelles approches de data science et d'intelligence artificielle
• acteur central de la transformation numérique de la justice, ISS, produit, exploite et intègre les outils numériques répondant à l'objectif d'une justice plus lisible, plus accessible
• est en charge de l’hébergement des centres informatiques du ministère de Nantes et d'Osny
• déploie des ressources informatiques nécessaires au fonctionnement des projets métiers
Descriptif du service
Acteur central de la transformation numérique de la justice, ISS vise à produire, exploiter, intégrer des solutions et outils numériques sécurisés et agiles répondant à l’objectif d’une justice plus lisible, plus accessible et plus efficace.
Le département est composé des cinq bureaux suivants :
• Pilotage, Plan et Marché (PPM)
• Déploiement, Exploitation & Hébergement (DExH)
• Ingénieries, Réseaux, Infrastructures et Systèmes (IRIS)
• Services Transverses & Identité (STI)
• Outils et services Agiles (OSA)
À propos de l'offre
-
Poste soumis à une habilitation au Secret de la défense nationale OUI (1) ✔ NON ☐
Poste nécessitant une enquête administrative de sécurité OUI (2) ✔ NON ☐
(1) Le poste pouvant nécessiter d'accéder à des informations relevant du secret de la défense nationale, le titulaire retenu fera l'objet d'une procédure d’habilitation conformément aux dispositions de l’IGI 1300/SGDSN/PSE/PSD du 9 août 2021.
(2) Conformément à l’article R.114-2 du Code de la sécurité intérieure modifié par le décret n°2018-434 du 4 juin 2018, la décision administrative de recrutement peut nécessiter la réalisation d'une enquête administrative destinée à vérifier que le comportement de la personne intéressée n'est pas incompatible avec l'exercice des fonctions ou des missions envisagées.
Astreintes OUI ☐ NON ✔
Déplacements Réguliers ☐ Ponctuels ☐ Aucun ☐
-
Vacant à partir du 12/06/2026
-
Architecte technique