• TéléchargerPDF – 42.51Ko

(H/F) Ingénieur de recherche - Support et développement HPC/HPDA pour l'analyse de données in-situ avec

Référence : UAR3441-YUSWAN-002

  • Fonction publique : Fonction publique de l'État
  • Employeur : Centre national de la recherche scientifique (CNRS)
  • Localisation : 91191 ST AUBIN (France)
  • TéléchargerPDF – 42.51Ko

Partager la page

Veuillez pour partager sur Facebook, Twitter et LinkedIn.

  • Nature de l’emploi Emploi ouvert uniquement aux contractuels
  • Nature du contrat Non renseigné
  • Expérience souhaitée Non renseigné
  • Rémunération Fourchette indicative pour les contractuels 3200 brut mensuel € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
  • Catégorie Catégorie A (cadre)
  • Management Non renseigné
  • Télétravail possible Non renseigné

Vos missions en quelques mots

Missions :
Face à la complexité croissante des codes de simulation numérique, de nouvelles approches sont nécessaires pour analyser le volume toujours plus important de données. Cela requiert un couplage entre des bibliothèques d'analyse de données modernes et les codes de simulation numérique existants hautement optimisés. La bibliothèque de couplage PDI Data Interface est conçue pour répondre à cet objectif.

La bibliothèque open-source PDI Data Interface est conçue et développée pour le couplage lâche local aux processus dans les codes de simulation hautes performances. PDI supporte la modularisation des codes en intermédiant l'échange de données entre le code de simulation principal et des modules indépendants (plugins) basés sur diverses bibliothèques. Elle est développée en C++ moderne et propose des API en C, Fortran et Python.

PDI offre un système de référence similaire au shared_ptr du C++ ou du Python avec verrouillage pour garantir un accès cohérent par les modules couplés. Il fournit un espace de noms global (le data store) pour partager des références et implémente le modèle Observateur, permettant aux modules de réagir à la disponibilité et aux modifications des données. Il met en œuvre un système de métadonnées qui peut spécifier un type dynamique pour les références basé sur la valeur d'autres données (par exemple, la taille d'un tableau basée sur la valeur d'un entier partagé). Les codes utilisant l'API déclarative de PDI exposent les tampons dans lesquels ils stockent les données et déclenchent des notifications lorsque des étapes significatives de la simulation sont atteintes. Des bibliothèques tierces comme HDF5, JSON ou netCDF sont encapsulées dans un plugin PDI. Un fichier de configuration YAML est utilisé pour entrelacer les plugins et le code supplémentaire sans modifier l'application originale.

Un autre aspect que nous explorons avec PDI est l'analyse de données in-situ, qui effectue des analyses numériques pendant la simulation. Cela est nécessaire en raison de l'écart croissant entre la bande passante du système de fichiers et les capacités de calcul. À cette fin, nous développons le plugin Deisa. Ce plugin est basé sur le framework open-source Dask et nous permet de transférer les données vers des processus dédiés pour l'analyse in-situ.

L'un de nos objectifs est d'établir un mécanisme de rétroaction entre l'analyse de données in-situ et la simulation numérique. Cela permet une meilleure allocation des ressources et un monitoring en temps réel de la simulation. Un autre aspect permis par l'analyse in-situ est l'utilisation de méthodes d'IA pour le HPC et le HPDA. Par exemple, nous pouvons employer la détection non supervisée d'événements rares pendant la simulation, ce qui peut réduire significativement le volume de données produites, réduisant ainsi la charge sur le système de fichiers.
Activités :
En tant que membre de l'équipe PDI nouvellement créée, votre miss
Voir plus sur le site emploi.cnrs.fr...

Profil recherché

Competences :
Le/la candidat(e) retenu(e) maîtrisera les compétences et connaissances suivantes :
- Maîtrise du C++ moderne (C++14 et supérieur)
- Génie logiciel et conception de bibliothèques
- Environnement de développement moderne (Linux, git, CMake, etc.)
- Communication (rédaction, présentation et formation)
- Travail en équipe et intégration dans un environnement international
Les éléments suivants seront considérés comme un atout :
- Connaissance des bibliothèques d'analyse de données comme Dask
- Maîtrise et expérience avec Python, Fortran et/ou le calcul GPU
- Connaissances en HPC et bibliothèques parallèles comme OpenMP et MPI
- Expérience avec les bibliothèques d'E/S parallèles HPC comme HDF5 ou NetCDF
- Expérience avec les outils de calcul intensif (slurm, sbatch, etc.), l'empaquetage et le déploiement
Contraintes et risques :

Niveau d'études minimum requis

  • Niveau Niveau 7 Master/diplômes équivalents
  • Spécialisation Formations générales

Langues

  • Français Seuil

Qui sommes-nous ?

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.

C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.

En savoir plus sur l'employeur

À propos de l'offre

  • Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

  • Vacant
  • Chercheuse / Chercheur

Des offres d'emplois recommandées pour vous