INGÉNIEUR(E) DE RECHERCHE EN SCIENCES DES DONNÉES ET IA GÉNÉRATIVE POUR LE SYSTÈME TERRE (H/F)
Référence : UAR2013-JEAMAL-004
- Fonction publique : Fonction publique de l'État
- Employeur : Centre national de la recherche scientifique (CNRS)
- Localisation : 67000 STRASBOURG (France)
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
-
Nature du contrat
CDD de 3 ans
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels 2200 à 2500 € ajustable selon le niveau d'expérience € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Missions :
Contexte : Le Centre National de la Recherche Scientifique (CNRS) recrute un·ingénieur de recherche (H/F) en intelligence artificielle avec une expertise en IA générative, apprentissage profond et architectures agentiques afin de concevoir, développer et mettre en œuvre des services avancés de découverte, d'exploration et d'analyse de données du système Terre. Le poste s'inscrit dans les activités de l'infrastructure de recherche nationale Data Terra et du projet européen Horizon Europe GenAI4Earth, coordonné par le CNRS. Le projet rassemble 17 partenaires académiques et industriels issus de dix pays européens autour du développement de nouvelles générations de services d'IA pour les données environnementales, géospatiales et scientifiques.
Missions
L'ingénieur de recherche (H/F) développera des méthodes et services avancés d'intelligence artificielle pour la découverte, l'intégration et l'analyse de données scientifiques multimodales dans le cadre des activités du projet européen GenAI4Earth et du nœud EOSC de Data Terra.
Les travaux porteront notamment sur :
- le développement d'architectures RAG et d'agents IA pour l'exploration conversationnelle de catalogues de données scientifiques hétérogènes,
la construction de représentations sémantiques (embeddings, indexation vectorielle) unifiées de métadonnées et données scientifiques (images, séries temporelles, signaux),
- le développement et l'évaluation de modèles fondation appliqués aux données environnementales et géophysiques, en particulier à travers l'exploitation de méthodes d'apprentissage auto-supervisé (self-supervised learning) pour l'analyse de flux de données massifs et faiblement annotés ;
- l'opérationnalisation de services IA dans des environnements de production à haut niveau de maturité technologique (TRL supérieur à 7).
Activités :
Activités principales :
Activité 1 : IA générative et découverte sémantique de données scientifiques Système Terre (40%)
Cette activité concerne la conception et le développement d’architectures d’IA générative et agentique pour la découverte de données scientifiques multimodales à partir de catalogues et infrastructures de données environnementales européennes. Les développements incluront notamment :
- l'utilisation d’architectures Retrieval-Augmented Generation (RAG) et d’agents IA basés sur LangChain ou des frameworks équivalents,
- l’intégration de modèles d’embeddings open-source (Nomic, BGE, E5 ou équivalents) et des moteurs de recherche vectorielle,
- l’orchestration de modèles de langage open-source (familles Mistral ou équivalentes) pour l’enrichissement et complétion automatique de métadonnées scientifiques, et la recherche sémantique appliquée aux catalogues de données.
Activité 2 : Modèles fondation pour les données pour les données scientifiques Système Terre (40%)
Cette activité concerne le développement d'architectures de modèles fondation appliqués aux données s
Voir plus sur le site emploi.cnrs.fr...
Profil recherché
Competences :
Profil recherché : Doctorat ou diplôme d’ingénieur avec expérience significative en IA, science des données, traitement du signal ou disciplines connexes,
- Très bonne maîtrise du développement Python/Julia et des frameworks IA modernes (PyTorch, Hugging Face, Lightning, LangChain, etc.),
- Expérience en apprentissage profond, modèles génératifs ou modèles fondation,
- Compétences en traitement de données multimodales (images, signaux, séries temporelles, données géospatiales),
- Connaissance des architectures RAG, embeddings et moteurs de recherche vectorielle,
- Expérience en infrastructures cloud/HPC et environnements GPU
Intérêt pour les données environnementales,
Savoir-faire :
- Analyser un besoin scientifique et le traduire en spécification technique opérationnelle,
- Piloter et structurer un projet de bout en bout (planification, reporting, respect des délais),
- Expérience dans des projets internationaux multi-partenaires et capacité à s’intégrer dans des environnements collaboratifs complexes,
- Très bonnes compétences rédactionnelles pour la production de rapports, livrables et documentations
- Maîtriser le français et l’anglais écrit et oral.
- Anticiper les évolutions technologiques et proposer des orientations techniques pertinentes.
Savoir-être :
- Sens de l'initiative, autonomie, rigueur,
- Vision stratégique et esprit d'innovation
- Capacités d'organisation, d'encadrement et d'animation
- Goût pour le travail en équipe et en mode projet.
Contraintes et risques :
Aucun risque
Niveau d'études minimum requis
- Niveau Niveau 7 Master/diplômes équivalents
- Spécialisation Sciences naturelles (biologie-géologie)
Langues
- Français Seuil
Qui sommes-nous ?
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.
C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.
Depuis plus de 80 ans, le CNRS développe des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit entre ses missions de recherche et le transfert vers la société fait du CNRS un acteur clé de l’innovation en France et dans le monde.
Le partenariat qui lie le CNRS avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires témoignent du potentiel économique de ses travaux de recherche.
À propos de l'offre
-
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
-
Vacant
-
Experte / Expert en expérimentation, instrumentation et techniques biologiques