Post-doctorat : spécialité Intelligence Artificielle – génomique
Référence : 2026-2183747
- Fonction publique : Fonction publique de l'État
-
Employeur :
INRAE Centre Clermont - Auvergne-Rhône-Alpes
L'Institut national de recherche pour l'agriculture, l'alimentation et l'environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes. - Localisation : 63000 Clermont-Ferrand
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert aux titulaires et aux contractuels
- Expérience souhaitée Débutant
-
Rémunération Fourchette indicative pour les contractuels 37 629,72 € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A+ (Encadrement supérieur - Autres emplois fonctionnels)
- Management Non renseigné
- Télétravail possible Oui
Vos missions en quelques mots
Vous serez plus particulièrement en charge de :
Réaliser le benchmarking et le développement d’outils d’intelligence artificielle pour la génomique permettant l’analyse de la diversité génétique ancienne des blés, de sa comparaison avec la diversité génétique mondiale des blés modernes et l’identification de diversités génétiques anciennes et modernes plus particulièrement associées à des origines géographiques particulières et leurs contraintes environnementales associées. Les données d’ADN ancien restant très parcellaires et hétérogènes (données incomplètes, fragmentées, de faible couverture génomique) l’utilisation de deep learning ou l’élaboration de réseaux de neurones artificiels notamment (Graph Neural Network, GNN) peut permettre de prédire les types de blé, en fonction de leur nature génétique, adaptées à des environnements donnés. Des outils sont maintenant disponibles (Sun et al. 2024 ; Zhang et al. 2023) démontrant le potentiel de l'application du machine learning pour la reconstruction d'arbres phylogénétiques à l’aide du jeu d’apprentissage moderne.
Les données d’entraînement disponibles correspondent à :
- 1 420 accessions modernes de blés (couvrant 6 espèces dont T. aestivum, T. durum et T. timopheevii) apportant des données génétiques (3 923 023 polymorphismes de séquences) et des données « passeport » (pays d’origine, date d’enregistrement du cultivar) définissant une structuration géographique de la diversité génétique des espèces (cf publication Sow et al. 2025, doi.org/10.1038/s41477-025-02128-0) ;
- des données phénotypiques associées (Heading Date, Plant Height, Grain Weight) ;
- des données climatiques disponibles sur ClimateDT (https://www.ibbr.cnr.it//climate-dt/) correspondant à 19 variables bioclimatiques et la grille altitudinale disponibles dans la base de données Worldclim (Hijmans et al. 2005, Fick et al. 2017) ;
- des données archéologiques d’échantillons anciens de blés (T. aestivum, T. dicoccum, T. durum, T. timopheevii, T. monococcum…) couvrant 5 000 ans de domestication-sélection, et provenant principalement de sites palafittiques UNESCO de France (cf projet ArkaoAG, https://anr.fr/Projet-ANR-20-CE27-0013).
Profil recherché
Formation recommandée : doctorat dans le domaine de la bio-informatique / intelligence artificielle / modélisation-intégration des données / génomique-génétique.
Connaissances souhaitées :
- maîtrise de langages de programmation (Bash, Python, R, Gitlab, Conda, Snakemake, cluster de calcul type HPC en environnement Unix, …) ainsi que des outils d’interfaçage appliqués aux systèmes d'exploitation en génomique (Galaxy) ;
- exploration des séquences et gestion des NGS (variant calling/comparaison/mapping de séquences/ identification de barcode via Kmer/Blast/BWA/bowtie) et utilisation de banque de données génomiques (NCBI, nt core, …), alignement de séquences et phylogénie/phylogénomique, analyse de structure (Megan, Structure), génétique des populations ;
- biostatistique (machine learning, glm, modèles multivariés, ...) ;
- génomique comparative et génomique évolutive des populations.
Expérience appréciée : bio-informatique / intelligence artificielle / modélisation-intégration des données / génomique-génétique.
Aptitudes recherchées : rigueur scientifique, autonomie, motivation, communication.
Niveau d'études minimum requis
- Niveau Niveau 8 Doctorat/diplômes équivalents
Éléments de candidature
Documents à transmettre
Personnes à contacter
Qui sommes-nous ?
INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.
Descriptif du service
Au sein de l'équipe PaléoEVO de l'Unité Mixte de Recherche UCA-INRAE Génétique Diversité Ecophysiologie des Céréales (GDEC), nous menons des recherches en paléogénomique pour étudier la diversité génétique passée chez le blé via l’analyse d’ADN ancien (aDNA) de restes archéologiques. Adossé à cette équipe de recherche, PALEOLAB est un laboratoire confiné, dédié à l’analyse de restes archéo-botaniques (urlr.me/YhGkvK, Pont et al. 2019 doi : 10.1186/s13059-019-1627-1). Vous participerez au programme DATA (UCA/I-Site) dans le domaine de l’exploitation de l’Intelligence Artificielle pour la génomique pour retracer l’adaptation passée des blés et ouvrir des pistes sur la conception des blés de demain adaptés aux changements globaux. Ce projet associe deux laboratoires :
- Unité Mixte de Recherche Génétique Diversité Ecophysiologie des Céréales (GDEC) – UCA-INRAE – Clermont-Ferrand (Caroline Pont, Pierre-Louis Stenger et Jérôme Salse) ;
- Laboratoire d'Informatique, Modélisation et d'Optimisation des Systèmes (LIMOS) UCA – Clermont-Ferrand (Engelbert Mephu Nguifo, professeur à l’ISIMA).
L’équipe d’accueil (UMR GDEC) assure l’accès aux outils bio-informatiques nécessaires à la pleine réalisation du projet (https://hub.mesocentre.uca.fr/docs/cluster/hpc2/). Vous serez sous la responsabilité de Caroline Pont, et entouré.e d’ingénieur.e.s, doctorant.e.s et postdoctorant.e.s spécialisé.e.s en paléogénomique.
À propos de l'offre
-
Références :
Pont et al. 2019 doi: 10.1186/s13059-019-1627-1
Sow MD et al. 2025 doi: 10.1038/s41477-025-02128-0. Epub 2025 Nov 17.
Secomandi et al. 2025 doi.org/10.1038/s41588-024-02029-6
Hijmans et al. 2025 doi.org/10.1002/joc.1276
Stephen et al. 2017 doi.org/10.1002/joc.5086
Sun et al. 2024 doi: 10.1371/journal.pcbi.1011351
Zhang et al. 2023 arXiv :2302.08840v1
-
Vous pourrez travailler sur deux sites distants de 5 kilomètres.
-
Susceptible d'être vacant à partir du 01/05/2026
-
Chercheuse / Chercheur