• TéléchargerPDF – 27.81Ko

Postdoctorat dans le développement de méthodes de machine learning et deep learning en génétique et bio

Référence : UMR5535-SARADE-107

  • Fonction publique : Fonction publique de l'État
  • Employeur : Centre national de la recherche scientifique (CNRS)
  • Localisation : 34293 MONTPELLIER (France)
Postuler sur le site employeur

Date limite de candidature : 20/05/2026

  • TéléchargerPDF – 27.81Ko

Partager la page

Veuillez pour partager sur Facebook, Twitter et LinkedIn.

  • Nature de l’emploi Emploi ouvert uniquement aux contractuels
  • Nature du contrat

    CDD d'1 an

  • Expérience souhaitée Non renseigné
  • Rémunération Fourchette indicative pour les contractuels A partir de 3071.50€ brut mensuel ajustable en fonction de l'expérience professionnelle sur des pos € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
  • Catégorie Catégorie A (cadre)
  • Management Non renseigné
  • Télétravail possible Non renseigné

Vos missions en quelques mots

Missions :
Êtes-vous un expert ou une experte en machine learning, à l’aise avec la programmation par tenseurs et opérations vectorielles (PyTorch, NumPy) ? Connaissez-vous en profondeur les méthodes de machine learning et êtes-vous capable de construire des réseaux de neurones from scratch ? Aimez-vous développer de nouvelles architectures de réseaux de neurones pour résoudre des problèmes non conventionnels ? Ce poste pourrait être pour vous.
Nous recherchons une personne motivée et curieuse, avec une solide expérience dans le développement de méthodes de machine learning pour la bioinformatique

Ce projet développe un nouveau paradigme de modèles d’Interprétation Générale du Génome (GenGI) en combinant des modèles de langage ADN (DLLMs) avec des réseaux de neurones profonds afin de prédire des phénotypes humains directement à partir de données de séquençage d’exome complet issues de la UK Biobank. L’objectif est la prédiction à large spectre de phénotypes humains, ouvrant de nouvelles perspectives en génétique clinique, médecine de précision, prédiction du risque de maladie et IA explicable appliquée aux données génomiques.
Activités :
La personne devra :
- Se familiariser avec les recherches et méthodes existantes pour l’interprétation du génome
- Se familiariser avec les données de séquençage et leur prétraitement
- Étudier le fonctionnement des DNA LLM et développer des solutions pour les intégrer dans les architectures de réseaux de neurones développées par le laboratoire
- Se concentrer sur le développement de solutions bas niveau pour la scalabilité des réseaux de neurones et des modèles de langage à grande échelle sur des données de séquençage du génome entier
- Développer "from scratch" des algorithmes et architectures de réseaux de neurones pour la prédiction de sorties structurées (arbres, graphes)
- Implémenter et développer des méthodes d’interprétation des prédictions des réseaux de neurones, incluant des activations basées sur des concepts et des analyses contrefactuelles
Le projet se concentre sur le développement de nouvelles architectures de réseaux de neurones pour effectuer de l’inférence sur des données de séquençage.

Contexte de travail :
Le poste est basé à l’Institut de Génétique Moléculaire de Montpellier (IGMM, CNRS UMR5535), dans un environnement de recherche hautement international et interdisciplinaire. Montpellier est une ville méditerranéenne dynamique avec un environnement, une culture et une qualité de vie exceptionnels. Elle accueille de nombreux instituts de recherche de haut niveau ainsi que l’Université de Montpellier, une population étudiante dynamique de 70 000 étudiants et l’une des plus anciennes facultés de médecine au monde.

Le laboratoire : le travail sera réalisé au sein du groupe AI for Genome Interpretation (AI4GI), dirigé par le Dr Daniele Raimondi. Le groupe se concentre sur le développement de méthodes avancées d’intelligence artificielle
Voir plus sur le site emploi.cnrs.fr...

Profil recherché

Competences :
La bioinformatique et l’interprétation du génome sont des domaines multidisciplinaires et en évolution rapide. Nous recherchons un candidat ou une candidate qui :
- possède une formation en informatique, mathématiques ou physique, avec une forte orientation en machine learning
- est motivé pour apprendre en continu de nouvelles méthodes et concepts
- apprécie de résoudre des problèmes nouveaux et imprévus avec de fortes compétences en résolution de problèmes
Compétences et expertise requises
- Solide formation en réseaux de neurones, machine learning, algèbre linéaire et compréhension des statistiques
- Compréhension approfondie des fondements du machine learning, incluant :
- Algèbre linéaire (opérations vectorielles et matricielles)
- Méthodes d’optimisation
- Réseaux de neurones (avec expérience pratique en PyTorch)
- Solides compétences en programmation Python et calcul scientifique (PyTorch, scikit-learn, NumPy)
- Maîtrise des environnements GNU/Linux (incluant des outils comme SSH)
- Bonnes compétences en communication et travail en équipe
Qualifications supplémentaires (souhaitées)
- Familiarité avec les GWAS, la génétique des populations ou les pipelines de bioinformatique
- Expérience dans le traitement de données génomiques (séquençage exome ou génome entier)
- Connaissances de base en génétique et biologie
Autres informations
- Le projet implique le développement de modèles de réseaux de neurones non conventionnels avec PyTorch
- Un niveau d’anglais minimum B2 est requis
- Les candidatures doivent être soumises en anglais
- For more details, switch to the english version.

Contraintes et risques :

Niveau d'études minimum requis

  • Niveau Niveau 8 Doctorat/diplômes équivalents
  • Spécialisation Formations générales

Langues

  • Français Seuil

Qui sommes-nous ?

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.

C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.

En savoir plus sur l'employeur

À propos de l'offre

  • Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

  • Vacant
  • Chercheuse / Chercheur

Des offres d'emplois recommandées pour vous