INGÉNIEUR DANS LE DÉVELOPPEMENT DE MÉTHODES DE MACHINE LEARNING ET DEEP LEARNING POUR LA GÉNÉTIQUE ET L
Référence : UMR5535-SARADE-108
- Fonction publique : Fonction publique de l'État
- Employeur : Centre national de la recherche scientifique (CNRS)
- Localisation : 34293 MONTPELLIER (France)
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
-
Nature du contrat
CDD d'1 an
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels A partir de 2521€ brut mensuel, ajustable selon expérience € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Missions :
Nous recherchons une ingénieure ou un ingénieur d'études (IE) motivé pour rejoindre le groupe AI for Genome Interpretation (AI4GI) à l’IGMM (CNRS UMR5535, Montpellier) pour une durée de 12 mois. Le contrat peut être renouvelé sous conditions pour 36 mois supplémentaires si le projet passe les étapes d’évaluation.
Avez-vous étudié l’informatique, les mathématiques ou la physique et êtes-vous en train de devenir une experte ou un expert en machine learning ? Êtes-vous à l’aise avec la programmation par tenseurs et opérations vectorielles (PyTorch, NumPy) ? Connaissez-vous en profondeur les méthodes de machine learning et aimez-vous construire des réseaux de neurones from scratch ? Aimez-vous développer de nouvelles architectures de réseaux de neurones pour résoudre des problèmes non conventionnels ? Ce poste pourrait être pour vous.
Nous recherchons une candidate ou un candidat motivé et curieux, avec une expérience dans le développement de méthodes de machine learning pour la bioinformatique.
L’ingénieure ou l’ingénieur d’études recruté aura pour mission de concevoir et développer des méthodes innovantes de machine learning et de deep learning appliquées à l’interprétation du génome.
La personne contribuera au développement de nouvelles architectures de réseaux de neurones combinant des DNA Large Language Models et des approches d’apprentissage profond, dans le cadre du projet GenGI, visant à prédire des phénotypes humains à partir de données de séquençage à grande échelle.
La personne participera également à l’intégration de ces méthodes dans un environnement de recherche interdisciplinaire à l’interface entre intelligence artificielle, bioinformatique et génétique.
Activités :
Le candidat ou la candidate devra :
• Commencer par se familiariser avec les recherches et méthodes existantes pour l’interprétation du génome
• Se familiariser avec les données de séquençage et leur prétraitement
• Étudier le fonctionnement des DNA LLM et développer des solutions pour les intégrer dans les architectures de réseaux de neurones développées par le laboratoire
• Se concentrer sur le développement de solutions bas niveau pour la scalabilité des réseaux de neurones et des modèles de langage à grande échelle appliqués aux données de séquençage du génome entier
• Développer from scratch des algorithmes et architectures de réseaux de neurones pour la prédiction de sorties structurées (c.-à-d. arbres, graphes)
• Implémenter et développer des méthodes pour l’interprétation des prédictions et des sorties des réseaux de neurones, incluant des activations basées sur des concepts et des analyses contrefactuelles
Le projet se concentre sur le développement de nouvelles architectures de réseaux de neurones pour effectuer de l’inférence sur des données de séquençage.
Contexte de travail :
Le poste est basé à l’Institut de Génétique Moléculaire de Montpellier (IGMM UMR5535, CNRS), dans un environnement de
Voir plus sur le site emploi.cnrs.fr...
Profil recherché
Competences :
La bioinformatique et l’interprétation du génome sont des domaines multidisciplinaires et en évolution rapide.
Nous recherchons une candidate ou un candidat qui :
• A une formation en informatique, mathématiques ou physique, avec une forte orientation en machine learning
• Est motivé pour apprendre en continu de nouvelles compétences, méthodes et concepts
• Apprécie de résoudre des problèmes nouveaux et imprévus avec de fortes compétences en résolution de problèmes
Compétences et expertise requises
• Fort intérêt pour les réseaux de neurones, le machine learning, l’algèbre linéaire et compréhension des statistiques
• Compréhension approfondie des fondements du machine learning, incluant :
• Algèbre linéaire (opérations vectorielles et matricielles)
• Méthodes d’optimisation
• Réseaux de neurones (avec expérience pratique en PyTorch)
• Solides compétences en programmation Python et calcul scientifique (PyTorch, scikit-learn, NumPy)
• Maîtrise des environnements GNU/Linux (incluant des outils comme SSH)
• Bonnes compétences en communication et travail en équipe
Qualifications supplémentaires (souhaitées)
• Familiarité avec les GWAS, la génétique des populations ou les pipelines de bioinformatique
• Expérience dans le traitement de données génomiques (séquençage exome ou génome entier)
• Connaissances de base en génétique et biologie
Autres informations
• Le projet implique le développement de modèles de réseaux de neurones non conventionnels avec PyTorch
• Un niveau d’anglais minimum B2 est requis
• Les candidatures doivent être soumises en anglais
Contraintes et risques :
Niveau d'études minimum requis
- Niveau Niveau 6 Licence/diplômes équivalents
- Spécialisation Sciences naturelles (biologie-géologie)
Langues
- Français Seuil
Qui sommes-nous ?
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.
C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.
Depuis plus de 80 ans, le CNRS développe des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit entre ses missions de recherche et le transfert vers la société fait du CNRS un acteur clé de l’innovation en France et dans le monde.
Le partenariat qui lie le CNRS avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires témoignent du potentiel économique de ses travaux de recherche.
À propos de l'offre
-
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
-
Vacant
-
Experte / Expert en expérimentation, instrumentation et techniques biologiques