
Ingénieur (H/F) en apprentissage de LLM
Référence : UMR7503-CHRCER-003
- Fonction publique : Fonction publique de l'État
- Employeur : Centre national de la recherche scientifique (CNRS)
- Localisation : 54506 VANDOEUVRE LES NANCY (France)
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
- Nature du contrat Non renseigné
- Expérience souhaitée Non renseigné
-
Rémunération (fourchette indicative pour les contractuels) Brut mensuel entre 2491,65€ et 2658,46€ ajustable selon expériences € brut/an
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Missions :
- Entraîner des grands modèles de langage (LLM) textuels et/ou multimodaux sur un cluster de GPU
- Scrapper, collecter, nettoyer, filtrer, compiler, le tout semi-automatiquement, de grandes collections de données pour l'apprentissage des LLM
- Contribuer aux activités de recherche pour améliorer la qualité des LLM et aux activités de gestion du projet BPI OpenLLM (réunions, rédaction de rapports...)
Activités :
- programmation python: adaptation et amélioration de LLM pré-entraînés (par ex. Qwen2.5, Llama3.1, DeepSeek...)
- programmation shell: écriture de scripts d'entraînement de LLMs (par ex. via les librairies SLURM, deepspeed, llamafactory, transformers, ms-swift...)
- réunions avec une équipe de chercheurs pour proposer des améliorations des LLM
- réunions avec une équipe d'ingénieurs/doctorants/stagiaires pour gérer les campagnes d'apprentissage sur cluster de GPU
- réunions avec les partenaires du projet OpenLLM pour suivre le projet
- rédactions de rapports de projet et d'articles scientifiques en anglais et en français
Contexte de travail :
- Lieu de travail: laboratoire LORIA à Nancy au sein de l'équipe de recherche Mosaik
- Le poste prend place dans le cadre du projet de recherche collaborative OpenLLM financé par la BPI
Profil recherché
Competences :
- Maîtrise de python et du shell linux
- Connaissances de base en apprentissage profond et sur les LLM
- Des connaissances sur l'apprentissage sur cluster de GPU (avec SLURM), et/ou sur le TAL (traitement du langage naturel) sont bienvenues et sont un plus au dossier
- Savoir bien communiquer (oral et écrit) en français et en anglais
- Esprit d'équipe, d'initiative, et engagement dans la mission
Contraintes et risques :
Niveau d'études minimum requis
- Niveau Niveau 6 Licence/diplômes équivalents
- Spécialisation Informatique, traitement de l'information, réseau de transmission des données
Langues
- Français Seuil
Qui sommes-nous ?
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.
C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.
Depuis plus de 80 ans, le CNRS développe des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit entre ses missions de recherche et le transfert vers la société fait du CNRS un acteur clé de l’innovation en France et dans le monde.
Le partenariat qui lie le CNRS avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires témoignent du potentiel économique de ses travaux de recherche.
À propos de l'offre
-
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
-
Vacant
-
Experte / Expert en calcul scientifique