Doctorant (H/F)

Référence : UMR7503-CLAGAR-006

  • Fonction publique : Fonction publique de l'État
  • Employeur : Centre national de la recherche scientifique (CNRS)
  • Localisation : 54506 VANDOEUVRE LES NANCY (France)

Partager la page

Veuillez pour partager sur Facebook, Twitter et LinkedIn.

  • Nature de l’emploi Emploi ouvert uniquement aux contractuels
  • Nature du contrat Non renseigné
  • Expérience souhaitée Non renseigné
  • Rémunération (fourchette indicative pour les contractuels) La rémunération est d'un minimum de 2200,00 € mensuel € brut/an
  • Catégorie Catégorie A (cadre)
  • Management Non renseigné
  • Télétravail possible Non renseigné

Vos missions en quelques mots

Sujet de thèse :
La génération de texte a récemment attiré l'attention de la communauté de la communauté NLP, car de grands modèles de langage pré-entraînés ont démontré une excellente capacité à générer des textes longs, grammaticalement corrects et fluides. Un inconvénient important de ces modèles est que leur adaptation à une nouvelle tâche ou à une nouvelle langue nécessite souvent l'utilisation de données étiquetés qui ne sont pas forcément disponibles et dont la création serait coûteuse et difficile. Cet inconvénient est particulièrement aiguë pour la génération de texte à partir de données [NG24, SNSM+25], mais cela vaut aussi pour les tâches spécifiques à un domaine (par exemple, la santé, la finance), telles que le résumé ou la simplification.

Récemment, des techniques d'apprentissage des préférences telles que DPO (Direct Preference Optimisation, [RSM+ 24, IL24]), Group Relative Policy Optimization (GRPO) ou ORPO (Odds Ratio Preference Optimization, [HLT24]) ont été proposées pour améliorer un modèle de base en s'entraînant sur des données d'argent souvent plus faciles à créer, en particulier pour le traitement multilingue, typiquement en utilisant la traduction automatique) et en améliorant le modèle à l'aide des données de préférence. Cette approche a été appliquée avec succès dans divers domaines, y compris la traduction automatique et le résumé, afin d'améliorer la qualité du du texte en alignant les résultats du modèle sur les préférences humaines [LNN+ 23]. Cependant, l'application de l'apprentissage des préférences à la génération de KG-to-Text et à l'analyse de textes multilingues n'a pas encore été réalisée.


Sujet et programme de travail

L'objectif de cette thèse de doctorat est d'étudier comment ces nouvelles méthodes d'apprentissage des préférences peuvent être exploitées pour faciliter la génération de textes multitâches et multilingues lorsque les données d'apprentissage sont indisponibles.
Plus précisément, la thèse s'appuiera sur les travaux antérieurs du candidat [SG25] et se concentrera sur la génération de textes multilingues à partir de graphes de connaissances, pouvant s'étendre au résumé et/ou à la simplification de texte à texte si le temps le permet.

Le projet de thèse est confronté à plusieurs défis.

Premièrement, il faut identifier et comparer les méthodes de création de données d’apprentissage de niveau argent. Selon les tâches de génération, des techniques telles que la supervision à distance, la traduction automatique pour l’aspect multilingue et l’incitation LLM sont des candidats naturels. Ces différentes méthodes seront explorées et comparées à l’aide de mesures d’évaluation standard pour chacune des tâches de génération de cibles.

Deuxièmement, il faut créer des données de préférence. Comme mentionné ci-dessus, cela nécessite de pouvoir classer les sorties alternatives. À cette fin, nous utiliserons soit les mesures existantes lorsqu’elles sont
Voir plus sur le site emploi.cnrs.fr...

Profil recherché

Contraintes et risques :

Niveau d'études minimum requis

  • Niveau Niveau 8 Doctorat/diplômes équivalents
  • Spécialisation Formations générales

Langues

  • Français Seuil

Qui sommes-nous ?

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.

C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.

En savoir plus sur l'employeur

À propos de l'offre

  • Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

  • Vacant
  • Chercheuse / Chercheur

Des offres d'emplois recommandées pour vous

  • Réduction des minerais de fer à faible teneur par plasma d'hydrogène : influence des éléments de gangue

    • Recherche

    • Localisation : Meurthe et Moselle (54)
    • Fonction publique : Fonction publique de l'État
    • Employeur : CNRS
    • En ligne depuis le 06 mars 2025
    Centre national de la recherche scientifique (CNRS)
  • Chargé.e de mission en pétrologie (H/F)

    • Recherche

    • Localisation : Meurthe et Moselle (54)
    • Fonction publique : Fonction publique de l'État
    • Employeur : CNRS
    • En ligne depuis le 01 mars 2025
    Centre national de la recherche scientifique (CNRS)
  • Ingénieur (H/F) en apprentissage de LLM

    • Recherche

    • Localisation : Meurthe et Moselle (54)
    • Fonction publique : Fonction publique de l'État
    • Employeur : CNRS
    • En ligne depuis le 28 février 2025
    Centre national de la recherche scientifique (CNRS)
  • Chargé d'études et d'essais Métal-Anticorrosion

    • Recherche

    • Localisation : Meurthe et Moselle (54)
    • Fonction publique : Fonction publique de l'État
    • Employeur : Centre d'Etudes et d'Expertise sur les Risques, l'Environnement, la Mobilité et l'Aménagement (CEREMA)
    • En ligne depuis le 26 février 2025
    ministères aménagement du territoire transition écologique
  • Doctorant en chimie/électrochimie/microfluidique (H/F)

    • Recherche

    • Localisation : Meurthe et Moselle (54)
    • Fonction publique : Fonction publique de l'État
    • Employeur : CNRS
    • En ligne depuis le 20 février 2025
    Centre national de la recherche scientifique (CNRS)
  • Responsable d'animation régionale des ingénieurs-transfert (H/F)

    • Recherche

    • Localisation : Meurthe et Moselle (54)
    • Fonction publique : Fonction publique de l'État
    • Employeur : CNRS
    • En ligne depuis le 18 février 2025
    Centre national de la recherche scientifique (CNRS)