• TéléchargerPDF – 26.1Ko

Doctorant (H/F) : Explicabilité des systèmes multimodaux de questions-réponses : vers des méthodes cont

Référence : UMR9015-THOGER-008

  • Fonction publique : Fonction publique de l'État
  • Employeur : Centre national de la recherche scientifique (CNRS)
  • Localisation : 91190 GIF SUR YVETTE (France)
Postuler sur le site employeur

Date limite de candidature : 04/07/2026

  • TéléchargerPDF – 26.1Ko

Partager la page

Veuillez pour partager sur Facebook, Twitter et LinkedIn.

  • Nature de l’emploi Emploi ouvert uniquement aux contractuels
  • Nature du contrat

    CDD de 3 ans

  • Expérience souhaitée Non renseigné
  • Rémunération Fourchette indicative pour les contractuels 2300€ bruts par mois € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
  • Catégorie Catégorie A (cadre)
  • Management Non renseigné
  • Télétravail possible Non renseigné

Vos missions en quelques mots

Sujet de thèse :
Cette thèse abordera le problème des modèles de type "boîte noire" dans le cadre d'un système multimodal de réponse aux questions. Les systèmes de réponse aux questions développés ces dernières années ont tiré parti de grands modèles de réseaux neuronaux. Bien qu'elles aient permis d'améliorer la précision et l'exactitude des réponses générées, ces approches manquent encore d'interprétabilité, notamment en raison de l'opacité et de la complexité de ces modèles. En effet, les modèles de langage à grande échelle ou les modèles de langage visuel s'appuient sur un nombre extrêmement élevé d'opérations et de paramètres (à savoir les poids des réseaux neuronaux), ce qui entraîne des difficultés majeures pour interpréter les prédictions. Une conséquence directe de l'opacité des prédictions des réseaux neuronaux est un manque de confiance de la part de l'utilisateur ou l'impossibilité de vérifier comment la réponse est construite. De plus, le contenu ou les réponses générés sont parfois mensongers ou contiennent des éléments inexacts ou infondés. La génération de réponses infondées, imprécises ou inattendues est appelée « hallucination ».
Dans cette thèse, l'objectif sera de proposer de nouvelles approches pour expliquer ou interpréter le comportement des modèles, tout d'abord afin de déterminer ce qui est utilisé pour la génération de contenu dans un contexte de réponse à des questions, en particulier si les informations utilisées pour la génération proviennent des connaissances internes du modèle (appelées "connaissances paramétriques") ou du contexte fourni en entrée à un LLM (informations fournies au modèle avant la réponse). Une deuxième partie sera consacrée aux méthodes permettant de localiser les informations contextuelles utilisées pour la génération du modèle ; ces approches, appelées méthodes d'attribution, attribuent des niveaux d'importance au contexte. Alors que de telles approches ont été étudiées pour des données unimodales, peu de méthodes les traitent dans un contexte multimodal.
Contexte :
La thèse se déroulera au sein du laboratoire interdisciplinaire des sciences du numérique (LISN) à Paris-Saclay. Le doctorant fera partie intégrante du Projet ANR EQUATION.

Profil recherché

Contraintes et risques :
Travail sur écran

Niveau d'études minimum requis

  • Niveau Niveau 7 Master/diplômes équivalents
  • Spécialisation Formations générales

Langues

  • Français Seuil

Qui sommes-nous ?

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.

C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.

En savoir plus sur l'employeur

À propos de l'offre

  • Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

  • Vacant
  • Chercheuse / Chercheur

Des offres d'emplois recommandées pour vous