
H/F Doctorant dans le cadre du projet ANR VITE
Référence : UMR5149-NATCOL-027
- Fonction publique : Fonction publique de l'État
- Employeur : Centre national de la recherche scientifique (CNRS)
- Localisation : 34095 MONTPELLIER (France)
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
- Nature du contrat Non renseigné
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels La rémunération est d'un minimum de 2200,00 € mensuel € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Sujet de thèse :
La mission principale du doctorant consistera à développer, adapter et évaluer des **méthodes d’estimation de l’influence des échantillons** dans le contexte spécifique de Pl@ntNet, une plateforme dédiée à l’identification automatisée des plantes. Cette mission s’articulera autour des axes suivants :
1. Étude et adaptation des fonctions d’influence**
Le doctorant devra approfondir les **fonctions d’influence**, outils théoriques permettant de quantifier l’impact d’un échantillon sur un modèle d’apprentissage. Ces fonctions, définies à partir de la dérivée des paramètres ou de la fonction de perte par rapport à une perturbation infinitésimale du jeu de données, offrent un cadre rigoureux pour :
- **Identifier les échantillons les plus informatifs** parmi les prédictions d’un réseau de neurones profond (DNN), en vue d’améliorer l’interface utilisateur de Pl@ntNet. Actuellement, les images proposées aux utilisateurs sont sélectionnées selon une distance $\ell_2$ dans l’espace des caractéristiques. L’objectif sera de remplacer cette approche par une sélection basée sur l’influence, afin de faciliter l’identification des espèces et d’enrichir l’expérience utilisateur.
- **Détecter les erreurs d’étiquetage** dans les bases de données validées ou étiquetées par les utilisateurs, en exploitant la mesure $I_{loss}(z_i, z_i)$, qui estime l’erreur induite par la suppression d’un échantillon $z_i$ de l’ensemble d’entraînement.
- **Prioriser l’annotation des images non étiquetées**, notamment pour les espèces rares, en identifiant les échantillons dont l’ajout ou la correction aurait le plus fort impact sur la performance du modèle.
Le doctorant explorera également des **variantes avancées** des fonctions d’influence, comme l’objectif de Bregman proximal (PBO), qui permet de s’affranchir de l’hypothèse d’optimalité du modèle et d’évaluer l’influence à différents stades de l’optimisation.
2. Résolution des défis computationnels**
L’application des fonctions d’influence aux réseaux de neurones profonds se heurte à des **contraintes calculatoires**, notamment en raison de la taille prohibitive de la matrice hessienne $H_{\hat{ heta}}$. Pour y remédier, le doctorant étudiera et implémentera des **méthodes d’approximation** :
- L’utilisation de la **matrice d’information de Fisher** comme substitut à la hessienne, en s’appuyant sur des travaux récents comme ceux de @george2018fast.
- L’adoption de l’**EK-FAC (Eigenvalue-corrected Kronecker-Factored Approximate Curvature)**, une méthode efficace pour estimer la courbure de la fonction de perte, comme proposé par @grosse2023studying.
- L’exploration d’**outils d’optimisation d’ordre zéro**, tels que les extensions du lemme de Stein ou des méthodes basées sur la formule de Stokes, pour estimer la hessienne d’une fonction proxy (version lissée du réseau) en un seul passage avant (*forward pass*), comme suggéré par @balasubramanian2022zeroth.
- La c
Voir plus sur le site emploi.cnrs.fr...
Profil recherché
Contraintes et risques :
Niveau d'études minimum requis
- Niveau Niveau 8 Doctorat/diplômes équivalents
- Spécialisation Formations générales
Langues
- Français Seuil
Qui sommes-nous ?
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.
C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.
Depuis plus de 80 ans, le CNRS développe des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit entre ses missions de recherche et le transfert vers la société fait du CNRS un acteur clé de l’innovation en France et dans le monde.
Le partenariat qui lie le CNRS avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires témoignent du potentiel économique de ses travaux de recherche.
À propos de l'offre
-
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
-
Vacant
-
Chercheuse / Chercheur