Doctorat en physique statistique et échantillonnage (H/F)
Référence : UMR8023-MARGAB-003
- Fonction publique : Fonction publique de l'État
- Employeur : Centre national de la recherche scientifique (CNRS)
- Localisation : 75005 PARIS 05 (France)
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
-
Nature du contrat
CDD de 3 ans
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels La rémunération est d'un minimum de 2300,00 € mensuel € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Sujet de thèse :
La modélisation générative vise à l'apprentissage non supervisé d'un modèle probabiliste capable de générer des données correspondant aux réalisations typiques fournies en tant que données d'entraînement. Diverses approches ont désormais démontré que les modèles génératifs profonds peuvent modéliser fidèlement des distributions de données complexes, telles que des distributions sur des images, de l'audio ou des textes. Un exemple célèbre serait la génération d'une image avec un certain contenu, disons un visage, à partir d'une collection de telles images. Récemment, il a été proposé de réorienter ces puissants modèles génératifs (MG) pour s'attaquer au problème d'échantillonnage, c'est-à-dire lorsqu'on ne dispose pas de données issues de la distribution d'intérêt, mais plutôt de la connaissance de sa densité non normalisée [LW18 ; AKS19 ; Noé+19]. L'objectif devient alors d'entraîner un modèle génératif qui s'approchera de cette distribution cible et facilitera son échantillonnage, tel que requis en mécanique statistique ou en inférence bayésienne.
Ici, une étape de débiaisage est cruciale pour éviter des approximations non contrôlées lors de l'échantillonnage. Des travaux pionniers dans cette direction, dont ceux de la directrice [RV22 ; Gre+23], ont démontré que des sous-classes de MG — les flots normalisants et les réseaux autorégressifs — peuvent atteindre un échantillonnage exact en permettant le calcul de la repondération des réalisations générées par rapport à la mesure cible. Des preuves de concept ont été présentées dans divers domaines de la physique et de la chimie, notamment les théories quantiques des champs sur réseau [Abb+24], les biomolécules [Noé+19] ou encore les nano-agrégats d'atomes lourds [Mol+24]. Cependant, si le débiaisage est direct et peu coûteux en calcul pour les flots normalisants et les réseaux autorégressifs grâce à leur vraisemblance tractable, ces classes de MG sont limitées par leur manque d'expressivité.
Projet : L'objectif de ce projet est de tester et de développer des méthodes de débiaisage pour les modèles de diffusion plus puissants [Soh+15 ; Son+21] et les modèles de flot matching [Lip+23 ; ABV23]. Nous chercherons à explorer deux stratégies possibles. D'une part, une vraisemblance approchée de ces modèles peut être calculée en utilisant la description par équation différentielle ordinaire (EDO) équivalente à leur implémentation traditionnelle par équation différentielle stochastique (EDS). D'autre part, ces modèles sont enracinés dans la mécanique statistique hors équilibre, qui fournit des outils pour estimer la repondération des trajectoires [Cro98 ; AV24], d'une manière étroitement liée au Monte Carlo séquentiel [CP20] développé en statistiques. En partant du cas simple de l'échantillonnage à partir de mélanges gaussiens, nous développerons et testerons des approches exploitant ces deux directions. La conception la plus performante s
Voir plus sur le site emploi.cnrs.fr...
Profil recherché
Contraintes et risques :
Aucuns
Niveau d'études minimum requis
- Niveau Niveau 7 Master/diplômes équivalents
- Spécialisation Formations générales
Langues
- Français Seuil
Qui sommes-nous ?
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.
C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.
Depuis plus de 80 ans, le CNRS développe des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit entre ses missions de recherche et le transfert vers la société fait du CNRS un acteur clé de l’innovation en France et dans le monde.
Le partenariat qui lie le CNRS avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires témoignent du potentiel économique de ses travaux de recherche.
À propos de l'offre
-
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
-
Vacant
-
Chercheuse / Chercheur