
Poste de chercheur (doctorant) en intelligence artificielle pour la science (H/F)
Référence : UMR6072-FREJUR0-013
- Fonction publique : Fonction publique de l'État
- Employeur : Centre national de la recherche scientifique (CNRS)
- Localisation : 14032 CAEN (France)
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
- Nature du contrat Non renseigné
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels La rémunération est d'un minimum de 2200,00 € mensuel € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Sujet de thèse :
Les domaines de l'intelligence artificielle (IA) et de l'apprentissage automatique (AA) sont sur le point de révolutionner la découverte scientifique. Les modèles de base, de grands réseaux neuronaux pré-entraînés sur d'énormes ensembles de données, ont montré un immense potentiel dans le traitement du langage naturel et sont désormais explorés pour des applications scientifiques dans des domaines tels que la chimie, la physique, la science des matériaux et la biologie. Un défi clé dans la construction de modèles de base efficaces pour la science réside dans leur multimodalité inhérente : le progrès scientifique repose sur l'intégration d'informations non seulement à partir de textes, mais aussi de structures de données complexes telles que des graphes de clusters atomiques/moléculaires, des structures cristallographiques 3D, des mesures expérimentales (XRD, spectroscopie Raman, RMN, XAS, etc.), des protocoles de synthèse et des résultats de simulation.
Ce projet s'attaque à un goulot d'étranglement critique dans le développement de tels modèles : comment représenter efficacement ("tokeniser") ces structures de données scientifiques complexes et non linguistiques pour une intégration fluide dans des modèles de base multimodaux unifiés, souvent basés sur des architectures de transformateurs. La tokenisation standard basée sur des séquences échoue à capturer les informations topologiques, géométriques (y compris les symétries cruciales) ou spectrales continues riches.
Cette recherche vise à enquêter systématiquement, développer et évaluer de nouvelles stratégies d'apprentissage de représentation pour les graphes, les coordonnées 3D et les spectres. L'objectif est de créer des représentations qui soient riches en informations, évolutives sur le plan computationnel, robustes au bruit, interprétables et qui facilitent un raisonnement efficace entre les modalités lorsqu'elles sont combinées avec des données textuelles ou d'autres données scientifiques. Le succès dans ce domaine est crucial pour libérer le potentiel de l'IA à comprendre des phénomènes scientifiques complexes et à accélérer la découverte.
Contexte :
Le projet se situe dans l'environnement de recherche du département d'informatique et du département de physique de l'Université de Caen, se concentrant sur l'intersection de l'apprentissage profond et des applications scientifiques. Les nouvelles techniques développées dans le cadre de ce projet seront utilisées sur des données réelles obtenues au Département de Chimie des Matériaux et au Département de Physique de l'Université de Caen.
Profil recherché
Contraintes et risques :
--
Niveau d'études minimum requis
- Niveau Niveau 7 Master/diplômes équivalents
- Spécialisation Formations générales
Langues
- Français Seuil
Qui sommes-nous ?
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.
C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.
Depuis plus de 80 ans, le CNRS développe des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit entre ses missions de recherche et le transfert vers la société fait du CNRS un acteur clé de l’innovation en France et dans le monde.
Le partenariat qui lie le CNRS avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires témoignent du potentiel économique de ses travaux de recherche.
À propos de l'offre
-
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
-
Vacant
-
Chercheuse / Chercheur