Ingénieur en IA (H/F)
Référence : UMR9015-SOPROS0-007
- Fonction publique : Fonction publique de l'État
- Employeur : Centre national de la recherche scientifique (CNRS)
- Localisation : 91190 GIF SUR YVETTE (France)
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
-
Nature du contrat
CDD d'1 an
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels 2571,80 € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Missions :
Dans le cadre de cette mission, vous participerez à des travaux de recherche qui correspondent à deux axes complémentaires: les représentation de textes et l'intelligence artificielle frugale. Vos activités
releveront à la fois de l'analyse de l'état de l'art et du prototypage de nouvelles représentations textuelles hierarchiques. L'approche du traitement automatique des langues (TAL) par apprentissage profond suppose en effet de représenter la langue sous forme de vecteurs. Cependant, l'essor du TAL et de l'intelligence artificielle, à travers le déploiement d'agents, notamment conversationnels ou de programmation, impose de prendre en charge des textes toujours plus longs, que cette longueur tienne à leur nature conversationnelle ou à leur traitement en corpus (bases de code, ensembles de documents techniques). Les modèles transformeurs actuels ne prennent en compteles textes que de manière séquentielle et, le plus souvent, auto-régressive : un texte y est simplement compris comme l'ensemble des tokens qui le composent, dont le traitement produit une collection de vecteurs. Si ces collections offrent une représentation utile et performante des textes, leur traitement se révèle d'autant plus coûteux en calcul que la taille des textes, dont la complexité croît de façon quadratique, et celle des modèles augmentent.
D'une part, vous serez chargé d'étudier la littérature consacrée à la construction de représentations d'unités de textes au delà des mots. Vous tiendrez compte de hiérarchiser les représentations en distinguant différents niveaux de découpe du texte. Vous analyserez en particulier les apports et les limites des représentations d'ordre supérieur, comme proposées par les modèles HiBERT, Sentence-BERT ou NextLevelBERT, afin d'en dégager les motivations, les performances et les limitations. À partir de ce travail, vous élaborerez un état de l'art des représentations hiérarchiques et de l'intelligence artificielle frugale.
D'autre part, vous proposerez et prototyperez des systèmes de représentation opérant à l'échelle de la phrase, du texte et du corpus, conçus pour s'inscrire dans une démarche d'intelligence artificielle frugale, dans le but maîtriser les coûts de calcul. Vous serez associé aux publications et valorisations scientifiques des travaux conduits.
Activités :
- Étudier la construction de représentations non plates de la donnée textuelle dans la littérature.
- Comprendre les limites des représentations d'ordre supérieur (HiBERT, Sentence-BERT, NextLevelBERT).
- Proposer et prototyper des systèmes de représentation de la phrase, du texte et du corpus dans un cadre frugal.
- Élaborer un état de l'art efficace des représentations non plates et de l'IA frugale.
- Participer activement aux travaux de recherche en collaboration avec les équipes de l'unité d'accueil.
Contexte de travail :
Le travail se déroulera au Laboratoire Interdisciplinaire des Sciences du Numé
Voir plus sur le site emploi.cnrs.fr...
Profil recherché
Competences :
- titulaire d'un M2 de mathématiques ou informatiques
- expérience en TAL
- maîtrise des framework de programmation et manipulation de LLM (python, huggingface etc.)
Contraintes et risques :
Risques liés au travail sur écran.
Niveau d'études minimum requis
- Niveau Niveau 7 Master/diplômes équivalents
- Spécialisation Sciences naturelles (biologie-géologie)
Langues
- Français Seuil
Qui sommes-nous ?
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.
C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.
Depuis plus de 80 ans, le CNRS développe des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit entre ses missions de recherche et le transfert vers la société fait du CNRS un acteur clé de l’innovation en France et dans le monde.
Le partenariat qui lie le CNRS avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires témoignent du potentiel économique de ses travaux de recherche.
À propos de l'offre
-
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
-
Vacant
-
Experte / Expert en expérimentation, instrumentation et techniques biologiques