Postdoc Machine Learning et bases de données (H/F)

Référence : UAR3565-FATIDM-008

  • Fonction publique : Fonction publique de l'État
  • Employeur : Centre national de la recherche scientifique (CNRS)
  • Localisation : 86000 POITIERS (France)

Partager la page

Veuillez pour partager sur Facebook, Twitter et LinkedIn.

  • Nature de l’emploi Emploi ouvert uniquement aux contractuels
  • Nature du contrat Non renseigné
  • Expérience souhaitée Non renseigné
  • Rémunération (fourchette indicative pour les contractuels) 2991,58 euros bruts € brut/an
  • Catégorie Catégorie A (cadre)
  • Management Non renseigné
  • Télétravail possible Non renseigné

Vos missions en quelques mots

Missions :
-Présentation
Dans le cadre du projet OSCARS « AMIS » (Advanced Metadata Intelligent System), le Consortium-HN ARIANE recrute un(e) postdoctorant(e) en informatique Data Science- Machine Learning.
Le Consortium-HN ARIANE (Analyses, Recherches, Intelligence Artificielle et Nouvelles Éditions Numériques) est un réseau scientifique interdisciplinaire de l’infrastructure Huma-Num. Il associe des experts en sciences humaines (littérature, linguistique, histoire, etc.) et en informatique. Ce consortium vise à constituer un espace de collaboration entre ces deux champs, favorisant ainsi les avancées méthodologiques et épistémologiques dans l’analyse des objets propres aux sciences du texte. L’objectif d'ARIANE est de contribuer à la conception, l’adaptation et le raffinement des outils numériques actuellement appliqués aux données textuelles des sciences humaines. Le consortium se donne pour mission de développer une approche interdisciplinaire en croisant les méthodologies des humanités numériques et les technologies avancées du traitement automatique du langage naturel. Il cherche à enrichir les processus d’analyse des textes à l’aide de dispositifs (semi-)automatisés, tout en créant un espace critique de discussion sur l’interprétation des résultats produits par ces méthodes.

- Missions
Le/la postdoctorant(e) recruté(e) intégrera l’équipe projet chargée du développement de l’application web innovante « AMIS », une application permettant l’enrichissement des métadonnées pour les chercheurs en sciences humaines.
Le/la postdoctorant(e) recruté(e) sera chargé(e) du développement du module « Robot AMIS », qui utilise des techniques d’intelligence artificielle et de machine learning pour proposer des recommandations de métadonnées basées sur l’analyse de données textuelles. Il/Elle jouera un rôle clé dans la gestion et l’analyse de grandes bases de données et dans l’entraînement de modèles de type LLM (Large Language Models).
Pour ces missions, le/la postdoctorant(e) pourra être amené(e) à suivre les stagiaires recrutés par le consortium en vue d’atteindre les objectifs du projet.


Activités :
Plus concrètement, les missions et activités de le/la postdoctorant(e) seront les suivantes :
Choix et entraînement des modèles LLM (Large Language Models) pour l’analyse des textes et l’extraction des métadonnées pertinentes.
Analyse des résultats et proposition de métadonnées enrichies basées sur des critères tels que le contenu, le genre, les motifs, les sentiments, les thesaurus, les ontologies, etc..
Conception et implémentation du « Robot AMIS » (Module 2) pour interroger des bases de données externes via des API et traiter les résultats en vue de proposer des recommandations de métadonnées.
Intégration des fonctionnalités d’explicabilité (X-AI) pour tracer les étapes et fournir des justifications sur les recommandations émises par le modèle.
Optimisation des modèles et des processus de traiteme
Voir plus sur le site emploi.cnrs.fr...

Profil recherché

Competences :
Compétences techniques
Technologies d’IA/ML (ex: Python, TensorFlow, PyTorch, scikit-learn, etc.)
Modèles de traitement du langage naturel (NLP) : Fine-tuning des LLM, analyse sémantique, text mining
Bases de données : Gestion des bases de données relationnelles (SQL) et non relationnelles (NoSQL)
APIs et services REST : Développement et intégration d’APIs pour interroger des bases de données externes
Connaissance des ontologies et des vocabulaires contrôlés utilisés dans les sciences des textes (XML-TEI, RDF)
Expérience avec l’infrastructure cloud (Google Colab, AWS, ou infrastructures équivalentes) pour des projets nécessitant une forte puissance de calcul.

Compétences « soft »
Intérêt pour les sciences humaines.
Sens de l’innovation, curiosité intellectuelle, aptitudes à la communication et au soutien technique
Sens relationnel, rigueur, fiabilité
Capacité à travailler en équipe et à collaborer avec des équipes multidisciplinaires.
Intérêt pour les projets open-source

Profil recherché :
Diplôme : Bac +8 Docteur en informatique (science des données, intelligence artificielle)
Expérience : Au moins 2 ans d’expérience dans des projets de machine learning et de traitement des données textuelles
Capacité à travailler sur des modèles complexes et à expliquer leurs résultats de manière claire.

Contraintes et risques :
Néant

Niveau d'études minimum requis

  • Niveau Niveau 8 Doctorat/diplômes équivalents
  • Spécialisation Informatique, traitement de l'information, réseau de transmission des données

Langues

  • Français Seuil

Qui sommes-nous ?

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.

C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.

En savoir plus sur l'employeur

À propos de l'offre

  • Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

  • Vacant
  • Responsable du système d'information « métier »

D'autres offres pourraient vous intéresser