Datascientist TAL (H/F)
Référence : 2024-1653825
- Fonction publique : Fonction publique de l'État
- Employeur : Haute Autorité de Santé (HAS)
- Localisation : La Plaine saint Denis
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert aux titulaires et aux contractuels
- Expérience souhaitée Confirmé
-
Rémunération (fourchette indicative pour les contractuels) Non renseigné
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Date?: 19/07/2024
Poste à pourvoir Data scientist, Traitement du Langage
Emploi-repère Chef de projet
Catégorie d’emploi Catégorie 1
Type de contrat Contrat à durée indéterminée / Temps complet
Localisation Saint-Denis (93), au pied de la station RER La Plaine Stade de France
Motif de recrutement Poste vacant
Rémunération Selon expérience et niveau de diplôme, par référence aux grilles indiciaires des agences sanitaires en application du décret n°2003-224 du 07 mars 2003 ou selon statut particulier si fonctionnaire (détachement)
DESCRIPTION DU POSTE A POURVOIR
Missions générales du poste à pourvoir
Au sein de l’équipe data, vous serez en charge des projets de traitement automatique du langage (TAL / NLP) au ceur de l’axe 3 de la stratégie données de la HAS. Vos principales missions consisteront à prototyper et mettre en production des outils pour valoriser les données textuelles de la HAS.
Cette exploitation du riche patrimoine de données textuelles répond à une forte demande des services, et à des enjeux stratégiques soutenus par la direction. Ainsi, depuis 3 ans, plusieurs projets d’envergure ont déjà été menés, par exemple :
- Constitution d’un data set des métadonnées des publications de la HAS et des textes associés
- Classification automatique des thèmes des évènements indésirables graves associés à des soins
- Classification automatique des thèmes des commentaires des patients hospitalisés (e-Satis, 2 millions de commentaires par an).
- Prospective sur l’utilisation de grands modèles de langage (LLM) pour la classification des commentaires patients
- Apprentissage actif pour le screening lors de revues de la littérature scientifique
- Au fil des projets vous serez amené(e) à :
- Développer des outils d’extraction d’information sous forme structurée pour les besoins d’analyse bibliographique des différents services de la HAS.
- Analyser des données textuelles riches : retours des patients après hospitalisation, événements indésirables graves liés aux soins, dossiers d’industriels, bibliographies, connaissances produites par la HAS ;
- Concevoir et prototyper des services facilitant le traitement de textes : moteur de recherche, annotation, extraction d’entité, indexation, classification ;
- Participer à mettre en place les briques technologiques sous-jacentes (base de données, traitement automatisé, outil d’analyse, exposition par API), en cherchant le bon équilibre entre usage de solutions existantes (open source ou achat) et développement en propre ;
- Piloter des projets d’industrialisation et de déploiement de ces services, en mobilisant des ressources internes et externes ;
- Effectuer une veille scientifique et technique sur le champ du TAL ;
- Encadrer des stagiaires ;
- Pa... (la suite sur le site de l'employeur).
Niveau d'études minimum requis
- Niveau Niveau 7 Master/diplômes équivalents
Localisation
À propos de l'offre
-
Vacant à partir du 25/07/2024
-
Analyste de données