Ingénieur en traitement automatique du langage (TAL) 100% ETP - Centre de Données Cliniques
Référence : 2025-2105776
- Fonction publique : Fonction publique Hospitalière
- Employeur : Centre Hospitalier Universitaire d'Angers
- Localisation : Angers
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
- Nature du contrat Non renseigné
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels Non renseignée Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
CONTEXTE
Situé au coeur de la ville d’Angers et du Campus santé, le CHU d’Angers met en oeuvre et exploite un entrepôt de données de santé. En charge de l’exploitation de cet entrepôt, le CDC a pour objectifs de contribuer à l’amélioration des soins par l’analyse et la réutilisation des données médicales et leur mise à disposition des chercheurs cliniciens dans un cadre sécurisé et dans le respect de la réglementation. Le CDC intervient sur des projets de recherche régionaux et nationaux.
Pour le développement de cette activité, le Département Sciences de la Donnée de la Direction de la Recherche et Innovation du CHU d’Angers (DRI) recrute un ingénieur en traitement automatique du langage (TAL).
MISSIONS ET ACTIVITES
Développer et mettre en oeuvre des méthodes d’analyse et de modélisation pour exploiter le langage naturel et les données textuelles issues des comptes rendus (CR) et bases structurées, dans le but d’en extraire des concepts, et automatiser la compréhension des documents.
-Extraction et qualification de concepts à partir de textes et données structurées (ex. pathologies, traitements, observations).
-Enrichissement sémantique des données via des graphes de connaissances, lexiques métiers, embeddings ou ontologies médicales.
-Classification automatique de documents (machine learning, deep learning, LLM) selon des typologies définies.
-Préparation, nettoyage et annotation de corpus pour entraîner des modèles NLP (NER, text classification, relation extraction…).
-Évaluation et benchmark des modèles (Hugging Face, spaCy, modèles propriétaires, etc.).
-Data visualization et restitution claire des résultats auprès des équipes métier et recherche.
-Contribution aux études complexes mêlant texte, données structurées et raisonnement statistique.
Localisation
À propos de l'offre
-
Vacant à partir du 05/01/2026
-
Spécialiste en études cliniques