Data Engineer F/H
Référence : APHP_2026-20214
- Fonction publique : Fonction publique Hospitalière
- Employeur : Siège de l'AP-HP
- Localisation : Paris (75), France
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert aux titulaires et aux contractuels
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels Non renseignée Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Non renseigné
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
L’équipe Data de la BNDMR est en charge de l’exploitation et de la valorisation de l’Entrepôt de Données (EDS) de la BNDMR. Intégrée à une cellule opérationnelle pluridisciplinaire d’environ 40 personnes, elle est composée d’un Chief Data Officer, de 6 data scientists, de 3 data managers et d’un data engineer/dataops. Elle intervient sur l’ensemble de la chaîne de valeur de la donnée : structuration, qualité, appariement, analyses statistiques et valorisation.
Dans un contexte d’évolution rapide de l’entrepôt de données (nouveaux jeux de données, appariement avec le SNDS, augmentation des projets de recherche), l’équipe œuvre à l’industrialisation des processus data et au soutien des projets académiques et industriels, au service de la recherche, du pilotage du système de santé et de l’innovation dans le champ des maladies rares.
MISSION GENERALE
Concevoir, développer et opérer des chaînes de traitement de données, de l’ingestion à l’exposition, en garantissant la scalabilité, la performance, la traçabilité et la qualité des flux de données.
MISSIONS PONCTUELLES OU SPECIFIQUES (liste non exhaustive)
· Concevoir, développer et maintenir des pipelines de données (ETL/ELT) de l'Entrepôt de Données de Santé (EDS) à des fins de pilotage, d'analyse et de recherche.
· Participer à la conception, l'évolution et l’optimisation des DataMarts et modèles de données, en lien étroit avec les Data Scientists et Data Managers.
· Industrialiser et automatiser des traitements ponctuels ou manuels critiques de l'équipe Data (contrôles qualité, livraison de jeux de données, etc.).
· Mettre en œuvre des mécanismes de traçabilité, d’auditabilité et de versionnement des flux et transformations de données.
· Collaborer avec les Data Scientists pour adapter les structures de données aux besoins analytiques et faciliter la mise en production des travaux de recherche.
· Participer à la documentation technique des architectures, pipelines, modèles de données et bonnes pratiques de développement.
· Apporter un support technique aux Data Managers et Data Scientists pour la compréhension des flux, des règles de transformation et des contraintes techniques.
· Contribuer au respect des exigences réglementaires (RGPD, sécurité, confidentialité) dans les architectures et traitements de données.
Profil recherché
Diplôme : Master ou équivalent
Niveau d’étude : Bac+5
Niveau d’expérience : 2 ans et +
Compétences requises
• Programmation orientée data engineering (Python indispensable)
• Maîtrise des bases de données relationnelles, notam. PostgreSQL (modélisation, optimisation)
• Expérience dans la conception, le développement de pipelines ETL/ELT et l'industrialisation des traitements
• Capacité à comprendre et exploiter des architectures complexes et hétérogènes, y compris faiblement documentées
• Pratique du travail collaboratif et versionnement de code
• Capacité à travailler avec des volumes de données importants et des flux hétérogènes
• Notions de tests appliqués aux données
• Une expérience dans un environnement de données de santé, une connaissance du SNDS (PMSI, SNIIRAM, etc.) serait un plus
• Bon niveau d'anglais technique
Connaissances associées
• Très bonne compréhension des principes d’architecture data (chaînes de traitement, séparation ETL)
• Sensibilité aux enjeux de qualité, gouvernance et traçabilité des données
• Connaissance ou intérêt pour les exigences réglementaires liées aux données de santé (RGPD, CNIL, sécurité)
• Intérêt pour les usages analytiques et scientifiques des données
Qualités requises
• Capacité à travailler en équipe pluridisciplinaire
• Rigueur, sens de la qualité et de la robustesse des solutions
• Autonomie, capacité à prioriser
• Aptitude à documenter et à vulgariser des sujets techniques
• Sens des responsabilités et respect strict de la confidentialité des données
À propos de l'offre
-
Spécialiste méthode et outils / qualité / sécurité