DATA SCIENTIST - DGESIP H/F
Référence : 2024-1791520
- Fonction publique : Fonction publique de l'État
- Employeur : Direction générale de l'enseignement supérieur et de l'insertion professionnelle
- Localisation : 1, rue Descartes 75005 PARIS
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert aux titulaires et aux contractuels
- Expérience souhaitée Confirmé
-
Rémunération (fourchette indicative pour les contractuels) Non renseigné
- Catégorie Catégorie A (cadre)
- Management Non
- Télétravail possible Oui
Vos missions en quelques mots
Le.la datascientist sera amené à intervenir sur l’ensemble des données du département car il.elle interviendra à la fois sur des sujets liés à l’enseignement supérieur et sur d’autres liés à la recherche . Il.elle participe à l’acquisition et à l’intégration des données (acquisition, mise en qualité, transformation et structuration, intégration). Il.elle traite, analyse et diffuse les données placées sous sa responsabilité.
Le/la datascientist partagera la responsabilité de la production de l’Atlas régional des effectifs étudiants dans une version numérique et interactive. Il.elle prendra en charge la réalisation d’éventuels travaux cartographiques liés à ce projet et participe à la définition des orientations de la publication avec le co-rédacteur en chef de l’ouvrage, également spécialiste des données formations/étudiants. Il.elle assure la conception, le développement et la maintenance des données sous jacente et s’attache à les mettre à disposition dans différents contextes (API, Opendata). Il.elle travaille en complémentarité avec le développeur interne en charge de développer l’application web de l’Atlas.
En matière de recherche, le.la datascientist mettra en œuvre les méthodes les plus récentes en matière d’intelligence artificielle et de datascience. Il.elle sera responsable du développement d’un corpus de données concentrant les bénéficiaires des AAP des différentes agences de financement de la recherche en France qu’il.elle s’attachera à faire grandir au fil de l’ouverture de ces données par les agences. Il.elle sera également mobilisé.e pour répondre à des besoins de suivi de thématiques et de communautés scientifiques (notamment dans le domaine du développement durable et de la transition écologique).
Le.la datascientist prendra également en charge l’activité en extinction de cartes « à la demande ».
Le.la datascientist spécialiste des données géographiques, au même titre que ses collègues, devra faire preuve de grandes qualités d’innovation et d’adaptation (nouvelles problématiques, nouveaux outils techniques, nouveaux interlocuteurs, …) et veiller constamment à maintenir et développer ses compétences.
Profil recherché
Compétences techniques :
Statistiques et mathématiques : Analyse descriptive et inférentielle, Modélisation statistique, Algèbre linéaire et calcul différentiel
Programmation et outils : Python et utilisation de bibliothèques (Pandas, NumPy, SciPy, Scikit-learn, TensorFlow, PyTorch, …), Gestion des bases de données (relationnelles et non relationnelles), Notions de génie logiciel (Git, CI/CD, tests unitaires)
Machine learning et IA : Connaissance des modèles supervisés et non supervisés, Techniques du traitement du langage naturel (NLP)
Manipulation et gestion de données : Nettoyage et prétraitement des données, outils de visualisation de données
Big Data : Familiarité avec les environnements cloud, Gestion et traitement des données massives en temps réel, Culture DevOps et déploiement, Conteneurisation (Docker) et orchestration (Kubernetes).
Communication et vulgarisation : Création de rapports clairs et concis, Capacité à présenter les résultats à des parties prenantes non techniques.
Savoirs-être :
Curiosité intellectuelle : goût pour la résolution de problèmes complexes, capacité à explorer de nouvelles technologies ou méthodologies, esprit analytique et critique
Capacité à poser les bonnes questions : Sens aigu de l’observation pour détecter des anomalies ou des opportunités dans les données
Rigueur et organisation : Souci du détail pour garantir la qualité des analyses, gestion efficace des priorités et des deadlines.
Adaptabilité : Flexibilité pour travailler dans des environnements dynamiques, capacité à apprendre rapidement de nouveaux outils ou concepts.
Esprit collaboratif : Travail en équipe multidisciplinaire (technique et métier), ouverture aux feedbacks constructifs.
Pédagogie : Capacité à expliquer des concepts complexes simplement, vulgarisation des résultats
Localisation
Éléments de candidature
Documents à transmettre
Personnes à contacter
- emmanuel.weisenburger@recherche.gouv.fr
- yann.caradec@recherche.gouv.fr
Qui sommes-nous ?
Relevant du Ministère de l’enseignement supérieur et de la recherche (MESR),
- La Direction générale de l’enseignement supérieur et de l’insertion professionnelle (DGESIP) élabore et met en œuvre la politique relative à l’ensemble des formations supérieures, initiales et tout au long de la vie relevant du ministre chargé de l’enseignement supérieur.
- La Direction générale de la recherche et de l'innovation (DGRI) pilote l'élaboration de la stratégie nationale de recherche.
Le Service de la coordination des stratégies de l’enseignement supérieur et de la recherche est un service commun entre la DGESIP et la DGRI qui assure la coordination de la stratégie en matière de recherche et d'innovation et en matière d’enseignement supérieur.
Descriptif du service
Le département Ingénierie et science des données appartient à la sous-direction des systèmes d’information et des études statistiques. Il a pour mission de développer un patrimoine de données sur l’enseignement supérieur, la recherche et l’innovation associé à une offre ouverte, cohérente et accessible de services (de l’API à l’application web, pour le décideur et le grand public). Il s’attache à connaître les besoins de ses utilisateurs, les accompagner dans leurs usages et adapter en continu son offre aux besoins. Il met en œuvre la démarche d’ouverture des données du MESR. Le stack technologique est centrée autour des technologies classiques de développement web (HTML/CSS/JS/REACT) en front end, de Python pour le back end (Flask pour les API), des algorithmes de traitement (Word embeddings, Transformers en NLP) et de MongoDB pour les données et enfin du moteur de recherche Elasticsearch. Le déploiement des services utilise Docker et Kubernetes sur le cloud OVH.
Ces 3 réalisations constituent une partie de son portefeuille : https://scanr.enseignementsup-recherche.gouv.fr/, https://barometredelascienceouverte.esr.gouv.fr/, https://curiexplore.enseignementsup-recherche.gouv.fr/
L’équipe est composée de 13 cadres techniques partageant un engagement commun à l’ouverture des codes et des données et de la transparence dans les méthodogies de traitement de l’information mises en œuvre (https://github.com/dataesr).
À propos de l'offre
-
Personne à qui adresser les candidatures (mail) : UGARH DGESIP - recrutement-dgesip@enseignementsup.gouv.fr
Personne (s) à contacter (mail et /ou téléphone) : Emmanuel Weisenburger, chef du département - emmanuel.weisenburger@recherche.gouv.fr
Yann Caradec, Adjoint du département - yann.caradec@recherche.gouv.fr
Boîte mail générique de recrutement : recrutement-dgesip@enseignementsup.gouv.fr
-
Susceptible d'être vacant à partir du 01/03/2025
-
Data Scientist