H/F Ingénieur d'études en production, traitement, analyse de données et enquêtes

Référence : UMR5190-VERGON-010

  • Fonction publique : Fonction publique de l'État
  • Employeur : Centre national de la recherche scientifique (CNRS)
  • Localisation : 75006 PARIS (France)

Partager la page

Veuillez pour partager sur Facebook, Twitter et LinkedIn.

  • Nature de l’emploi Emploi ouvert uniquement aux contractuels
  • Nature du contrat Non renseigné
  • Expérience souhaitée Non renseigné
  • Rémunération Fourchette indicative pour les contractuels A compter de 2 491€ brut par mois selon expérience et grille de l'organisme € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
  • Catégorie Catégorie A (cadre)
  • Management Non renseigné
  • Télétravail possible Non renseigné

Vos missions en quelques mots

Missions :
L’ANR EXO-POPP (Extraction Optique des entités nommées manuscrites pour les actes de mariage de la population de Paris (1880-1940) a été lancée en 2021 dans le but de créer une vaste base de données à partir de 300 000 actes de mariages de Paris et sa banlieue entre 1880 et 1940 grâce aux derniers progrès en reconnaissance d’écritures manuscrites et en traitement automatique du langage naturel.
Une première version de la base M-POPP (en SQL) sera terminée par les informaticiens du LITIS au mois de septembre 2025. Si la reconnaissance automatique est très bonne, il reste cependant 5 à 10 % d’erreur de reconnaissance d’écriture qu’il faudra tenter de réduire au maximum. Il s’agira ensuite d’adapter la base de données (SQL) à l’analyse statistique. Enfin, les adresses devront être liées à un SIG.
L’objectif final est de produire une base de données exploitable par les chercheur·e·s pour l’étude et l’analyse, à l’aide d’outils de traitement de données.
L'ingénieur·e d'études en production, traitement, analyse de données et enquêtes assurera la correction et l’adaptation de la base SQL M-POPP (créée à partir d’actes de mariage de Paris et de sa banlieue pour la période 1880-1940 grâce à l’océrisation de documents et au Deep Learning) à l’analyse statistique.
Il/elle mettra en place le SIG de la base M-POPP.
Il/elle participera à la pérennisation de la base, en la préparant pour qu’elle soit partagée et ouverte.

Activités :
- Participer à la structuration et la curation de la base M-POPP : mise en ordre de la base après l’océrisation, en corrigeant les valeurs de variables non reconnues ou mal interprétées au cours du processus d’océrisation.
- Mettre en place le SIG de la base à l’aide du logiciel Géocodeur, pour chaque adresse présente dans la base ; ainsi que, le cas échéant, correction des données SIG obtenues avec le Géocodeur en collaboration avec les ingénieur·e·s du logiciel, afin d’obtenir des résultats fiables et précis.
- Préparation technique de la base de données en vue de sa publication, de son stockage, de sa diffusion et de sa mise en œuvre sur des plateformes de distribution de données, telles que Quetelet-Progedo.
- Assurer le dialogue entre les chercheurs en informatique de l’Observatoire (équipe du LITIS, Université de Rouen) et les chercheur·ses en sciences sociales (porté par le LARHRA, Université de Lyon).
- Suivre l'état de l'art en matière de publication et de valorisation des données historiques.
- Participer à la réflexion sur les méthodes de représentation et d'analyse des données numériques
- Participer aux réunions du projet EXO-POPP

Contexte de travail :
Le poste est situé dans les locaux de l'UAR 2506 IR* Progedo, 54 boulevard Raspail
75006 Paris où travaille l'ingénieur en charge de la base de données.
« En intégrant le CNRS, nous vous proposons :
• Un environnement de travail stimulant aux contacts des personnels de la recherche
• D'excellentes
Voir plus sur le site emploi.cnrs.fr...

Profil recherché

Competences :
Savoirs :
- Une formation en Humanités numériques ou en sciences humaines quantitatives est INDISPENSABLE
- Connaissance approfondie des principes des systèmes de gestion des bases de données relationnelles.
- Maîtrise des outils de traitement et d’analyse de données (modélisation et représentation statistique des données) pour correction des bases.
- Maîtrise des techniques d’informations géographiques
- Connaissance des principes FAIR, de l'interopérabilité des données, et des cadres formels de l'Open data.

Savoir-faire :
- Maîtrise d'au moins un Système de Gestion de Bases de Données libre (Mysql, Postgresql) et du langage de requête SQL
- Maîtrise d'un langage de programmation utilisé pour les statistiques (R/Python)
- Compréhension de la nature des Systèmes d’Information Géographique (SIG) et capacité à coordonner l’intégration des données SIG dans une base de données, en collaboration avec les développeurs du programme de géocodage. Connaissance de l’usage des SIG dans les sciences sociales et humaines - analyse spatiale des données sociales ou visualisation des données – à l’aide de RStudio ou de logiciels comme QGIS, ArcGIS ou GRASS GIS.
- Savoir suivre des projets au sein d'une équipe ou en partenariat

Contraintes et risques :

Niveau d'études minimum requis

  • Niveau Niveau 6 Licence/diplômes équivalents
  • Spécialisation Sciences humaines & droit- Sciences (y compris démographie, anthropologie

Langues

  • Français Seuil

Qui sommes-nous ?

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.

C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.

En savoir plus sur l'employeur

À propos de l'offre

  • Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

  • Vacant
  • Experte / Expert en production, traitement et analyse de données

Des offres d'emplois recommandées pour vous

  • Ingénieur de recherche en chimie moléculaire F/H

    • Recherche

    • Localisation : Paris (75)
    • Fonction publique : Fonction publique de l'État
    • Employeur : Collège de France
    • En ligne depuis le 09 mai 2025
    Collège de France 1530
  • Doctorant (H/F) en biothérapie

    • Recherche

    • Localisation : Paris (75)
    • Fonction publique : Fonction publique de l'État
    • Employeur : CNRS
    • En ligne depuis le 09 mai 2025
    Centre national de la recherche scientifique (CNRS)
  • Chercheur post-doctoral sur les défauts dans le diamant pour les technologies quantiques (H/F)

    • Recherche

    • Localisation : Paris (75)
    • Fonction publique : Fonction publique de l'État
    • Employeur : CNRS
    • En ligne depuis le 09 mai 2025
    Centre national de la recherche scientifique (CNRS)
  • IE H/F en Biologie

    • Recherche

    • Localisation : Paris (75)
    • Fonction publique : Fonction publique de l'État
    • Employeur : CNRS
    • En ligne depuis le 08 mai 2025
    Centre national de la recherche scientifique (CNRS)
  • Technicien en analyses biologiques médicales F/H

    • Recherche

    • Localisation : Paris (75)
    • Fonction publique : Fonction publique de l'État
    • Employeur : Collège de France
    • En ligne depuis le 07 mai 2025
    Collège de France 1530
  • MAITRE DE CONFERENCES CONTRACTUEL ATER en matière molle/physique statistique

    • Recherche

    • Localisation : Paris (75)
    • Fonction publique : Fonction publique Territoriale
    • Employeur : Ecole supérieure de physique et de chimie industrielles de la Ville de Paris
    • En ligne depuis le 07 mai 2025
    Fonction publique Territoriale