Un.e Ingénieur POC cahiers citoyens
Référence : 2026-2204574
- Fonction publique : Fonction publique de l'État
-
Employeur :
Campus Condorcet
ETABLISSEMENT PUBLIC CAMPUS CONDORCET - Localisation : AUBERVILLIERS
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert aux titulaires et aux contractuels
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels Non renseignée Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non
- Télétravail possible Oui
Vos missions en quelques mots
·Concevoir, développer et maintenir des pipelines de données dans une logique de qualité et de fiabilité
·Organiser le traitement des données et participer à l'analyse des résultats
·Adapter et concevoir les outils numériques de traitement, d'analyse, d’annotation et anonymisation de ces données, en garantissant traçabilité et conformité aux normes éthiques et réglementaires
·Concevoir une démarche méthodologique et un protocole adaptés (charte de publication, règles d’usage, processus de validation, comité éthique léger, tests et choix des outils de traitement)
·Éventuellement, valoriser les activités menées par des communications dans des journées scientifiques et professionnelles ou des billets de blog
Profil recherché
Formation & expérience
·Formation supérieure (Master, ingénieur ou équivalent) en traitement des données mixtes, HTR, humanités numériques, TAL.
·Expérience significative en traitement et analyse de données textuelles.
·Expérience en réalisation de projet ou réalisation de POC (une expérience minimum de 3 ans, idéalement dans des projets interdisciplinaires serait un atout).
Compétences clés
·Environnement Linux
·Programmation Python
·Très bonne connaissance des outils de chainage et pipeline de traitement des données (Apache Nifi ou Camel, ou équivalent par exemple)
·Très bonne connaissance des techniques de HTR sous Python (ou autre)
·Très bonne connaissance des technique d’anonymisation algorithmique (Faker, SpaCy:NER, Stanza, AnonyPy, AnonyPyx, méthodes mixes par LLM, etc.)
·Très bonne connaissance des techniques de traitement par IA
·Une connaissance des corpus SHS serait un plus
Qualités professionnelles
·Discrétion, sensibilité aux enjeux politiques et éthiques du projet
Localisation
Éléments de candidature
Documents à transmettre
Qui sommes-nous ?
Rejoindre le Campus Condorcet, c’est intégrer un établissement public national de coopération en plein essor, au cœur des transformations de l’enseignement supérieur et de la recherche et du territoire de Seine-Saint-Denis.
Le Campus Condorcet est la plus grande communauté de chercheurs et étudiants de sciences humaines et sociales de France, réunissant 11 institutions d’excellence (EHESS, EPHE, Université Paris 1 Panthéon-Sorbonne, etc.), 12 000 chercheurs, doctorants et étudiants et 116 unités, structures, réseaux et projets de recherche. Doté d’un budget de 62 millions d’euros (recettes 2025) et d’1 milliard d’euros de patrimoine immobilier, le Campus offre un équipement unique en France (Humathèque, Hôtel à projets, un centre de colloques, une maison des chercheurs / faculty club, des résidences étudiantes, des espaces associatifs et culturels, un café-librairie, des locaux sportifs, etc) et accueille chaque année plus 1200 manifestations scientifiques (en 2025). Notre ambition ? Faire des sciences humaines et sociales un fer de lance des réponses à apporter aux grands défis sociétaux du XXIe siècle (climat, démographie, inégalités, numérique, etc.).
Vous évoluerez dans un environnement intellectuellement stimulant, au contact direct de projets scientifiques d’envergure nationale et internationale, d’infrastructures de recherche d’envergure européenne et aux côtés de partenaires publics et privés de premier plan.
Descriptif du service
Le 11 mars 2025, l’Assemblée Nationale a adopté une résolution relative à la publicisation des 20 000 « cahiers de doléances » ou « cahiers citoyens » collectés dans le cadre du Grand Débat National de 2019, à la suite du mouvement des Gilets jaunes. Ces cahiers, produits dans 17 000 mairies, regroupent plus de 225 000 contributions ; il s’agit d’un des plus vastes corpus d’expression citoyenne de notre époque.
La mission consiste, sous la direction du responsable de l’Huma-Num Lab, et en lien avec les équipes existantes, à sélectionner, intégrer, et mettre en œuvre les outils logiciels constitutifs de cette chaîne, afin de :
- transcrire automatiquement par technologie de HTR, le contenu des cahiers citoyens, à partir des numérisations déjà existantes ;
- anonymiser automatiquement les cahiers (images et texte) ;
- mettre en œuvre dans un système d’information les transcriptions à des fin de relecture et de validation les contenus ;
- participer avec les équipes de l’Humathèque Condorcet à leur mise en ligne.
Le POC sera réalisé sur une sous-partie du corpus (environ 5% des cahiers), afin de tester la capacité d’industrialiser le processus.
À propos de l'offre
-
·Catégorie A – Ingénieur.e de recherche ou CDD de 12 mois renouvelable détachement sur contrat possible
·Rémunération selon profil et expérience
·Télétravail possible
Adressez-nous votre CV et lettre de motivation à adresser à :
recrutement@campus-condorcet.fr
Personnes à contacter pour toute question complémentaire :
Clément Oury, directeur du projet clement.oury@campus-condorcet.fr
Stéphane Pouyllau, directeur technique stephane.pouyllau@huma-num.fr
Cynthia Pedroja cynthia.pedroja@campus-condorcet.fr
-
Vacant à partir du 16/02/2026
-
*Cadre - Experte chargée / Cadre - Expert chargé d'une politique transversale*