
INGENIEUR / INGENIEURE EN BASE DE DONNÉES ET INFRASTRUCTURE NUMERIQUE
Référence : 2025-2085061
- Fonction publique : Fonction publique de l'État
-
Employeur :
Ecole Française d'Extrême-Orient (EFEO)
L'École française d'Extrême-Orient (EFEO) est un établissement public à caractère scientifique, culturel et professionnel qui relève du ministère de l'Enseignement supérieur et de la Recherch... - Localisation : 22 Avenue du Président Wilson, 75116 Paris, France
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
-
Nature du contrat
CDD d'1 an
- Expérience souhaitée Confirmé
-
Rémunération Fourchette indicative pour les contractuels 1 750 € nets avant impôts € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Oui
Vos missions en quelques mots
Ce recrutement s’inscrit dans le cadre du projet de recherche collaboratif ANR ChEDiL (Projet Projet-ANR-23-CE27-0008) coordonné par Michela Bussotti, directrice d’études de l'École française d'Extrême-Orient (EFEO), spécialiste l’histoire culturelle et de l’histoire du livre en Chine.
Voir aussi sur le site de l’ANR : https://anr.fr/Projet-ANR-23-CE27-0008.
MISSIONS
Sous la supervision conjointe de Shueh-Ying Liao (EFEO) et Vincent Paillusson (UMR HTL), en collaboration avec les responsables SHS scientifiques du projet : Michela Bussotti (EFEO), Mariarosaria Gianninoto (Université de Montpellier) et Catherine Jami (CNRS UMR CCJ), ainsi que les collègues de l’INSA-LIRIS (Lyon) membres du projet, l'ingénieur recruté /l’ingénieure recrutée participera au développement de la base de données et des interfaces de consultation des dictionnaires manuscrits.
L'objectif principal est de créer une base de données et un site web en libre accès recensant les premiers dictionnaires manuscrits chinois-européens. Cette base de données permettra l'analyse comparative et les recherches croisées sur les dictionnaires comme le lexique qu'ils contiennent, les traductions proposées dans différentes langues européennes, leur organisation logique ainsi que leur contexte de production. La base de données est prévue pour être hébergée sur l'infrastructure Huma-Num.
Profil recherché
ACTIVITÉS PRINCIPALES
Modélisation et développement de bases de données (65%)
- Concevoir et implémenter une base de données relationnelle/NoSQL
- Modéliser des structures lexicographiques multilingues complexes (clé, caractère chinois, prononciation, explication, synonymes, exemples, etc.)
- Développer des outils de validation et correction semi-automatique des données
- Assurer l'optimisation des performances pour un volume évolutif des données à requêter
Intégration des données HTR (20%)
- Créer des outils d'import ou de transformation des transcriptions issues d'opérations d'HTR (handwritten text recognition) aux formats XML ALTO
- Développer des analyseurs pour l'extraction et la structuration des données textuelles (par exemple au niveau de l'explication, différencier la traduction, les exemples romanisées et les gloses chinoises)
- Contribuer à l'amélioration HTR et la définition de templates pour définir la macro structure d'un dictionnaire donné
- Contribuer à la gestion de la plateforme Escriptorium du projet (application libre pour la transcription automatique des manuscrits)
- Assurer la traçabilité entre images originales et données structurées
Interfaces utilisateur et APIs (10%)
- Développer une interface web de consultation avec recherche avancée
- Créer des outils de visualisation comparative entre dictionnaires
- Implémenter une API REST
- S'appuyer sur le standard IIIF pour la visualisation d'images
- Assurer l'interopérabilité et la connexion avec des référentiels du domaine comme la China Historical Christian Database (CHCD)
Documentation et formation (5%)
- Produire une documentation technique et une documentation utilisateur complète
- Former les chercheurs aux outils de bases de données
- Participer aux ateliers méthodologiques ainsi qu'aux opérations de restitutions du projet
COMPÉTENCES
Qualifications requises :
- Master en informatique, sciences de l'information, humanités numériques, ou équivalent
- Expérience en développement de bases de données pour projets patrimoniaux/recherche
- Expertise bases de données : MySQL, BaseX/eXist-DB
- Développement web : Python (Django/Flask), JavaScript, XQuery, HTML5/CSS3, APIs REST
- Standards : XML-TEI, ALTO, IIIF, JSON-LD, Unicode
- Environnement technique : Docker, Git/GitLab, plateformes d'hébergement académique
- Langues : Français et anglais niveau professionnel
Compétences appréciées :
- Expérience du traitement de données multilingues et plateformes HTR
- Connaissances en chinois classique/moderne, latin, langues romanes
- Visualisation de données patrimoniales et infrastructures académiques (Huma-Num)
- Sensibilité aux enjeux des SHS et à la science ouverte
Niveau d'études minimum requis
- Niveau Niveau 7 Master/diplômes équivalents
Compétences attendues
Qualifications requises :
- Master en informatique, sciences de l'information, humanités numériques, ou équivalent
- Expérience en développement de bases de données pour projets patrimoniaux/recherche
- Expertise bases de données : MySQL, BaseX/eXist-DB
- Développement web : Python (Django/Flask), JavaScript, XQuery, HTML5/CSS3, APIs REST
- Standards : XML-TEI, ALTO, IIIF, JSON-LD, Unicode
- Environnement technique : Docker, Git/GitLab, plateformes d'hébergement académique
- Langues : Français et anglais niveau professionnel
Compétences appréciées :
- Expérience du traitement de données multilingues et plateformes HTR
- Connaissances en chinois classique/moderne, latin, langues romanes
- Visualisation de données patrimoniales et infrastructures académiques (Huma-Num)
- Sensibilité aux enjeux des SHS et à la science ouverte
Langues
- Français Maîtrise
- Anglais Maîtrise
Localisation
Éléments de candidature
Documents à transmettre
Personnes à contacter
- michela.bussotti@efeo.net
- shueh-ying.liao@efeo.net
Qui sommes-nous ?
L'École française d'Extrême-Orient (EFEO) est un établissement public à caractère scientifique, culturel et professionnel qui relève du ministère de l’Enseignement supérieur et de la Recherche. Elle a pour mission la recherche interdisciplinaire sur les civilisations asiatiques, de l'Inde au Japon. L'EFEO est présente, grâce à ses 18 centres de recherche, dans 12 pays d'Asie. Cette spécificité permet à ses 42 chercheurs permanents d'être sur les terrains de leurs études, et d'animer un réseau de coopérations locales et d'échanges internationaux entre scientifiques orientalistes. L'EFEO est partenaire académique de l’université Paris Sciences & Lettres, et est l'un des cinq instituts de recherche français qui composent le Réseau des écoles françaises à l'étranger (ResEFE). Elle entretient des liens de recherche et d'enseignement solides avec Sorbonne Université, le CNRS et d’autres institutions à travers l’Europe et l’Asie.
Plusieurs chercheurs de l’EFEO sont lauréats de l’Agence Nationale de la recherche (ANR) française et de l'European Research Council (ERC) depuis la création de ces programmes de recherche. Grâce à ces financements, ils conduisent des initiatives de recherche exploratoire pour repousser les limites de la connaissance.
Descriptif du service
Le programme de recherche ANR ChEDiL (acronyme de Chinese-European Dictionaries: Lexicographical Manuscripts for the Historical Study of Exchanges between China and Europe (end of 16th— beginning of 19th centuries) / Dictionnaires sino-européens: manuscrits lexicographiques pour l'étude historique des échanges entre la Chine et l'Europe (fin du XVIe s.-début du XIXe s.) a pour objet des dictionnaires plurilingues, plus spécifiquement des dictionnaires de ou vers le chinois et une langue européenne, parfois deux langues européennes : il s’agit d’un ensemble de manuscrits compilés entre la fin du XVIe siècle et le début du XIXe siècle, principalement par des missionnaires, en Chine ou en Europe.
Une de caractéristique du corpus étudié par ChEDiL repose sur le fait que ces dictionnaires n’ont jamais été publiés — le premier dictionnaire (chinois-latin-français) publié en Europe est daté de 1813. Ces documents composites et sous-exploités sont éparpillés dans des bibliothèques situées essentiellement en Europe, mais aussi en Asie et aux États-Unis. Des chercheurs et des chercheuses avec des compétences différentes —histoire et linguistique, IA et humanités numériques…— vont collaborer pour l’étude de ce corpus longtemps délaissé, en faveur de textes ou d’outils linguistiques plus accomplis. Ces dictionnaires offrent de nouvelles sources pour étudier la culture chinoise et pour réfléchir à la manière dont les Européens ont produit leur discours sur la Chine impériale tardive.
À propos de l'offre
-
Dans le cadre de sa démarche en faveur de l'égalité professionnelle, de la diversité et de l’inclusion, l’EFEO s'engage contre toute forme de discrimination et encourage tous les candidats et toutes les candidates éligibles à transmettre leur candidature.
Ce poste est à pourvoir au 1er janvier 2026, pour une durée de 11 mois.
1607h annuelles, 45 jours de congés annuels (pour un temps et une année complète).
Télétravail possible dans le cadre de la charte de l’EFEO, au bout de 3 mois d’ancienneté sur le poste.
Tickets restaurant, à la demande de l’agent.
Remboursement transport en commun, selon conditions réglementaires.
Participation à prise en charge de la complémentaire santé, selon conditions réglementaires.
Adhésion à l’association des personnels de l’EFEO en faveur notamment d’actions culturels (chèques culturels, tickets cinéma, voyages…).
Veuillez adresser un CV détaillé avec portfolio technique (projets et BDD réalisés), une lettre de motivation à l’attention de Madame Michela Bussotti, coordinatrice du projet ChEDiL, accompagnés des diplômes (Master et certifications éventuelles dans le domaine de l'informatique, des TICE ou des humanités numériques) aux coordonnées suivantes : michela.bussotti@efeo.net copie à shueh-ying.liao@efeo.net.
Les candidats sélectionnés seront convoqués pour un entretien qui se tiendra courant novembre à une date qui sera précisée ultérieurement.
-
Lieu de travail
EFEO, 22 avenue du Président Wilson, 75116 Paris, France
UFR Linguistique, Bâtiment Olympe de Gouges, place Paul Ricœur, Paris 13e, France
-
Vacant à partir du 01/01/2026
-
Administratrice / Administratrice de bases de données