
Ingénieur-e d'étude en traitement de données linguistiques, linguistique africaine H/F
Référence : UMR8135-MOBINT-O54012
- Fonction publique : Fonction publique de l'État
- Employeur : Centre national de la recherche scientifique (CNRS)
- Localisation : 94800 VILLEJUIF (France)
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert aux titulaires et aux contractuels
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels Non renseignée Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Mission :
En lien étroit et constant avec notre équipe de recherche spécialisée en linguistique africaine, il s¿agira de dédier sa force de travail aux deux pôles numériques phares de notre unité de recherche : 1) piloter l'enrichissement de la base de données lexicales RefLex pour atteindre au plus vite notre objectif de couverture maximale des langues africaines (1147 langues déjà présentes, objectif : atteindre les 2739 répertoriées à ce jour) ; 2) expertise linguistique et technique pour assurer un pont entre les chercheurs et l'équipe de développement de nos outils de traitement de corpus oraux (Elan, CorpOrAn), assurer la formation et le soutien aux chercheurs, identifier l'évolution des besoins et apporter son expertise linguistique à la conception de nouveaux outils.
Activité :
- Proposer une démarche adaptée au développement de nos outils de traitement de données aux besoins des chercheurs
- Concevoir et piloter le dispositif d¿appui à la recherche ainsi créé
- Mettre en œuvre des méthodes ou protocoles pour le recueil de données ou de corpus, former les chercheurs pour en assurer l'analyse et interpréter les résultats
- Assurer la maîtrise d'ouvrage du développement des bases de données et corpus
- Développer et formaliser des méthodes permettant la production ou l'analyse des données ou de corpus
- Concevoir des outils d'interrogation et d'interface entre différentes bases de données ou corpus
- Participer ou animer des réseaux professionnels internes ou externes de valorisation des résultats de recherche afférents.
- Analyser les demandes externes et évaluer leur pertinence par rapport aux orientations scientifiques
- Participer ou coordonner la réponse à des appels d'offre
- Transférer ses compétences dans le cadre d'actions de formation (formation continue, formation à la recherche, formation des étudiants)
- Valoriser les réalisations et les résultats sous forme de publications scientifiques, rapports, présentations orales¿
- Contribuer à la réflexion sur les techniques et les méthodes
- Concevoir et réaliser une veille scientifique et méthodologique
Profil recherché
Contexte :
Le candidat ou la candidate retenu.e sera rattaché.e au LLACAN, équipe de recherche spécialisée en langues et linguistique africaines, à Villejuif. Dans l'organigramme, il/elle sera placé.e sous l'autorité de la responsable de la politique des données de l'Unité. Par l'exercice de ses fonctions, il/elle contribuera activement au fonctionnement et à la dynamique du collectif.
Le candidat ou la candidate retenu.e travaillera selon des horaires de bureau. Il/Elle pourra également être amené.e à participer à des ateliers ou à des missions de formation à l'étranger, principalement en Afrique.
Competence :
Savoirs :
- Linguistique de terrain (Afrique), traitement des données de terrain en langage naturel (langues minoritaires)
- Connaissance de la base de données RefLex (outils de comparaison, outils statistiques, normes de saisie)
- Maîtrise des outils de traitement de corpus (Praat, FLEx, Toolbox)
- Connaissance approfondie des outils Elan (Max Planck) et ElanCorpA
- Maîtrise des plates-formes de valorisation et d'archivage pérenne des données de terrain (Cocoon, CorpOrAn)
- Connaissance d¿outils émergents en traitement et analyse des données (annotation collaborative de corpus, expressions régulières, treebanks¿)
- Cadre légal et déontologique des données de terrain (cadre éthique notamment)
- Techniques de présentation écrite et orale
- Français C1 ; Anglais C1
Savoirs faire :
- Savoir élaborer des outils de collecte (cadre de recueil de corpus oraux sur le terrain)
- Savoir exploiter une base de données (manipulation de données, extraction de données pertinentes, fusion de bases)
- Savoir localiser, répertorier, prioriser, analyser et critiquer les données (savoir statuer sur la pertinence des données ou des sources)
- Avoir des compétences pédagogiques et de transmission des connaissances
- Savoir formaliser les techniques et méthodes de traitement de corpus oraux et lexicaux
- Savoir animer et piloter un groupe de travail dans le respect des compétences de chacun
- Rédiger des rapports ou des documents
- Élaborer un cahier des charges
Savoirs-être :
- Avoir un sens poussé du collectif et du travail en équipe
- Avoir une expérience significative dans un projet d'équipe de recherche à financement externe
Niveau d'études minimum requis
- Niveau Niveau 6 Licence/diplômes équivalents
- Spécialisation Sciences humaines & droit- Sciences (y compris démographie, anthropologie
Langues
- Français Seuil
Qui sommes-nous ?
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.
C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.
Depuis plus de 80 ans, le CNRS développe des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit entre ses missions de recherche et le transfert vers la société fait du CNRS un acteur clé de l’innovation en France et dans le monde.
Le partenariat qui lie le CNRS avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires témoignent du potentiel économique de ses travaux de recherche.
À propos de l'offre
-
Campgane printemps 2025
-
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
-
Vacant
-
Experte / Expert en production, traitement et analyse de données