
Doctorant/Doctorante - Modélisation automatique de zones d’intérêt dans des corpus oraux pour la recher
Référence : UMR9015-IOAVAS-014
- Fonction publique : Fonction publique de l'État
- Employeur : Centre national de la recherche scientifique (CNRS)
- Localisation : 91190 GIF SUR YVETTE (France)
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
- Nature du contrat Non renseigné
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels La rémunération est d'un minimum de 2200,00 € mensuel € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Sujet de thèse :
Le doctorat proposé s’appuie sur les données recueillies dans le volet sociologique du projet ANR VOLI, et a pour objectif de développer une méthodologie d’analyse et de modélisation de données verbales en vue de leur exploitation dans les disciplines SHS investies dans le projet. A terme, il vise la mise en œuvre d’un outil d’aide à la recherche permettant d’identifier automatiquement des zones d’intérêt dans ces données.
La preuve de concept reposera sur un corpus d’entretiens réalisés en espagnol auprès de micro-travailleurs d’Amérique latine, enrichi de métadonnées socio-démographiques issues de questionnaires. Utilisées pour étayer des hypothèses sociologiques, ces corpus oraux seront analysées à travers les outils de la variation linguistique segmentale et supra-segmentale et de la modélisation automatique afin de détecter des segments de discours potentiellement riches d’un point de vue analytique pour les SHS.
L’identification de ces « zones d’intérêt » reposera sur la corrélation entre des indices acoustiques, prosodiques et expressifs (intensité, indices émotionnels etc.), et sera confrontée à plusieurs dimensions, notamment une validation manuelle par les chercheurs en SHS et une comparaison avec d’autres corpus portant sur d’autres métiers et d’autres langues.
L’objectif final est de proposer une approche généralisable et partiellement automatisable pour assister les chercheurs dans l’analyse qualitative de corpus oraux, tout en leur offrant un gain de temps substantiel et une réflexion sur leurs pratiques d’interprétation.
Activités :
Le travail de thèse portera sur les 4 principaux axes suivants :
1- Analyse et modélisation statistique de la variation acoustique et prosodique de l’oral : (1) définition, extraction et modélisation statistique de descripteurs de variation acoustique et prosodique et (2) corrélation avec d’autres niveaux linguistiques (POS)
2- Construction de patrons de variation selon différentes variables (socio-démographiques ou issues de l’exploration qualitative du corpus) et validation statistique (PCA, clustering etc.)
3- Modélisation de l’expressivité : (1) Extraction de mesures acoustiques liées à l’émotion (activation, valence, intensité, etc.) et (2) Analyse de leur pertinence par rapport à des annotations manuelles (étiquetage qualitatif réalisé par des sociologues ou linguistes).
4. Détection automatique des zones dites « expressives » ou « d’intérêt » à l’aide d’algorithmes de classification, de segmentation ou d’apprentissage automatique et implémentation de modèles IA/ML pour automatiser l’identification et la comparaison des zones pertinentes au sein des corpus oraux.
Compétences attendues :
Linguistique et sciences affectives : linguistique de corpus, phonétique expérimentale, analyse segmentale et supra-segmentale de l’oral, modélisation de l’expressivité etc. Les connaissances en sociolinguistique appliquées à la variation
Voir plus sur le site emploi.cnrs.fr...
Profil recherché
Contraintes et risques :
Le candidat retenu devra participer activement aux activités du laboratoire LISN et du projet VOLI. Le poste ne comporte pas de risques particuliers.
Pour candidater, veuillez soumettre deux fichiers : (1) un CV détaillé et (2) une lettre de motivation expliquant votre intérêt et vos qualifications pour ce poste.
Niveau d'études minimum requis
- Niveau Niveau 7 Master/diplômes équivalents
- Spécialisation Formations générales
Langues
- Français Seuil
Qui sommes-nous ?
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.
C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.
Depuis plus de 80 ans, le CNRS développe des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit entre ses missions de recherche et le transfert vers la société fait du CNRS un acteur clé de l’innovation en France et dans le monde.
Le partenariat qui lie le CNRS avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires témoignent du potentiel économique de ses travaux de recherche.
À propos de l'offre
-
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
-
Vacant
-
Chercheuse / Chercheur