Doctorat en Informatique (H/F) / Estimation de la force de voix

Référence : UMR9015-ALBRIL-002

  • Fonction publique : Fonction publique de l'État
  • Employeur : Centre national de la recherche scientifique (CNRS)
  • Localisation : 91190 GIF SUR YVETTE (France)
Postuler sur le site employeur

Date limite de candidature : 22/09/2024

Partager la page

Veuillez pour partager sur Facebook, Twitter et LinkedIn.

  • Nature de l’emploi Emploi ouvert uniquement aux contractuels
  • Nature du contrat

    CDD de 3 ans

  • Expérience souhaitée Non renseigné
  • Rémunération (fourchette indicative pour les contractuels) La rémunération est d'un minimum de 2135,00 € mensuel € brut/an
  • Catégorie Catégorie A (cadre)
  • Management Non renseigné
  • Télétravail possible Non renseigné

Vos missions en quelques mots

Sujet de thèse :
Étude d'un modèle de la Force de Voix.
Le projet ANR “VERS” (Vocal Effort: from Recognition to Synthesis), vise le développement d’outils à même d’estimer la force (ou intensité) originale d’une voix enregistrée, pour l’appliquer à des extraits d’archives de télévision et de radio. Cette Force de Voix originale (FdV) constitue une information cruciale pour la compréhension des caractéristiques acoustiques et articulatoires d’une production parlée (Liénard, 2019). Il s’agit d’un facteur qui régit de nombreux aspects de l’articulation de la parole : de sa source (avec une influence importante sur la fréquence fondamentale) aux résonances du conduit vocal (dont les valeurs sont adaptées à différents niveaux d’effort). Cette information de FdV est perdue lors des enregistrements, en particulier ceux effectués pour les médias audiovisuels. Elle reste toutefois perceptible à l’oreille et on sait qu’il est possible de l’estimer en utilisant des caractéristiques spectrales à long terme de la parole (Liénard, 2019; Alku et al., 2024). La possibilité d’effectuer de meilleures estimations de VS (plus fines et plus robustes à différentes sources de distorsion) permettrait d’approfondir l’analyse des postures sociales et affectives des locuteurs. Cela permettra notamment de mieux décrire la dimension psychologique d’activation-arousal qui explique la plus grande part des variations acoustiques observées dans les performances de parole émotionnelle (Goudbeek and Scherer, 2010). Connaître la FdV originale aiderait également à guider d’autres analyses plus fines liées aux performances orales publiques, destinées à des travaux dans le domaine des sciences politiques et pour la description de phénomènes liés aux discours de haine notamment. Le projet de recherche est divisé en quatre parties principales, (i) avec une implication importante dans la construction d’un corpus de données audio calibrées qui servira de référence, et comprendra des lectures guidées, ainsi que des lectures de contes, dans une chambre anéchoïque ; (ii) le développement de modèles de ML pour la prédiction à long et court terme, qui devront être appliqués à différents signaux de parole non calibrés ; (iii) la modification d’enregistrements de parole pour changer la FdV perçue ; et (iv) un travail visant à relier les caractéristiques acoustiques utilisées par les modèles de ML avec la dimension psychologique d’activation-arousal pour la parole affective. Ce projet se déroulera sur une période de trois ans, dans le cadre du projet VERS, et via des collaborations nationales et internationales.

Voir le sujet complet ici:
https://adum.fr/as/ed/voirproposition.pl?matricule_prop=58770#version

Contexte :
La thèse s’inscrit dans le cadre du projet ANR « VERS » (pour Effort Vocal : de l'Estimation à la Synthèse), projet qui vise une série de développements autour de la description, de l’estimation et de la modification des caracté
Voir plus sur le site emploi.cnrs.fr...

Profil recherché

Contraintes et risques :
• Étude des architectures des Machine Learning : modèles neuronaux et auto-supervisés pour le traitement des signaux audio
• Création et Augmentation de corpus par l'application de dégradations acoustiques
• Construction d'un modèle de restauration de la force vocale à partir de signaux dégradés (par exemple, compression, réverbération, bruit)
• Présentation d'une évaluation objective des performances du modèle, ainsi qu'une évaluation subjective via des évaluations perceptives
• Étude de l'interprétation-explication des modèles
• Construction d'un modèle de modification de la voix pour permettre le contrôle du VS
• Rapport des résultats dans des conférences et revues internationales à comité de lecture

Niveau d'études minimum requis

  • Niveau Niveau 7 Master/diplômes équivalents
  • Spécialisation Formations générales

Langues

  • Français Seuil

Qui sommes-nous ?

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.

C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.

En savoir plus sur l'employeur

À propos de l'offre

  • La recherche doctorale s'inscrit dans le cadre du projet ANR français « VERS » (pour Effort Vocal : de l’Estimation à la Synthèse).

  • Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

  • Vacant
  • Chercheuse / Chercheur

D'autres offres pourraient vous intéresser

  • RESPONSABLE D'ATELIER D'USINAGE (CDI) H/F

    • Recherche

    • Localisation : Essonne (91)
    • Fonction publique : Fonction publique de l'État
    • Employeur : MINES ParisTech
    • En ligne depuis le 03 septembre 2024
    Ministère de l’Économie et des Finances
  • Responsable d'analyses biologiques H/F

    • Recherche

    • Localisation : Essonne (91)
    • Fonction publique : Fonction publique de l'État
    • Employeur : AgroParisTech
    • En ligne depuis le 06 juin 2024
    Ministère de l'agriculture et de la souveraineté alimentaire
  • Technicien(ne) en expérimentation végétale et analyses biochimiques H/F

    • Recherche

    • Localisation : Essonne (91)
    • Fonction publique : Fonction publique de l'État
    • Employeur : AgroParisTech
    • En ligne depuis le 31 mai 2024
    Ministère de l'agriculture et de la souveraineté alimentaire