Gestionnaire de données / Ingénieur logiciel (H/F)

Référence : UMR8554-ALIHOR-003

  • Fonction publique : Fonction publique de l'État
  • Employeur : Centre national de la recherche scientifique (CNRS)
  • Localisation : 75005 PARIS 05 (France)
Postuler sur le site employeur

Date limite de candidature : 10/03/2025

Partager la page

Veuillez pour partager sur Facebook, Twitter et LinkedIn.

  • Nature de l’emploi Emploi ouvert uniquement aux contractuels
  • Nature du contrat

    CDD d'1 an

  • Expérience souhaitée Non renseigné
  • Rémunération (fourchette indicative pour les contractuels) Entre 2 213,87 € et 2 897,94 € bruts mensuels selon expérience € brut/an
  • Catégorie Catégorie A (cadre)
  • Management Non renseigné
  • Télétravail possible Non renseigné

Vos missions en quelques mots

Missions :
L'équipe travaille sur de grands ensembles de données (actuellement ~5T, et on estime qu'ils vont doubler), qui sont de très longs enregistrements audio (d'environ 16 heures chacun) et des métadonnées. Les enregistrements sont recueillis grâce à des appareils que les enfants portent, dans leur environnement habituel, pour des journées entières. Ces enregistrements captent une grande diversité de sons: les vocalisations des enfants (pleurs, rires, babillages, conversations) et celles des adultes qui les entourent mais aussi une grande quantité de bruits. Nous disposons de données pour plus de 1 000 enfants dans leurs familles, apprenant une ou plusieurs de plus de 15 langues, et grandissant sur les 5 continents. Nous ré-utilisons également d'autres jeux de données tels que CHILDES (childes.talkbank.org) et des corpus de transcription + audio multilingues (par exemple, la bible).
Les principales missions du candidat retenu seront de collaborer à la création d'un code robuste et bien documenté pour réaliser les tâches suivantes de manière transparente et reproductible : 1) nettoyer les ensembles de données de parole(+texte), assurer leur protection et sauvegarde, et les convertir dans notre format de prédilection (ChildProject https://childproject.readthedocs.io/en/latest/) ; 2) en utilisant notre structure préférée d'imbrication avec datalad (https://handbook.datalad.org/en/latest/basics/101-106-nesting.html), réaliser des expériences de modélisation reliant le texte à l'audio (par exemple, calculer l'entropie sur la base d'analyses n-gram de transcriptions de la parole dans un audio donné et les comparer aux caractéristiques de wav2vec ou similaires sur l'audio).
Le candidat retenu rejoindra une équipe comprenant notamment un gestionnaire de données/ingénieur logiciel, qui est chargé d'organiser les différents ensembles de données sur le cluster et sur des dépôts scientifiques (avec bash/python ; exemple de dépôt : https://gin.g-node.org/) et de maintenir un outil d'organisation des données open-source sur github (https://childproject.readthedocs.io/en/latest/) ; ainsi qu'un ingénieur en apprentissage automatique, qui est chargé du développement des outils ML. L'équipe est fortement collaborative, il est donc important d'avoir des compétences en communication et d'être ouvert à la discussion avec d'autres personnes (étudiants, chercheurs postdoctoraux, etc.), tant pour donner que pour recevoir des commentaires constructifs.
Il existe de nombreuses possibilités d'élargir les compétences (par exemple, l'utilisation avancée de github, le versioning, la création de conteneurs comme docker, la gestion, la rédaction, etc. Il y aura également quelques opportunités de contribuer à la rédaction d'articles scientifiques, bien que cela ne soit pas obligatoire. Un mentorat régulier est utilisé pour aider les membres de l'équipe à clarifier leurs objectifs de carrière et à prendre des mesures pour l
Voir plus sur le site emploi.cnrs.fr...

Profil recherché

Competences :

■ Savoirs / connaissances
- Techniques du domaine
- Génie logiciel
- Méthodes d'analyse et de conception
- Méthodes de modélisation et de développement (connaissance générale)
- Méthodes de mise en production
- Méthodologie de tests
- Architectures technique et logiciels
- Langages de programmation (connaissance approfondie)
- Systèmes de gestion de base de données
- Protocoles de communication
- Référentiel des bonnes pratiques
- Sécurité des systèmes d'information et de communication
- Compréhension et production orale et écrite de l’anglais et du français à un niveau conversationnel
■ Savoir-faire
- Effectuer une analyse de besoins
- Appliquer les techniques du domaine
- Élaborer et mettre en œuvre un plan de tests
- Packager une application
- Appliquer des normes, procédures et règles
- Appliquer les procédures d'assurance qualité
- Rédiger et mettre à jour la documentation fonctionnelle et technique
- Capacité à travailler en équipe et en réseau
■ Savoirs-être
- Sens de l’organisation indispensable
- Autonomie, sens du contact
Contraintes et risques :
Pas de contraintes ni de risques particuliers.

Niveau d'études minimum requis

  • Niveau Niveau 6 Licence/diplômes équivalents
  • Spécialisation Informatique, traitement de l'information, réseau de transmission des données

Langues

  • Français Seuil

Qui sommes-nous ?

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.

C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.

En savoir plus sur l'employeur

À propos de l'offre

  • Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

  • Vacant
  • Conceptrice / Concepteur

Des offres d'emplois recommandées pour vous

  • INGENIEUR/INGENIEURE SECURITE

    • Numérique

    • Localisation : Paris (75)
    • Fonction publique : Fonction publique de l'État
    • Employeur : Conseil d'Etat
    • En ligne depuis le 21 février 2025
    Conseil d'Etat
  • Responsable du pôle « Performance et automatisation » (h/f)

    • Numérique

    • Localisation : Paris (75)
    • Fonction publique : Fonction publique de l'État
    • Employeur : Direction de l'Information Légale et Administrative (DILA)
    • En ligne depuis le 21 février 2025
    Premier Ministre
  • Responsable du pôle « Infrastructures et Opérations » (h/f)

    • Numérique

    • Localisation : Paris (75)
    • Fonction publique : Fonction publique de l'État
    • Employeur : Direction de l'Information Légale et Administrative (DILA)
    • En ligne depuis le 21 février 2025
    Premier Ministre
  • Chef de projet innovant senior - DFJM - Sous-direction des sytèmes d'information H/F

    • Numérique

    • Localisation : Paris (75)
    • Fonction publique : Fonction publique de l'État
    • Employeur : Musée du Louvre
    • En ligne depuis le 21 février 2025
    Musée du Louvre
  • TSEF - Administrateur Réseaux H/F H/F

    • Numérique

    • Localisation : Paris (75)
    • Fonction publique : Fonction publique de l'État
    • Employeur : Opérateur des systèmes d'information interministériels classifiés (OSIIC)
    • En ligne depuis le 21 février 2025
    Secrétariat Général de la Défense et de la Sécurité Nationale (SGDSN)
  • TSEF - Administrateur des systèmes d'information H/F H/F

    • Numérique

    • Localisation : Paris (75)
    • Fonction publique : Fonction publique de l'État
    • Employeur : Opérateur des systèmes d'information interministériels classifiés (OSIIC)
    • En ligne depuis le 21 février 2025
    Secrétariat Général de la Défense et de la Sécurité Nationale (SGDSN)