Post-doctorant·e en qualité des jeux de données pour IDS réseau fondés sur l'apprentissage automatique
Référence : 2026-2203187
- Fonction publique : Fonction publique de l'État
-
Employeur :
TELECOM Sud Paris
Télécom SudParis - Localisation : EVRY
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
-
Nature du contrat
CDD d'1 an
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels Non renseignée Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Oui
Vos missions en quelques mots
Cette situation met en évidence la nécessité d’un changement de paradigme vers des approches centrées sur les données en cybersécurité, où l’accent n’est plus mis uniquement sur une optimisation centrée sur le modèle, mais sur une caractérisation systématique de la qualité des jeux de données. Bien que des frameworks génériques de qualité des données existent, il n’existe actuellement aucun framework opérationnel spécifique aux NIDS permettant aux chercheurs et aux praticiens d’évaluer, de comparer et d’exploiter la qualité des jeux de données de manière structurée et exploitable, au-delà du “concept drift”. Relever ces défis est essentiel pour améliorer la fiabilité, l’interprétabilité et la pertinence des évaluations des NIDS fondés sur le ML.
Dans ce contexte, ce projet postdoctoral vise à concevoir, instancier et opérationnaliser un framework d’évaluation de la qualité des jeux de données adapté aux NIDS fondés sur le ML, en mettant l’accent sur les propriétés intrinsèques des données (diversité, exactitude de l’étiquetage, réalisme, etc.) qui influencent directement les performances de détection et la généralisation. Au-delà d’une simple caractérisation, le projet ambitionne de s’appuyer sur ce framework afin de soutenir des méthodologies d’évaluation plus fiables et de formuler des recommandations opérationnelles à destination des créateurs et des utilisateurs de jeux de données NIDS.
Les principales activités du projet incluent :
· Poursuivre le développement d’un framework spécifique aux NIDS pour un nombre sélectionné de dimensions de qualité au-delà de la diversité.
· Opérationnaliser un framework spécifique aux NIDS en formalisant les dimensions de diversité validées et en intégrant l’exactitude de l’étiquetage comme dimension intrinsèque de la qualité, aboutissant à des rapports de qualité structurés et reproductibles.
· Instancier et valider le framework sur plusieurs jeux de données NIDS existants (jeux de données publics ainsi que ceux générés dans le cadre du projet SuperviZ), en analysant la manière dont les profils de qualité diffèrent d’un jeu de données à l’autre et comment ces différences se relient aux performances des modèles et aux comportements de généralisation observés.
Concevoir des mécanismes de recommandations fondés sur les données, basés sur les résultats du framework, à destination (i) des créateurs de jeux de données, afin de guider des stratégies de génération ou de collecte sensibles à la diversité et orientées par la qualité, et (ii) des évaluateurs de NIDS, afin de permettre des protocoles d’évaluation plus informatifs et plus fiables pour les IDS/NIDS fondés sur le ML.
Profil recherché
Niveau de formation et/ou expérience requis :
· Doctorat ou PhD depuis moins de 3 ans
Compétences, connaissances et expériences indispensables :
· Expérience avec le développement en apprentissage machine/profond
· Connaissances en Data-Centric AI
· Des notions en cybersécurité et en réseaux sont optionnelles
· Anglais parlé et écrit
Compétences, connaissances et expériences souhaitables:
· Expérience préalable en apprentissage automatique (ML) et manipulation de netflows
Capacités et aptitudes :
· Rigueur
· Autonomie
· Travail en équipe
Niveau d'études minimum requis
- Niveau Niveau 8 Doctorat/diplômes équivalents
Langues
- Anglais Avancé ou indépendant
Localisation
Éléments de candidature
Documents à transmettre
Qui sommes-nous ?
Télécom SudParis est une grande école publique d'ingénieurs reconnue au meilleur niveau des sciences et technologies du numérique. La qualité de ses formations est basée sur l’excellence scientifique de son corps professoral et une pédagogie mettant l’accent sur les projets d’équipes, l’innovation de rupture et l’entreprenariat. Télécom SudParis compte 1 000 étudiants dont 700 élèves ingénieurs et environ de 150 doctorants. Télécom SudParis fait partie de l’Institut Mines-Télécom, premier groupe d’école d’ingénieurs en France, et partage son campus avec Institut Mines-Télécom Business School. Télécom SudParis est co- fondatrice de l'Institut Polytechnique de Paris (IP Paris), Institut de Sciences et Technologies à vocation mondiale avec l’Ecole polytechnique, l’ENSTA Paris, l’ENSAE Paris et Télécom Paris.
Descriptif du service
La cybersécurité constitue un enjeu majeur pour les infrastructures numériques modernes, au sein desquelles les systèmes de détection d’intrusion réseau (NIDS) jouent un rôle central dans la détection des activités malveillantes et la protection des systèmes d’information. Ces dernières années, les techniques d’apprentissage automatique (Machine Learning, ML) et d’intelligence artificielle (IA) ont été largement adoptées pour les NIDS, permettant la détection automatique d’attaques complexes et évolutives. Un nombre important de travaux académiques a rapporté des performances de détection très élevées sur des jeux de données de benchmark publics en utilisant ces techniques.
Cependant, malgré ces résultats affichant des performances élevées, le déploiement des NIDS basés sur le ML dans des environnements opérationnels réels demeure limité. Un consensus croissant au sein de la communauté scientifique souligne que cet écart est en grande partie dû aux limitations des jeux de données utilisés pour l’entraînement et l’évaluation. De nombreux benchmarks présentent des biais structurels, une diversité limitée, des imprécisions d’étiquetage et des hypothèses expérimentales peu réalistes. Par conséquent, les protocoles d’évaluation mesurent souvent la capacité des modèles à reconnaître des artefacts propres aux jeux de données plutôt que leur véritable capacité de généralisation, donnant ainsi un faux sentiment de sécurité.
À propos de l'offre
-
Fourchette indicative de rémunération (hors bonus annuel variable): 35 400 - 37 000 euros bruts annuels, selon le profil et l’expérience (charges salariales réduites en secteur public).
-
L332-2
-
Vacant à partir du 01/07/2026
-
Experte / Expert en production, traitement et analyse de données