2 postes d'Ingénieur·e de développement Python – Écosystème data & IA
Référence : 2026-2323999
- Fonction publique : Fonction publique de l'État
-
Employeur :
Institut National de Recherche pour l'Agriculture, l'Alimentation et l'Environnement (INRAE)
INRAE - Localisation : Toulouse
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert uniquement aux contractuels
-
Nature du contrat
CDD d'1 an
- Expérience souhaitée Non renseigné
-
Rémunération Fourchette indicative pour les contractuels 2815,82 € à 3514,86€ selon exp € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A (cadre)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Mission principale :
Vous assurerez le développement, la maintenance technique et la modernisation profonde du catalogue national des données de la recherche de la plateforme Recherche Data Gouv. Vous serez en charge de faire évoluer les outils technologiques d’ingénierie des données [TJ(1] vers des architectures basées sur l'intelligence artificielle et le web sémantique.
· Développer et déployer des agents IA (LLM) intégrés aux interfaces afin d’assister les chercheurs pour le dépôt de leurs jeux de données.[TJ(2]
· Concevoir un moteur de recherche sémantique de nouvelle génération et des outils d'analyse automatisés reposant sur les LLMs et les embeddings pour assister la curation et la validation des données.
· Faire évoluer et administrer un graphe de connaissances sur les données de la recherche en exploitant des ontologies et des thésaurus scientifiques pour structurer l'ensemble de l'écosystème.
· Architecturer l'articulation technique et l'interopérabilité entre les espaces de stockage des données de la recherche et les environnements de calcul de haute performance.
· Implémenter des connecteurs et des protocoles de communication modernes, notamment le protocole MCP (Model Context Protocol), pour lier les LLM aux bases de connaissances locales.`
· Intégrer et exploiter le standard Croissant-ML afin de décrire, structurer et distribuer les jeux de données de manière à optimiser leur utilisation directe par les modèles d'apprentissage automatique.
· Concevoir les tableaux de bord et les outils d'analyse nécessaires au pilotage de l’ensemble des données de la recherche.
· Garantir la qualité, la sécurité et la maintenabilité du code produit (tests, revues de code) au sein d'une équipe fonctionnant en mode Agile Scrum.
· Collaborer quotidiennement avec les Product Owners et l'équipe d'ingénierie pour affiner le backlog et valider les fonctionnalités livrées.
Profil recherché
Formation recommandée : Formation supérieure en informatique (Bac+5)
Compétences techniques indispensables :
· Maîtrise solide du langage Python et de son écosystème de développement.
Compétences souhaitées (un fort intérêt et une volonté de monter en compétences sur ces sujets suffisent) :
· Intérêt pour l'exploitation des LLM, notamment open (frameworks d'orchestration, APIs) et les concepts de vectorisation (embeddings).
· Sensibilité aux architectures de graphes de connaissances et à la manipulation d'ontologies ou de thésaurus.
· Curiosité pour les protocoles modernes d'interopérabilité comme MCP (Model Context Protocol) ou le standard Croissant-ML.
· Anglais souhaitable car le travail se fera aussi dans un contexte de recherche européenne
Expérience appréciée : Débutant accepté
Aptitudes recherchées : autonomie, rigueur technique et proactivité dans l'apprentissage de nouvelles technologies. De très bonnes capacités de communication (écrite et orale) sont indispensables pour la collaboration quotidienne au sein d'une équipe répartie à distance.
Niveau d'études minimum requis
- Niveau Niveau 7 Master/diplômes équivalents
Éléments de candidature
Personnes à contacter
Qui sommes-nous ?
NOTRE AMBITION : AGIR POUR LA VIE, L’HUMAIN, LA TERRE
Premier organisme de recherche spécialisé au monde en agriculture, alimentation et environnement, INRAE est né le 1er janvier 2020 de de la fusion entre l’INRA et IRSTEA. Nous sommes une communauté de travail de 12 000 personnes, avec plus de 200 unités de recherche et une quarantaine d’unités expérimentales implantées dans 18 centres sur toute la France.
Notre Mission ?
Face à l’augmentation de la population, au changement climatique, à la raréfaction des ressources et au déclin de la biodiversité, INRAE construit des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources.
Pour répondre à ces grands enjeux mondiaux, nous avons besoin de renfort dans nos équipes. Des métiers de la recherche aux métiers de l’appui, l’INRAE recrute à tout niveau de diplôme (du CAP/BEP à Bac+8) !
Rejoignez une communauté engagée et agissez pour l’intérêt général !
Descriptif du service
Vous exercerez votre activité au sein de l'unité mixte de service « Plateforme des données Recherche Data Gouv ». Recherche Data Gouv est un écosystème national au service des données de la recherche qui offre des outils et des accompagnements aux chercheurs tout au long du cycle de vie de leurs données.
Pleinement intégré(e) à l'équipe d'ingénierie des données fonctionnant en mode Agile Scrum , vous serez un acteur clé pour concevoir, moderniser et faire évoluer une infrastructure technologique à la pointe. Au-delà du catalogue national, le projet intègre un graphe de connaissances, des tableaux de bord et des outils d'analyse avancés.
L'équipe fonctionne en mode Agile Scrum. Le poste requiert une forte capacité à collaborer à distance avec des interlocuteurs répartis sur toute la France.
À propos de l'offre
-
Le poste est basé à Toulouse. Il implique une collaboration quotidienne et essentielle avec des interlocuteurs (Product Owners, équipes partenaires, utilisateurs) situés à distance sur l'ensemble du territoire national. Télétravail partiel possible jusqu'à 2 jours par semaine.
-
Vacant à partir du 01/10/2026
-
Data engineer