
Ingénieur.e d'Etude en calcul scientifique
Référence : 2025-1952766
- Fonction publique : Fonction publique de l'État
-
Employeur :
INRAE Centre Clermont - Auvergne-Rhône-Alpes
L'Institut national de recherche pour l'agriculture, l'alimentation et l'environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes. - Localisation : 63000 Clermont-Ferrand
Partager la page
Veuillez pour partager sur Facebook, Twitter et LinkedIn.
- Nature de l’emploi Emploi ouvert aux titulaires et aux contractuels
- Expérience souhaitée Débutant
-
Rémunération Fourchette indicative pour les contractuels A partir de 26 937.48€ brut/an € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
- Catégorie Catégorie A+ (Encadrement supérieur - Autres emplois fonctionnels)
- Management Non renseigné
- Télétravail possible Non renseigné
Vos missions en quelques mots
Contexte de travail :
La plateforme Gentyane propose une offre de service de séquençage "long-reads" avec les technologies développées par Pacific Biosciences (Revio) et par Oxford Nanopore Technologies (Promethion 2), ainsi qu'une offre de séquençage "short reads" avec le séquenceur Aviti d'Element Biosciences actuellement en production.
Votre mission consistera à assurer le traitement bio-informatique des données issues de ces technologies et de délivrer les données traitées aux clients.
Vous serez également amené.e à travailler sur les données de génotypage produites sur la plateforme.
Vous assurerez la maintenance des serveurs (mises en réseau, mises à jour, débogage), ce qui nécessitera d'interagir avec les supports techniques des fournisseurs (PacBio, ONT et Element Biosciences) et les supports informatiques internes à INRAE et l’UCA.
Vous serez plus particulièrement en charge de :
- Mettre en œuvre des méthodes bioinformatiques, notamment des méthodes de calculs distribués et de parallélisation sur les données afin de traiter des volumes massifs de données.
- Assurer le stockage et le traitement bioinformatique des données issues des séquenceurs ADN et délivrer les données traitées aux clients.
- Mettre en œuvre des techniques informatiques pour optimiser la programmation et l'accès aux données.
- Mener une veille technologique régulière, en particulier sur les technologies long-reads, via la consultation de publications scientifiques, les séminaires scientifiques et technologiques de la communauté clermontoise, la surveillance de dépôts GitHub et de forums bio-informatiques/informatiques spécialisés, l’analyse des retours d’expérience d'utilisateurs.
- Elaborer des stratégies d’analyse bioinformatique et des développements de pipelines pour traiter les données de séquençage selon les besoins du client en intégrant des gestionnaires d’outils, de workflow, et des conteneurs d’environnements (Conda, Snakemake, Singularity).
- Développer des étapes complémentaires de pipelines en langages de programmation Python, bash et R.
- Installer des outils bio-informatiques existants et les adapter aux caractéristiques du cluster de calcul du Mésocentre UCA.
- Assurer la maintenance des serveurs (mises en réseau, mises à jour, débogage), ce qui nécessitera d'interagir avec les supports techniques des fournisseurs (PacBio, ONT et Element Biosciences) et les supports informatiques internes à INRAE et l’UCA.
- Appliquer les principes FAIR, en intégrant notamment des gestionnaires d’outils (Conda), de workflow (Snakemake, Nextflow), et des conteneurs d’environnements (Docker, Singularity) dans les pipelines et en maintenant un dépôt de scripts Gitlab.
Prise de poste souhaitée au 01/08/2025.
Profil recherché
Formation recommandée : niveau Master
Connaissances souhaitées :
- Programmation, langages de script
- Linux, bash
- Génomique
- Bioinformatique NGS/TGS
Expérience appréciée : traitement de données de séquençage long reads
Aptitudes recherchées :
- Bioinformatique des génomes
- NGS, TGS, analyse des données "omiques"
- Maîtrise de l’environnement Linux (administration, gestionnaires de paquets/outils …)
- Maîtrise de Bash, Python/Perl, R, langages de workflow (Snakemake, Nextflow)
- Containerisation (Singularity, Docker)
- Calcul haute performance (SLURM)
- Notions des technologies de virtualisation et stockage objet (CEPH, S3)
- Travailler en interaction au sein d'une équipe
- Rigueur et organisation
- Communiquer, transmettre les savoir-faire techniques et méthodologiques
Niveau d'études minimum requis
- Niveau Niveau 6 Licence/diplômes équivalents
- Spécialisation Spécialités plurivalentes de l'agronomie et de l'agriculture
Éléments de candidature
Documents à transmettre
Personnes à contacter
Qui sommes-nous ?
INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.
Descriptif du service
Vous exercerez votre activité au sein de l'infrastructure scientifique collective GENTYANE, dirigée par Charles Poncet. La plateforme propose des services en génomique, en particulier du génotypage et du séquençage courts et longs fragments. Au quotidien, vous travaillez en étroite collaboration avec les personnels de GENTYANE, ses clients et la plateforme Bioinformatique du GDEC dirigée par Pauline Lasserre-Zuber. Vous devrez également interagir avec le personnel du Mésocentre de l'Université Clermont-Auvergne (UCA) qui héberge et administre notre infrastructure de stockage et de calculs. Vous serez encadré.e directement par Véronique Gautier (Ingénieure d’Etude).
Le site de Crouël est directement desservi par les lignes de bus régulières T2C n°9, n°35 et n°36.
À propos de l'offre
-
Travail sur une plateforme, nombreux interlocuteurs et projets à traiter en parallèle.
-
Susceptible d'être vacant à partir du 01/05/2025
-
Experte / Expert en calcul scientifique