• TéléchargerPDF – 41.78Ko

Doctorant : Correction d’erreurs pour le stockage de données dans des molécules d’ADN (H/F)

Référence : UMR6074-DOMLAV-022

  • Fonction publique : Fonction publique de l'État
  • Employeur : Centre national de la recherche scientifique (CNRS)
  • Localisation : 35042 RENNES (France)
  • TéléchargerPDF – 41.78Ko

Partager la page

Veuillez pour partager sur Facebook, Twitter et LinkedIn.

  • Nature de l’emploi Emploi ouvert uniquement aux contractuels
  • Nature du contrat Non renseigné
  • Expérience souhaitée Non renseigné
  • Rémunération Fourchette indicative pour les contractuels La rémunération est d'un minimum de 2200,00 € brut mensuel € brut/an Fourchette indicative pour les fonctionnaires Non renseignée
  • Catégorie Catégorie A (cadre)
  • Management Non renseigné
  • Télétravail possible Non renseigné

Vos missions en quelques mots

Sujet de thèse :
STOCKAGE DE DONNEES DANS DES MOLECULES D’ADN SYNTHETIQUE

Les centres de données représentent aujourd’hui autour de 20% de la consommation d’énergie du numérique en France. Une alternative, le stockage de l’information dans des molécules d’ADN synthétique, est ainsi explorée activement depuis quelques années. En plus d’offrir une densité de stockage bien supérieure aux technologies actuelles (jusqu’`a plusieurs exabits au mm3), l’ADN est un support robuste, capable de résister à de fortes variations de température, et durable dans le temps. Il devrait donc permettre de conserver l’information sur le long terme, et de diminuer significativement la consommation d’énergie du stockage.

Une molécule d’ADN est constituée d’une séquence de bases, ou nucléotides, de types A,C,G,T. L’opération de synthèse de l’ADN consiste à construire la molécule correspond à une suite donnée de symboles quaternaires. Actuellement, l’opération de synthèse représente le principal goulot d’étranglement de cette technologie, car elle est lente et coûteuse, bien que très fiable car dédiée à l’origine au domaine médical. La lecture de l’information se fait ensuite par une opération de séquençage, une technique qui introduit une proportion importante d’erreurs (environ 5%) dans les données séquencées.

CORRECTION D’ERREURS

Le codage canal consiste à introduire des redondances structurées dans les données, qui seront exploitées lors du décodage pour corriger les erreurs introduites lors de la transmission ou du stockage des données. Les solutions modernes de codage canal telles que les codes Turbo, les codes LDPC ou les codes Polaires, sont aujourd’hui un rouage indispensable de la majorité des standards de télécommunications (Wi-Fi, radio mobile, etc.) et de stockage de l’information (mémoires RAM, disques durs, etc.), car ils permettent de fiabiliser la transmission et le stockage. Cependant, le stockage de données dans l’ADN introduit des erreurs (insertions, délétions), que les codes canal usuels ne savent pas corriger car ces erreurs cassent leur structure de redondance.

Ceci dit, une opportunité intéressante du point de vue de la correction d’erreurs réside dans le fait que le séquençage produit naturellement un grand nombre de lectures de la même molécule, avec des erreurs différentes à chaque lecture. Une solution issue du domaine de la bio-informatique consiste à utiliser des algorithmes de consensus pour reconstruire la séquence d’entrée `à partir des lectures multiples. Dans cette thèse, l’idée sera de développer des approches hybrides combinant ces deux solutions complémentaires (algorithmes de consensus et codage canal), pour reconstruire plus efficacement les données d’entrée en exploitant à la fois les lectures multiples et les redondances du code.

Contexte :
La thèse s’effectuera dans le cadre du PEPR MolécularXiv (voir https://pepr-molecularxiv.fr/le-pepr/). La personne recrutée sera affe
Voir plus sur le site emploi.cnrs.fr...

Profil recherché

Contraintes et risques :

Niveau d'études minimum requis

  • Niveau Niveau 8 Doctorat/diplômes équivalents
  • Spécialisation Formations générales

Langues

  • Français Seuil

Qui sommes-nous ?

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.

C’est l’une des plus importantes institutions publiques au monde : 33 000 femmes et hommes (dont plus de 16 000 chercheurs et plus de 16 000 ingénieurs et techniciens), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines.

En savoir plus sur l'employeur

À propos de l'offre

  • Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers), en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

  • Vacant
  • Chercheuse / Chercheur

Des offres d'emplois recommandées pour vous