Le séquençage approfondi des vaccins bivalents Moderna et Pfizer identifie une contamination des vecteurs d'expression conçus pour l'amplification des plasmides dans les bactéries.
Article originel : Deep sequencing of the Moderna and Pfizer bivalent vaccines identifies contamination of expression vectors designed for plasmid amplification in bacteria.
Substack, 16.02.23
Introduction
Alors que les universités étatsuniennes continuent de rendre obligatoires de façon irresponsable les injections (vaccins contre la COVID) pour les étudiants présentant un risque limité de contracter la COVID, il devient impératif que davantage d'informations publiques soient disponibles concernant les ingrédients de ces vaccins expérimentaux. L'EMA et le TGA ont toutes deux pris note de la présence d'ARN fragmenté et de la présence de frottis par western blot qui suggèrent que le processus de fabrication du vaccin manque de fidélité et de transparence. Peu après la publication des données de la TGA, Patel et al. (Pfizer) ont publié un article tentant de désamorcer ces inquiétudes. Jessica Rose a couvert ce sujet ici.
Le consentement éclairé ne peut être obtenu avec des produits thérapeutiques mal caractérisés.
Nous entrons maintenant dans la troisième année de la COVID et il est devenu de plus en plus clair que les groupes démographiques sont à risque. Il a été démontré à plusieurs reprises que le groupe d'âge des étudiants (moins de 25 ans) présentait un risque très faible de contracter la COVID. Pourtant, les effets indésirables induits par le vaccin chez les étudiants de cette tranche d'âge sont plus élevés que pour tout autre vaccin jamais administré. Krug et al. ont observé un risque de 1:6250 de myo/péricardite chez les jeunes de 16-17 ans (Krug et al).
L'"étude thaïlandaise" (Mansanguan et al) implique des taux de risque cardiaque encore plus élevés chez les étudiants, où 29,24 % des étudiants (n=301) ont présenté des manifestations cardiovasculaires. Des études incluant 23 millions de patients nordiques ont observé un taux significatif de myocardite dans ce groupe d'âge également. Cette étude, bien que plus importante, n'était pas aussi contrôlée que l'étude thaïlandaise dans la mesure où Mansanguan et al. ont pris des mesures de base des patients et ont exploré plus que la myo/péricardite.
Ces risques ne sont pas observés avec la Covid-19 elle-même.
Des résultats similaires sont observés par Aquaro et al. et Sechi et al. où la myocardite dérivée de la Covid-19 n'est pas différente des taux de fond.
Cette différence de risque cardiaque entre le vaccin et le virus ne doit pas surprendre. L'administration intramusculaire (IM) s'accompagne d'un accès potentiel immédiat au système vasculaire. Des études évaluant des infirmières qualifiées utilisant des techniques d'aspiration ont un taux de 1,9 % de toucher une veine ou une artère. Le taux d'injection intraveineuse accidentelle en dentisterie est encore plus élevé, soit 4 % avec l'aspiration. Les vaccins contre le SRAs-CoV-2 ne nécessitent même pas d'aspiration et ont probablement un taux d'injection IV accidentelle plus élevé. Marc Girodot a traité ce sujet en détail.
D'un autre côté de cette équation du risque, il a été démontré que l'infection par la Covid-19 procure une immunité plus durable que les vaccins axés sur les protéines de pointe. L'immunité naturelle fournit des anticorps muqueux et une reconnaissance par les cellules T du protéome dérivé de l'ensemble du génome viral de 30 kb, alors que les vaccins se concentrent sur une petite région de ~4 kb (1273 acides aminés) du virus.
Cette stratégie vaccinale à épitope étroit a maintenant des mutants d'échappement documentés, où la majorité des mutations de Delta à Omicron sont des variants changeant les acides aminés dans le domaine spike ciblé par le programme de vaccination. Cet enrichissement en variantes d'acides aminés par rapport aux variantes synonymes est le signe distinctif de la sélection. Les vaccins qui n'arrêtent pas la transmission et ne parviennent pas à limiter la charge virale du patient, laissent l'horloge évolutive du virus (RdRp polymérase) intacte mais ne font que diriger l'évolution autour de la pagaie que vous avez placée dans la rivière. Chau et al. ont démontré des charges virales plus élevées chez les vaccinés. L'étude a porté sur plusieurs variantes, mais d'autres études suggèrent des charges virales égales ou légèrement inférieures chez les vaccinés. Même dans ces cas, la variance est de quelques CTs et de l'ordre de 10^8. Dahdouh et al. ont montré jusqu'à 10 CT de variance dans les prélèvements seuls, ce qui suggère de nombreux facteurs de confusion dans ces études. La petite variation de CT est de l'ordre de 100 millions de molécules et est si élevée à la fois chez les vaccinés et les non-vaccinés qu'une différence de 2 CT n'est pas pertinente étant donné les ordres de grandeur inférieurs requis pour une dose infectieuse minimale (10^6).
Il est bien établi que ces vaccins n'arrêtent pas la transmission et des études récentes de la clinique de Cleveland (préimpression) démontrent même une efficacité négative du vaccin avec chaque vaccin supplémentaire. Elles démontrent également un effet dépendant de la dose ou un "gradient biologique", qui est l'un des principes des conditions de causalité de Bradford Hill. Cela implique que les vaccins affaiblissent le système immunitaire des patients et les rendent plus sensibles à la Covid-19 et à d'autres infections.
Ainsi, les politiques de vaccination dans les universités semblent violer l'éthique médicale fondamentale car elles demandent aux étudiants d'absorber une intervention médicale à risque/bénéfice négatif pour protéger des professeurs plus âgés. Elles utilisent leurs étudiants comme des boucliers humains tout en omettant d'informer que le bouclier a un prix "roulette russe" pour son utilisateur. Il s'agit d'une coercition mal informée et non d'un consentement éclairé.
Cela est particulièrement vrai pour les vaccins qui n'arrêtent pas la transmission et qui, dans plusieurs études, montrent des signes d'efficacité négative du vaccin (Barnstable Mass). L'étude Barnstable Mass menée par les CDC a montré des taux d'infection plus élevés parmi les personnes vaccinées. L'Australie est maintenant vaccinée à 96 % (16+ 2 doses) et les hôpitaux sont enrichis à plus de 96 % de patients vaccinés. La surmortalité en Australie est plus élevée après la vaccination que pendant la pandémie qui a précédé la vaccination.
Les rappels bivalents n'ont jamais été étudiés de manière adéquate dans ce groupe d'âge d'étudiants. Paul Offit aurait déclaré que "la solution était trouvée" pour l'approbation de ces vaccins. Au lieu d'effectuer des ECR à grande échelle, on a surtout utilisé des données sur des souris, comme pour l'approbation des rappels bivalents. Même les ECR réalisés sur le BNT162b2 et le mRNA1273 ont été réanalysés par des chercheurs indépendants (Fraiman et al) et se sont révélés sans bénéfice (Bardosh et al).
Byram Bridle explique comment la commercialisation sélective du score de réduction du risque relatif de Pfizers constituait une violation de la politique de la FDA. Pourtant, elle a été accueillie par un tonnerre d'applaudissements.
Les premiers vaccins qui ciblaient la protéine de pointe Wuhan-1 n'ont jamais fourni de contrôle de qualité du séquençage de l'ADN lot par lot. Ils n'ont jamais fourni la moindre preuve de la fidélité transcriptionnelle ou traductionnelle de ces pro-médicaments. Ceci est de la plus haute importance car les vaccins incorporent un nucléotide sujet aux erreurs connu sous le nom de N1-méthyl-pseudouridine (m1Ψ) dont on sait qu'il augmente le taux d'erreurs de transcription à 250-300/Million ou 1 erreur tous les 4 000 nucléotides (Chen et al). Cela se traduit par une erreur dans chaque molécule de vaccin synthétisée et 14-34 trillions sont injectés avec Pfizer et Moderna respectivement. Si les essais sur une seule molécule (séquençage de Pacific Biosciences) utilisés pour estimer ce taux d'erreur se manifestent dans des études humaines réelles, il s'agit d'un degré de complexité extraordinaire.
Pour aggraver les choses, l'impact de cette base sur la fidélité du ribosome est inconnu, mais les tentatives publiées de modéliser l'impact des pseudouridines (et non du N1-méthyl-pseudoU ou m1Ψ) sur la fidélité ont montré des augmentations substantielles du décalage du cadre ribosomal, de l'ablation des codons stop et des erreurs de traduction (Fernandez et al). Une étude qui a tenté, sans succès, de remettre en cause ces résultats est présentée ici.
Le laboratoire d'Andrew Fire a séquencé les premiers vaccins mais n'a jamais divulgué les données brutes de séquençage. Ces données sont nécessaires pour répondre aux préoccupations concernant les taux d'erreurs de transcription et les hétéroplasmies.
Il n'existe aucune donnée de séquençage publique pour les nouveaux vaccins bivalents administrés aux enfants. Selon les CDC, plus de 50 millions de vaccins bivalents ont été administrés à ce jour.
Pfizer prévoit de fortes ventes pendant 3 ans.
Comme il existe peu de données publiques sur l'AQ/CQ de ces vaccins bivalents, nous avons cherché à contrôler de manière indépendante l'intégrité de l'ARN des vaccins bivalents Pfizer et Moderna. Les flacons d'échantillons ont été purifiés et évalués par électrophorèse. Des bibliothèques ARN-seq directionnelles ont été construites et séquencées sur des séquenceurs Illumina.
Des documents de l'EMA datant d'août 2022 existent pour le vaccin bivalent de Pfizer. Ces documents indiquent que des données NGS (Next Generation Sequencing) existent mais n'ont pas été fournies à l'EMA. L'EMA a également noté que seuls des Western Blots étaient disponibles pour la caractérisation du produit traduit et que les bandes ne correspondaient pas aux tailles prévues.
Méthodes
Images et numéros de lot des flacons de vaccin. Les flacons Pfizer proviennent du même lot. Les lots de Moderna sont différents.
Méthodes
Purification de l'ARNm à partir des LNP.
100ul de chaque flacon ont été échantillonnés (1/3 à 1/5ème d'une dose)
- 5ul de LiDs 2% ont été ajoutés à 100ul de Vaccin pour dissoudre les LNPs
- 100ul d'isopropanol à 100
- 233ul d'Ampure (Beckman Genomics)
- 25ul de MgCl2 25mM (New England Biolabs)
Les échantillons ont été mélangés 10 fois et incubés pendant 5 minutes pour la fixation des billes magnétiques.
Les billes magnétiques ont été séparées sur une plaque magnétique à 96 puits pendant 10 minutes et lavées deux fois avec 200ul d'EtOH à 80%.
Les billes ont été laissées sécher à l'air libre pendant 3 minutes et éluées dans 100 µl de ddH20. Deux litres de l'échantillon élué ont été analysés sur une station à bande Agilent.
Construction de la bibliothèque
50ul de chaque échantillon de 100ul ont été convertis en librairies ARN-Seq pour le séquençage Illumina en utilisant le kit de librairies ARN directionnelles NEB NEBNext UltraII pour Illumina (NEB#E7760S).
Afin d'enrichir les bibliothèques d'inserts plus longs, le temps de fragmentation a été réduit de 15 à 10 minutes et le temps de synthèse du premier brin a été prolongé à 42C jusqu'à 50 minutes, conformément aux recommandations du protocole concernant les inserts longs.
Aucune déplétion Ribo ou enrichissement PolyA n'a été effectuée afin de fournir l'évaluation la plus impartiale de tous les fragments de la bibliothèque. La bibliothèque a été amplifiée pendant 16 cycles conformément au protocole du fabricant. Une méthode de construction de bibliothèque directionnelle a été utilisée pour évaluer la nature simple brin de l'ARNm. Il s'agit d'une mesure de qualité importante dans les documents d'information de l'EMA et de la TGA car les ARNdb (>0,5 %) peuvent induire une réponse immunitaire innée. La teneur en ARNdb est souvent estimée à l'aide d'un ELISA. Le séquençage directionnel de l'ADN offre une méthode plus complète pour son estimation et a été mesuré précédemment et 99,99% dans Jeong et al. On ne sait pas comment cela peut varier d'un lot à l'autre ou dans le nouveau processus de fabrication des nouveaux vaccins bivalents.
Résultats
La figure 1 présente l'analyse des fragments de chaque flacon. La fragmentation de l'ARN est évidente dans les deux marques et tous les lots, mais elle est particulièrement notable dans les flacons Pfizer. De manière surprenante, des produits ARNm plus longs que la longueur prévue de l'ARNm ont également été observés dans les vaccins bivalents.
Figure 1. Electrophorèse à la station à bande Agilent des vaccins bivalents. Moderna mRNA-1273.214 (en haut) et du vaccin bivalent Pfizer (en bas).
Ces fragments plus longs sont notés dans Patel et al. avec les vaccins monovalents.
La première étape de la création de bibliothèques ARN-Seq consiste à fragmenter ces ARNm et à les convertir en ADN.
La méthode de construction de bibliothèques "directionnelles" est décrite ici. Les librairies directionnelles garantissent que la connaissance du brin (brin de watson vs brin de crick) est capturée et, par conséquent, on peut mieux estimer la contamination d'ADN ou d'ARN double brin dans la synthèse de l'ARNm du vaccin.
L'étape de synthèse du premier brin peut introduire une erreur supplémentaire en fonction de la sensibilité de la transcriptase inverse au m1Ψ. La synthèse commence avec une transcriptase inverse (RT polymérase) et des amorces aléatoires (5'NNNNNN-3'OH). Une fois que ces amorces aléatoires s'hybrident à l'ARN, l'enzyme RT incorpore le nucléotide qui correspond le mieux à la matrice. Ces gabarits ont une base connue pour perturber la fidélité de l'appariement des bases (m1Ψ).
Après la synthèse du premier brin, il y a une synthèse éphémère du second brin d'ADN qui incorpore une base "effaçable" par voie enzymatique (Uracil à base d'ADN). Cela facilite la ligature des adaptateurs de séquençage double brin aux molécules d'ADNdb. Après la ligature de l'adaptateur, ce second brin est effacé à l'aide d'UDG/UNG ou d'une enzyme USER de New England BioLabs.
Il est à noter que cette enzyme USER digère les uraciles à base d'ADN, et non les uraciles à base d'ARN. Par conséquent, seul le premier brin de synthèse est utilisé comme modèle pour la PCR de la bibliothèque. Comme les erreurs de polymérase basées sur la PCR sont un ordre de grandeur moins fréquent (1:100 000) que les erreurs de la transcriptase inverse (1:10 000), nous devrions voir des erreurs provenant principalement de la synthèse du premier brin qui tente de répliquer une matrice d'ARN m1Ψ. Le résultat final de cette approche aura principalement 2 modes d'erreur.
1) L'ARN polymérase T7 est utilisée pour synthétiser des vaccins ARNm à partir d'un vecteur d'expression basé sur l'ADN. L'ARN polymérase T7 aura une erreur d'incorporation accrue avec le m1Ψ.
2) Erreur de transcription inverse lors de la transformation de l'ARNm modifié du vaccin m1Ψ en ADN pour le séquençage Illumina.
La figure 2 illustre la taille finale des bibliothèques produites par ces méthodes. Ces résultats ne reflètent pas le processus de fabrication de l'un ou l'autre fournisseur de vaccins, mais sont les résultats attendus d'un kit basé sur l'ARN-Seq.
Figure 2. Bibliothèques Illumina après 16 cycles de PCR. Les bibliothèques peuvent probablement être obtenues avec 12 cycles de PCR, car la distribution bimodale des amplicons est un signe d'une trop grande quantité d'ADN d'entrée dans la PCR de la bibliothèque. Le regroupement d'Illumina favorisera les amplicons plus courts, mais un nombre plus élevé de lectures mal appariées peut résulter d'une amplification bimodale.
Pipeline d'analyse
Les lectures ont été démultiplexées et traitées avec
- Trimgalore - Supprime les adaptateurs de séquençage d'Illumina.
- Megahit- assemble les lectures en contigs.
- Megahit pour SRAs-CoV-2
- Samtools- génère des fichiers BAM pour la visualisation dans IGV.
- BWA-mem- mappeur de lecture courte utilisé pour aligner les lectures sur les références assemblées.
- Logiciel SnapGene- (www.snapgene.com)- Utilisé pour visualiser et annoter les vecteurs d'expression.
- IGV- Integrated Genome Viewer utilisé pour visualiser les lectures de séquençage d'Illumina.
Résultats du séquençage
Étant donné que ces cibles d'ARNm sont si petites (4Kb), elles peuvent être dotées d'un code-barres ADN et s'intégrer facilement dans n'importe quel cycle de séquençage. Les voies du HiSeq 4000 d'Illumina produisent habituellement plus de 300M de lectures de 150bp par voie. 0,5 % de ces lectures (1,5 million de lectures) produit ~225 Mo de séquence sur un fragment de 4 Ko. Une couverture de 50 000X sur un fragment de 4Kb est une barre d'erreur sur la sortie des séquenceurs actuels, soulignant le caractère abordable du séquençage de chaque lot. Le prix de liste pour 300M lectures de nombreux centres de service de séquençage est ~$1300. Le coût du séquençage de ces échantillons était de 7 $ par flacon et n'utilisait qu'un tiers d'une dose (100ul). Les coûts de construction de la bibliothèque ont peut-être ajouté 50 $ de dépenses supplémentaires.
Deux vecteurs d'expression différents sont présents dans les vaccins bivalents Moderna. Deux lots différents ont été séquencés et il se peut que chaque lot contienne des plasmides d'expression différents. Notez que, puisque ces vaccins ont des inserts bivalents, l'assembleur divise souvent les inserts en contigs séparés (omicron vs wuhan-1). J'ai inclus le fichier de sortie complet de megahit pour permettre au public de polir davantage ces références. Ces ébauches d'assemblages ont été laissées sous une forme brute fournie directement par megahit pour permettre la reproduction du travail.
Il est intéressant de noter que la séquence de ce vecteur vaccinal Moderna présente une séquence identique à 99,8 % à celle des plasmides découverts dans des échantillons de Pseudomonas aeruginosa, qui ont fait l'objet d'une édition célèbre du NCBI après que la séquence de la protéine spike y ait été identifiée. À l'époque, il y avait un débat sain sur la question de savoir si ces plasmides resteraient à un nombre élevé de copies dans leur hôte sans aucune pression sélective antibiotique. La profondeur de la couverture des plasmides contenant la protéine spike était 10 fois inférieure à celle des lectures du génome de Pseudomonas, alors que d'autres plasmides natifs de Pseudomonas avaient une couverture 50 fois supérieure à celle du génome de Pseudomonas. Cela m'a conduit à penser que ce plasmide en pointe était plus probablement un événement de contamination au cours du processus de séquençage, car les plasmides à forte copie devraient avoir un nombre de copies plus élevé que leurs génomes hôtes, comme en témoignent les plasmides de pseudomonas natifs présents dans l'assemblage. Cela reste un débat non résolu.
Je ne m'étais pas demandé si les patients de cette étude sur les pseudomonas avaient été vaccinés avec un vaccin contenant de grandes quantités de plasmides d'expression contaminants. Combien de temps ces plasmides se répliquent-ils dans les systèmes mammaliens sans sélection Neo ou Kan ? Ces patients ont-ils déjà été traités avec de tels antibiotiques en raison de leur infection à pseudomonas ? Cette sélection aurait-elle fonctionné étant donné que de nombreux pseudomonas sont déjà nativement résistants à Neo et Kan ? Le manque de transparence publique sur ces produits sans responsabilité laisse de nombreuses questions.
Vecteur d'expression Pfizer blasté sur le plasmide spike de Pseudomonas aeruginosa.
L'EMA a fixé des limites pour la contamination par l'ADNdb à moins de 330ng/mg d'ARN. Cela correspond à environ 1 partie pour 3 030 molécules d'ARNm. La manière dont elle a fixé ces normes n'est pas claire. Par exemple, une injection contenant 34 trillions d'ARNm avec un taux de contamination plasmidique de 1 partie pour 3 000 équivaudrait à plus de 10 milliards de plasmides résistants aux antibiotiques transfectés par patient. Les preuves de séquençage dont nous disposons maintenant confirment que la majeure partie de cet ADN est en fait l'ADN du plasmide d'expression, avec la protéine spike, les promoteurs d'expression mammalienne SV40, la résistance aux antibiotiques aminoglycosides et les origines de réplication à forte copie qui sont compatibles avec l'expression mammalienne et l'amplification bactérienne.
On peut estimer rapidement le rapport relatif entre le vecteur et les acides nucléiques insérés en examinant la profondeur maximale de couverture de l'insert par rapport au vecteur. Le flacon Moderna 2 a une couverture maximale de 739X sur le vecteur et de 2,2 millions de X sur l'insert. Cela équivaut à un vecteur pour 3 000 ARNm.
Figure 10. Analyse de la profondeur de lecture du flacon Moderna 2 pour les séquences du vecteur et de l'insert.
Les flacons Pfizer présentent un taux de contamination supérieur d'un ordre de grandeur. Ceci est cohérent avec l'analyse des fragments qui présente plus de pics hors cible.
Comme cette méthode permet de mesurer à la fois l'ADN et l'ARN, ces estimations doivent être confirmées par une qPCR utilisant la DNase et les RNases pour affiner le rapport. Maintenant que la séquence de l'acide nucléique contaminant est publiée ci-dessus, ces tests peuvent être construits et utilisés pour surveiller la contamination de lot en lot.
Il est possible de prendre les informations sur les brins dans les données de séquençage et de discerner quelles parties de l'assemblage sont composées de brins de Watson et de brins de Crick (ADN) et quelles parties contiennent principalement des brins de Crick (brins sens ou ARNm). Vous pouvez voir que cette analyse identifie le promoteur T7 à la base 2200 dans le vecteur Moderna vial 1. Il s'agit d'une preuve sans équivoque que la séquence du vecteur contaminant est de l'ADN double brin et non de l'ARN.
Figure 12. Analyse de la profondeur de lecture Watson vs Crick. Lorsque la couverture du brin Crick moins la couverture du brin Watson = 0, vous avez de l'ADN. Lorsqu'elle est déséquilibrée, on a principalement de l'ARNm du brin sens.
Ce qui n'est pas indiqué dans les documents de l'EMA, c'est l'efficacité de la linéarisation de ce plasmide, qui peut contribuer à limiter sa capacité à s'amplifier dans l'hôte. Il existe de nombreux plasmides amplifiables linéaires et cela ne garantit en aucun cas une élimination plus rapide du plasmide, mais des méthodes devraient être décrites pour vérifier l'efficacité et l'achèvement de cette étape du processus de fabrication du vaccin.
Les lectures en paires dans cette étude peuvent aider à répondre à cette question car l'assembleur que nous avons utilisé n'était pas programmé pour évaluer la circularité des contigs.
Figure 13. Les directives de l'EMA concernant les gabarits d'ADN résiduel ne sont pas respectées avec la contamination observée dans les flacons Pfizer séquencés.
Erreur de transcription
Les données de séquençage dépassent une couverture de 1 million de X sur les ARNm. Les hachures verticales colorées dans les lectures horizontales grises (capture d'écran IGV ci-dessous) sont des erreurs. Ces erreurs peuvent être le résultat de plusieurs facteurs.
1) Les erreurs d'incorporation de la polymérase T7 lors de la synthèse de l'ARNm du vaccin à partir des plasmides d'expression qui contaminent ces vaccins. Comme cette étape utilise le nucléotide m1Ψ, sujet à des erreurs, les erreurs de transcription devraient augmenter de 200 à 300 % (Chen et al).
2)Transcriptase inverse utilisée pour transformer cet ARNm modifié en ADN pour le séquençage Illumina. Ces enzymes RT sont connues pour être sujettes à des erreurs (10^-4). Leur taux d'erreur augmente probablement avec l'utilisation du m1Ψ comme modèle.
3) Erreur de PCR et de séquençage. Ces erreurs peuvent être détectées et traitées en éliminant les lectures en double, les doublons optiques et en filtrant la qualité de la date de séquençage.
Il sera intéressant de surveiller les erreurs de séquençage dans le squelette d'ADN plasmidique par rapport aux erreurs de séquençage observées dans la protéine de pointe, car cela permettrait de résoudre la source de l'erreur. Le squelette plasmidique est répliqué plus fidèlement en tant qu'ADN et n'a jamais été dérivé de modèles m1Ψ. L'ARNm, lui, sera passé par 2 étapes de polymérase avec un nucléotide de basse fidélité (m1Ψ). Une comparaison des taux d'erreur dans le squelette du plasmide par rapport aux taux d'erreur dans la région transcrite du plasmide permettrait de détailler l'erreur induite par l'utilisation d'un nucléotide sujet à erreur.
Étant donné la grande profondeur de la couverture, les travaux futurs se concentreront sur le filtrage Q30 (1 erreur par 10^3) de toutes les lectures pour éliminer les erreurs qui pourraient être introduites par le séquenceur et réévaluer si l'erreur de transcription peut être détectée sans les UMI...