Les technologies de séquençage du génome humain - 3

Publié le 10 août 2012 et mis à jour le 7 février 2013 - 4 commentaires -
PDF Afficher une version imprimable de cet article
   

Dans l’épisode pré­cé­dent de notre série esti­vale, nous avons décor­ti­qué le pro­ces­sus qui pré­cède le séquen­çage de l’ADN et toutes les étapes de pré­pa­ra­tion. Avec la sélec­tion des cel­lules, leur pré­pa­ra­tion pour en extraire les longues molé­cules d’ADN, leur pré-découpage pour sim­pli­fier le pro­ces­sus du séquen­çage et leur mul­ti­pli­ca­tion avec la PCR pour aug­men­ter la taille de l’échantillon dis­po­nible pour le séquen­çage. La plu­part de ces étapes pré­cèdent le séquen­çage mais nous ver­rons que cer­taines méthodes per­mettent de sim­pli­fier le pro­ces­sus en évitant notam­ment la PCR.

Nous pas­sons main­te­nant au cœur du sujet, le séquen­çage, sachant que nous allons à la fois expli­quer les basiques du séquen­çage avec les prin­ci­pales méthodes uti­li­sées et aussi nous attar­der sur les der­nières géné­ra­tions de séquen­ceurs mas­si­ve­ment parallèles.

Les tech­no­lo­gies de séquen­çage ont été créées au milieu des années 1970 et ont été conti­nuel­le­ment amé­lio­rées depuis. Au départ, le pro­ces­sus de séquen­çage, popu­la­risé par la méthode de San­ger que nous allons décrire était lent et géné­ra­teur d’erreurs. Les tech­niques et machines qui sont appa­rues depuis ont à la fois auto­ma­tisé le pro­ces­sus, apporté des variantes, paral­lé­lisé le séquen­çage et réduit les erreurs. Résul­tat, alors qu’il a fallu plu­sieurs années et des cen­taines de mil­lions de dol­lars pour pro­cé­der au pre­mier séquen­çage géné­rique du génome humain en 2000, on peut obte­nir le même résul­tat en moins d’une jour­née et pour quelques mil­liers de dol­lars, l’objectif étant de des­cendre rapi­de­ment en des­sous de $100 par génome.

Cout sequencage ADN

Un concours a ainsi été lancé qui rap­pelle les belles heures de l’aviation, le Archon Geno­mics Xprize. $10m récom­pen­se­ront l’équipe qui créera un appa­reil per­met­tant de séquen­cer 100 génomes humains de cen­te­naires en moins de dix jours et pour moins de $1000 par per­sonne. L’idée est de décou­vrir les gènes qui pro­tè­ge­raient de cer­taines mala­dies et assu­re­raient la lon­gé­vité humaine. Ce prix est lancé par la XPrize Foun­da­tion, une asso­cia­tion non lucra­tive amé­ri­caine qui a dans son board des per­son­na­li­tés aussi diverses que Larry Page (Google), Ray Kurz­weil (entre autres, confon­da­teur de la Sin­gu­la­rity Uni­ver­sity), Ariana Huf­fing­ton, le réa­li­sa­teur James Came­ron, le bio­lo­giste Craig Ven­ter, l’astronaute d’origine ira­nienne Anou­sheh Ansari, Ratan Tata (du groupe indien Tata) et Will Wright, le chief desi­gner offi­cer d’Electronics Arts. Le prix est spon­so­risé par Express Scripts, une société de ser­vices dans la santé aux USA. L’une des socié­tés à par­ti­ci­per à ce concours est Ion Tor­rent dont nous décri­rons plus loin la machine, celle-là même qui avait attiré mon atten­tion lors du CES 2012 !

Mais avant d’en venir là, il faut remon­ter aux sources et notam­ment à l’une des pre­mières méthodes de séquençage…

Méthode de Sanger

La méthode de séquen­çage de l’ADN déve­lop­pée par Fre­de­rick San­ger au milieu des années 1970 a été la plus répan­due pen­dant près d’une ving­taine d’année. Elle concur­ren­çait au départ celle de Maxam et Gibert créée en 1976-1977. Cette der­nière s’est rapi­de­ment éclip­sée car elle s’appuyait sur des pro­duits toxiques et sur la meure de radio­ac­ti­vité. Mais les prin­cipes étaient voi­sins d’un point de vue concep­tuel et on les retrouve jusqu’à aujourd’hui dans cer­taines tech­no­lo­gies de séquen­çage mas­si­ve­ment parallèles.

San­ger est l’un des quatre scien­ti­fiques a avoir gagné deux prix Nobel dans l’histoire. Ici, il s’agissait du prix Nobel de chi­mie : l’un en 1958 pour la décou­verte en 1951 de la séquence d’acides ami­nés qui consti­tue la molé­cule d’insuline (bovine) et l’autre en 1980 pour le pro­cédé de séquen­çage qui porte son nom, inventé en 1977.

Amor­çage

Le séquen­çage s’applique à un brin d’ADN de taille moyenne, de quelques cen­taines de bases, qui a été obtenu par dif­fé­rentes méthodes. On uti­lise cou­ram­ment la PCR que nous avons décrite dans l’article pré­cé­dent de cette série, qui est la méthode la plus récente et qui per­met de démul­ti­plier plu­sieurs dizaines de mil­lions de fois un petit échan­tillon de brin d’ADN, lui-même généré par une extrac­tion d’un ADN com­plet avec une enzyme de res­tric­tion. Mais on peut aussi uti­li­ser d’autres méthodes comme le clo­nage de brins d’ADN avec des vec­teurs de clo­nage divers comme l’ADN du bac­té­rio­phage M13.

Comme pour la PCR, on com­mence par déna­tu­rer par la cha­leur (sépa­rer les deux brins) d’un échan­tillon d’ADN en solu­tion. L’autre brin d’ADN résul­tant de la déna­tu­ra­tion n’est pas uti­lisé. Le brin d’ADN doit être en quan­tité suf­fi­sante, à savoir que l’on en dis­pose de plu­sieurs dizaines de mil­lions. La quan­tité est ren­due néces­saire par le moyen de détec­tion des séquences de base uti­lisé dans la méthode. On ajoute au brin une amorce de 18 bases et quelques qui ne fonc­tionne que dans un sens (dit “mon­tant”) en s’accrochant au bout des brins d’ADN à répli­quer et qui ser­vira de point de départ pour la copie du reste du brin. L’amorce est le “néga­tif” au niveau des bases du début du brin d’ADN à répli­quer. Dans la PCR, on uti­lise des amorces “mon­tantes” et “des­cen­dantes” pour répli­quer les deux brins d’ADN dénaturé.

Methode Sanger Amorcage

Poly­mé­ri­sa­tion

C’est la réac­tion chi­mique la plus impor­tante du pro­ces­sus : elle per­met le clo­nage par­tiel du brin d’ADN à qui on a ajouté son amorce.

La poly­mé­ri­sa­tion s’appuie sur l’emploi d’une ADN poly­mé­rase qui assemble des nucléo­tides au brin à com­plé­ter. Ces nucléo­tides sont des molé­cules dNTP ou désoxy­ri­bo­nu­cléo­tides qui asso­cient une des quatre bases de l’ADN (d’où les appel­la­tions dATP, dTTP, dCTP et dGTP), un sucre (pen­tose) et un tri­phos­phate. Ces dNTP s’associent aux nucléo­tides com­plé­men­taires du brin d’ADN à séquen­cer sous l’effet de l’ADN poly­mé­rase. On appelle cette phase du pro­ces­sus la SBS, “Sequen­cing by Syn­the­sis”. Elle uti­li­sée dans tout un tas de méthodes dif­fé­rentes de séquençage.

Methode Sanger Polymerisation

Fin de polymérisation

La méthode consiste à arrê­ter cette réac­tion de poly­mé­ri­sa­tion à chaque posi­tion de nucléo­tide dans le brin. On uti­lise pour cela des molé­cules ddNTP ou didé­soxy­ri­bo­nu­cléo­tides (ddATP, ddTTP, ddCTP, ddGTP). Ces nucléo­tides bloquent la poly­mé­ri­sa­tion de l’ADN du fait d’une liai­son OH qui est rem­pla­cée par une liai­son H par rap­port aux nucléo­tides équi­va­lentes. La liai­son OH s’associe au pre­mier P (phos­phore) du dNTP sui­vant lors de la poly­mé­ri­sa­tion. Dans le O, pas de poly­mé­ri­sa­tion. On met beau­coup moins de ddNTP que de dNTP pour que la poly­mé­ri­sa­tion se pour­suivre tant que faire ce peut. On contrôle aussi sa vitesse avec la température.

Methode de Sanger dNTP et ddNTP

Les ddNTP sont mar­qués par “fluo­res­cence” pour que l’on puisse les détec­ter plus loin dans le pro­ces­sus. Le label fluo­res­cent est du S-35 thio­phos­phate, ou 35S-dATP, qui s’associe aux ddNTP du côté des phos­phates sans empê­cher la liai­son OH-P d’opérer avec le dNTP pré­cé­dant dans le pro­ces­sus de poly­mé­ri­sa­tion. La pro­por­tion ddNTP sur dNTP est géné­ra­le­ment de 1%.

Dans ce pro­ces­sus, la poly­mé­ri­sa­tion dure une quin­zaine de minutes.

Déna­tu­ra­tion

Une fois encore, on va pro­cé­der par chauf­fage pour sépa­rer les brins d’ADN répli­qués et les répli­cats par­tiels obte­nus par poly­mé­ri­sa­tion que l’on sou­haite conser­ver. Il reste dans la solu­tion une soupe avec : nos brins d’ADN néga­tifs non répli­qués, les brins entiers répli­qués, le reli­cat de dNTP et de ddNTP ainsi que l’ADN poly­mé­rase sans comp­ter les reli­quats de phos­phores issus de la poly­mé­ri­sa­tion (les dNTP libèrent un pyro­phos­phate lors de la poly­mé­ri­sa­tion, cf le schéma pré­cé­dent, ce pyro­phos­phate ne sert à rien ici, mais on l’utilise dans le pyro­sé­quen­çage dont nous par­le­rons plus loin).

On se retrouve avec une soupe dont des brins d’ADN syn­thé­ti­sés avec une extré­mité fluo­res­cente qu’il va fal­loir trier par taille pour recons­ti­tuer leur séquence de bases (A, T, C, G). Mais aupa­ra­vant, on aura éliminé par trai­te­ment chi­miques divers les rési­dus cités ci-dessus.

Methode Sanger Denaturation

Tri sur gel

Dans la méthode de San­ger, on pro­cède géné­ra­le­ment au tri avec une élec­tro­pho­rèse sur une solu­tion conte­nant 1% de gel d’agarose (extrait de l’agar-agar, déjà évoqué dans cet article…). Il se trouve que les molé­cules d’ADN sont char­gées néga­ti­ve­ment et en fonc­tion de leur lon­gueur. On applique une ten­sion élec­trique conti­nue dans une solu­tion conte­nant ce gel d’agarose et à plat sur un filtre en nylon. La ten­sion va faire migrer les molé­cules d’ADN vers le + au niveau des phos­phates et en fonc­tion de leur taille, le tout  à 50°C. Les petites vont aller le plus loin. Le gel d’agarose est une sorte d’amortisseur ou de régu­la­teur de ce pro­ces­sus de migration.

Les molé­cules les plus courtes cor­res­pon­dront aux bases qui étaient proches de l’amorce (pri­mer) du pro­ces­sus. Le gel d’agarose est asso­cié à dif­fé­rentes autres molé­cules dont de l’urée qui évite que les molé­cules d’ADN se replient sur elles-mêmes. Une fois la migra­tion ter­mi­née, on va fixer l’ensemble par ultraviolet.

Les molé­cules fluo­res­centes de ddNTP ne sont pas visibles à l’œil nu. On va les révé­ler à l’aide d’un laser qui va les exci­ter et les faire émettre de la lumière dans une cou­leur dif­fé­rente. Une caméra enre­gistre alors l’ensemble du gel.

Un gel fait quelques dizaines de cen­ti­mètres de lon­gueur et per­met d’identifier quelques cen­taines de bases. C’est lié à la réso­lu­tion du papier ! D’où le fait que la méthode de San­ger est assez lente. Cette phase d’électrophorèse sur gel dure plu­sieurs heures ! Elle a bien été uti­li­sée pour séquen­cer dif­fé­rents bac­té­ries et cel­lules ainsi que l’ADN humain dans le Human Genome Pro­ject, mais a alors néces­sité beau­coup de temps et de machines. Il a aussi fallu auto­ma­ti­ser au maxi­mum toutes les étapes de ce processus.

Methode de Sanger Lecture

Dans les années 1980/90, on uti­li­sait quatre pré­pa­ra­tions, une avec chaque type de ddNTP car si on savait les mar­quer par radio­ac­ti­vité ou par fluo­res­cence, on ne savait pas les dis­tin­guer. Le tri des brins d’ADN syn­thé­ti­sés se fai­sait donc en quatre par­ties, une par base. Depuis, on uti­lise des mar­queurs fluo­res­cents dis­tincts pour cha­cun des quatre ddNTP et ils sont acti­vés par laser. Ce qui per­met de ne faire la poly­mé­ri­sa­tion que dans un seul « bain » avec l’ensemble des ddNTP mélan­gés. La lec­ture sur gel se fait sur une seule colonne “en cou­leur” et en géné­ral avec une caméra moto­ri­sée qui se déplace le long du gel.

Lecture gel fluorescent sequencage ADN

Dans la pra­tique, on obtient en fait une courbe qui asso­cie le conti­nuum de lumi­no­sité sur les quatre cou­leurs ana­ly­sées dans la fluo­res­cence. On en déduit la suc­ces­sion de bases. Mais le pro­ces­sus est enta­ché d’erreurs et on les élimine en fai­sant plu­sieurs mesures redon­dantes et avec une ana­lyse sta­tis­tique (la base la plus fré­quente gagne en cas de doute).

DNA sequence

Dans les séquen­ceurs auto­ma­tiques de seconde géné­ra­tion, on a rem­placé l’électrophorèse sur gel par une élec­tro­pho­rèse capil­laire dans un tube extrê­me­ment fin. Le résul­tat est bien plus rapide et per­met de lire jusqu’à un mil­lier de séquences de bases. Ce pro­cédé appelé HPLC (high-performance liquid chro­ma­to­gra­phy, ou high-pressure lc) uti­lise en lieu et place du filtre plat de gel d’agarose un tube très fin de 4 mm de dia­mètre qui met sous pres­sion le liquide à analyser.

HPLC process

Le liquide sort à l’autre extré­mité du tube et est ana­lysé par un chro­ma­to­graphe uti­li­sant des LED. le pro­cédé est amé­lioré avec la UHPLC (Ultra-High Per­for­mance Liquid Chro­ma­to­gra­phy). Voici quelques exemples de sys­tèmes de HPLC et UHPLC, sachant que leur usage dépasse de loin le séquen­çage d’ADN. La spec­tro­gra­phie en phase liquide a plein d’applications dans la santé et la chi­mie. On peut l’utiliser pour iden­ti­fier les com­po­sants chi­miques d’un ali­ment indus­triel, mesu­rer divers niveaux de toxi­cité, etc.

HPLC systems

Voilà pour la méthode de San­ger et ses évolutions.

Pas­sons main­te­nant aux autres méthodes et tech­no­lo­gies de séquen­çage appa­rues ces dix der­nières années, dans un rythme d’innovation qui s’est sans cesse accé­léré au point d’aller plus vite que la fameuse loi de Moore en termes de capa­cité de traitement.

Où sont les variantes ? De plu­sieurs ordres :

  • La syn­thèse ana­ly­sée en temps réel : au lieu de blo­quer la syn­thèse aléa­toi­re­ment à la hau­teur de n’importe quelle base comme dans la méthode de San­ger, un grand nombre de nou­velles méthodes vont gérer la syn­thèse base par base de manière contrô­lée et ana­ly­ser le résul­tat au fur et à mesure, d’où l’appellation “temps réel”. On retrouve notam­ment ce prin­cipe dans le pyro­sé­quen­çage et le séquen­çage par ter­mi­na­teur réver­sible On iden­ti­fie les bases inté­grées par fluo­res­cence ou des rési­dus de cette inté­gra­tion, les pyro­phos­phates (avec la méthode 454, par fluo­res­cence) ou les ions hydro­gène (avec la méthode de Ion Torrent).
  • La syn­thèse réa­li­sée en temps réel : variante des méthodes pré­cé­dentes, il s’agit de syn­thèse réa­li­sée à la même vitesse que dans le vivant et obser­vée au fur et à mesure par dif­fé­rents moyens (fluo­res­cence ou cap­ta­tion élec­trique). On trouve des méthodes de ce genre chez Paci­fic Bios­ciences et Bio­Nano Genomics.
  • Le besoin d’amplification ou pas : cer­taines méthodes impliquent l’amplification des brins d’ADN avant le séquen­çage, d’autres non, comme le SMRT de Paci­fic Bios­cience. D’où un gain de temps.
  • Le séquen­çage paral­lèle : au lieu de séquen­cer un brin unique d’ADN, on va en créer un grand nombre sous la forme d’une “biblio­thèque” (DNA library)  généré par “shot­gun” (frag­men­ta­tion aléa­toire d’ADN en petits brins de quelques cen­taines de bases) et les ana­ly­ser en paral­lèle. Le tout s’appuie sur des matrices avec des nano-cuves ou des plaques de verre dans ou sur les­quelles on isole cha­cune des réac­tions de trans­crip­tion contrôlée.
  • Les domaines d’applications : tous les sys­tèmes de séquen­çage ne sont pas dédiés au séquen­çage com­plet du génome humain. Ce domaine d’application est d’ailleurs rela­ti­ve­ment mar­gi­nal. Cer­taines appli­ca­tions visent à détec­ter le poly­mor­phisme dans l’ADN, à savoir les varia­tions par rap­port à une car­to­gra­phie de réfé­rence. On cherche à mesu­rer les varia­tions dans les gènes liées aux dif­fé­rents allèles (zones codantes des gènes qui varient d’un indi­vidu à l’autre) tout comme le pro­ces­sus d’expression des gènes qui contrôle la manière dont les gènes génèrent les pro­téines via tout le pro­ces­sus de trans­for­ma­tion qui com­prend notam­ment l’ARN mes­sa­ger, l’ARN de trans­fert ainsi que les ribosomes.

Côté per­for­mances, les don­nées clés sont le nombre de bases séquen­cées par heure, la taille moyenne des brins d’ADN séquen­cés d’une seule traite et le pour­cen­tage d’erreurs de séquen­çage. Mais on peut y inté­grer égale­ment le nombre d’agents et de sol­vants néces­saires dans le pro­ces­sus. Et in-fine, le cout d’ensemble des opé­ra­tions, de la machine aux consom­mables. Sachant que tout cela pro­gresse plus vite que la loi de Moore, il est assez dif­fi­cile de com­pa­rer clai­re­ment les tech­no­lo­gies en présence.

Séquen­çage par ter­mi­na­teur réver­sible (Illu­mina, Helicos)

Le séquen­çage par ter­mi­na­teur réver­sible (ou CRT pour Cyclic Rever­sible Ter­mi­na­tion) est com­mer­cia­lisé par Illu­mina sous l’appellation Tru­Seq dans ses machines HiSeq et aussi dans une autre variante chez Helicos.

Dans cette méthode, on séquence l’ADN par poly­mé­ri­sa­tion avec des dNTPs mar­qués par fluo­res­cence en mode quatre cou­leurs (une par type de base) et un ter­mi­na­teur qui arrête la poly­mé­ri­sa­tion. Après chaque ajout d’une base, on détecte laquelle a été ajou­tée par un cap­teur d’image cou­leur de plu­sieurs mil­lions de pixels (Illu­mina, où on ajoute toutes les bases d’un coup) ou noir et blanc (Heli­cos BioS­ciences, où l’on ajoute les bases une par une).

On enlève ensuite aux ultra-violets le ter­mi­na­teur de la der­nière base ajou­tée, du nitro­phé­nyl, qui bloque la liai­son OH qui per­met l’enchainement des bases (cf le schéma plus haut dans cet article qui explique com­ment fonc­tionne cette liai­son OH). On peut alors pro­cé­der à l’ajout de la base sui­vante. C’est donc un séquen­çage dit temps-réel comme ceux que nous ver­rons plus loin. Le temps de séquen­çage pour une base est envi­ron de 2 minutes.

Ces étapes sont réa­li­sées sur une plaque de verre et de manière paral­lèle avec des mil­lions de brins d’ADN étalés des­sus (pour faire simple) dont la pré­pa­ra­tion à par­tir d’un échan­tillon d’ADN dure envi­ron trois heures. La tech­no­lo­gie per­met de séquen­cer 10 mil­lions de brins d’ADN par cen­ti­mètre carré. La machine la plus récente, la HiSeq 2500 (ci-dessous) peut ana­ly­ser 120 giga­bases en 27 heures, aux­quelles il faut ajou­ter 20h de trai­te­ment infor­ma­tique. Le taux d’erreurs de lec­ture semble rela­ti­ve­ment élevé, de plu­sieurs %, mais il est com­pensé par la redon­dance de celles-ci. Ainsi, un run de 120 Gbases correspond-il à 40 fois le nombre de base d’un ADN humain.

hiseqs-2500-1500-banner

On trouve aussi cette tech­no­lo­gie de ter­mi­na­teur réver­sible (CRT :  Cyclic Rever­sible Ter­mi­na­tor) chez Laser­Gen (Hous­ton, $5m levés). La star­tup planche avec Natio­nal Ins­tru­ments sur un sys­tème qui exploite un autre type de ter­mi­na­teur réver­sible. Ils visent le séquen­çage d’une giga­base par jour ce qui n’a rien d’extraordinaire sauf si le pro­ces­sus est lui-même hau­te­ment parallélisé.

Pyro­sé­quen­çage (Roche/454, Qiagen, …)

Le pyro­sé­quen­çage uti­lise une méthode de séquen­çage créée en 1988 par Hyman et per­fec­tion­née ensuite entre 1996 et 1998 par l’intégration de la PCR dans le pro­ces­sus. Elle est dif­fé­rente du séquen­çage sauce San­ger. Nous l’examinons ici même si son domaine d’application concerne plu­tôt les courtes séquences d’ADN ou d’ARN et n’est pas spé­cia­le­ment adapté au séquen­çage com­plet du génome humain. Mais cer­taines tech­niques de séquen­çage mas­si­ve­ment paral­lèles s’appuient sur le prin­cipe du pyroséquençage.

Comme dans la méthode de San­ger ou la PCR, on part aussi d’un brin d’ADN préa­la­ble­ment sélec­tionné et com­plété par une amorce et on lance une poly­mé­ri­sa­tion avec de l’ADN poly­mé­rase et des nucléo­tides dNTP. Par contre, on ne va pas arrê­ter cette poly­mé­ri­sa­tion avec l’emploi de ddNTP mar­qués par fluo­res­cence qui la stoppent de manière aléa­toire dans la méthode de Sanger.

On va au contraire en pro­vo­quer une seule en ali­men­tant suc­ces­si­ve­ment le “bain” avec les quatre nucléo­tides et on va détec­ter celle qui va s’accrocher au brin d’ADN en cours de poly­mé­ri­sa­tion. Pour cela, on va uti­li­ser un résidu de cette poly­mé­ri­sa­tion : le pyro­phos­phate (PPi, molé­cule à deux phos­phates) qui se détache des dNTP lorsque le reste (1 base, 1 ribose et 1 phos­phate) s’intègre au brin d’ADN en cours de construc­tion. Le pyro­phos­phate a donné son nom à la tech­nique… du pyro­sé­quen­çage. Pour­quoi pyro ? Parce que les pyro­pho­states sont pré­pa­rés indus­triel­le­ment  en chauf­fant des phosphates.

Pour chaque base syn­thé­ti­sée, il y aura donc un déga­ge­ment de PPi. On va alors  le conver­tir en déga­ge­ment de lumière après une triple réac­tion chi­mique contrô­lée qui passe par les étapes suivantes :

Principe pyrosequencage

  • Un ATP sul­fu­ry­lase trans­forme la molé­cule de PPi en ATP en géné­rant un résidu de SO2 (sul­fure). L’ATP ou adé­no­sise tri­phos­phate sert sinon au trans­port de l’énergie dans les cel­lules. C’est une molé­cule qui se dif­fé­ren­tie de la dATP (l’une des quatre dNTP qui sert à la syn­thèse de l’ADN) par un atome d’oxygène en moins à l’extrémité du tri­phos­phate et par un grou­pe­ment OH en plus sur le ribose.

ATP et dATP

  • La molé­cule d’ATP géné­rée va elle-même conver­tir de la luci­fé­rine en oxy­lu­ci­fé­rine à l’aide d’une luci­fé­rase ce qui va géné­rer de la lumière que l’on va détec­ter avec une caméra CCD.
  • Une apy­rase va dégra­der les dNTP qui n’ont pas été uti­li­sés tout comme les rési­dus d’ATP. Et on peut recom­men­cer le cycle. Sachant que l’on pour­rait en prin­cipe pas­ser à la base sui­vante de la poly­mé­ri­sa­tion sans pas­ser par toutes les bases une fois qu’on a détecté la bonne et avoir en moyenne 2,5 dNTP à tes­ter par base à séquen­cer. Mais il ne semble pas que ce soit le cas, his­toire d’être plus rigou­reux d’un point de vue sta­tis­tique. Le pyro­sé­quen­çage pré­sente en l’effet de géné­rer beau­coup moins d’erreurs pour le séquen­çage que la méthode de Sanger.

A la fin de ce pro­ces­sus, un autre dNTP est ajouté pour pas­ser à la base sui­vante dans la syn­thèse. Sachant que la réac­tion n’a donc lieu sta­tis­ti­que­ment qu’une fois sur quatre, lorsque l’on a injecté la base qui cor­res­pond à celle qui man­quait dans la chaine d’ADN en cours de poly­mé­ri­sa­tion (ou copie). Si il y a plu­sieurs bases du même type qui se suivent dans l’ADN à poly­mé­ri­ser, plu­sieurs dNTP du même type seront inté­grés par l’ADN à poly­mé­ri­ser et l’émission de lumière sera mul­ti­pliée d’autant.

Voici un exemple de pyro­sé­quen­ceur : le Pyro­Mark Q96 MD Auto­ma­ted de l’allemand Qua­gen (ci-dessus) qui auto­ma­tise comme son nom l’indique toutes les étapes de ce pro­ces­sus répé­ti­tif. Il peut trai­ter en paral­lèle 10 échan­tillons iden­ti­fiés par un code barre.

PyroMArk Q96MD

Mais c’est tech­no­lo­gie “454”, datant de 2005, qui est la plus avan­cée dans l’usage du pyro­sé­quen­çage. Elle a été créée par la société amé­ri­caine 454 Life Science qui a été acquise par le groupe suisse Roche en 2007. Elle per­met de séquen­cer envi­ron un demi-milliard de base en 23 heures grâce à du pyro­sé­quen­çage paral­lèle. Le séquen­ceur asso­cié le plus élaboré est le GS FLX Tita­nium XL+(ci-dessous).

gs-flx-diagram

Le pro­cédé 454 fonc­tionne en trois étapes clés :

  • L’ADN à séquen­cer est d’abord déna­turé et puis frag­menté aléa­toi­re­ment en petits brins de quelques cen­taines de bases aux­quels on adjoint des liga­teurs aux deux extré­mi­tés sur les­quels vont s’accrocher les amorces du séquen­çage. Cette opé­ra­tion est réa­li­sée par “nébu­li­sa­tion”, un pro­cédé consis­tant à souf­fler un cou­rant d’air sur un petit flux de liquide un peu com­ment on vapo­rise l’essence dans l’injecteur du pis­ton d’un moteur à explo­sion. On obtient des brins d’ADN dont la taille moyenne est de 500 à 700 bases. Mais avec une répar­ti­tion qui va de 100 à 1000. Comme d’habitude, ceci ne s’effectue pas sans pré­pa­ra­tion. L’échantillon d’ADN à nébu­li­ser doit être pré­paré : avec un mélange d’eau, de gly­cé­rol, de gel d’agarose (encore lui), du gly­co­gène, de l’éthanol et d’isopropanol. Le résul­tat : des cen­taines de mil­liers de brins d’ADN simples qui vont main­te­nant jusqu’à 1000 bases, le tout à basse tem­pé­ra­ture. Cette par­tie du pro­ces­sus dure plus de 4 heures.
  • Les frag­ments sont atta­chés un par un à une micro­bille de poly­sty­rène entou­rée de strep­ta­vi­din, une pro­téine com­plexe qui résiste bien aux divers sol­vants uti­li­sés dans la suite des opé­ra­tion. L’association est réa­li­sée dans une émul­sion eau-lipide qui est ensuite fixée dans une “micro-cuve” de 44 microns de large sur un sup­port appelé Pico­Ti­ter­Plate. Ce sup­port contient 1000000 micro-cuves. On en déduit que c’est un carré de 4,4 cm de côté, ce qui est com­pa­tible avec l’illustration ci-dessus.
  • Le frag­ment d’ADN est alors ampli­fié par emPCR (vue dans l’épisode pré­cé­dent) autour de la bille. Ce pro­ces­sus dure 8 heures à 23 heures selon la machine uti­li­sée et la taille moyenne des brins d’ADN séquencés.

MicroTiterPlate

  • Enfin, le pyro­sé­quen­çage base par base est lancé en paral­lèle dans cha­cune des micro­cuves du sys­tème à par­tir d’un sys­tème de micro­flui­dique qui ali­mente le Micro­Ti­ter­Plate avec les quatre nucléo­tides (sépa­ré­ment) et les dif­fé­rents agents de l’opération. La micro-cuve est cou­plée à un grand cap­teur CCD qui per­met la lec­ture des résul­tats. C’est la taille du cap­teur qui semble limi­ter le nombre de bases qui peuvent être lues en paral­lèle dans cette machine. En consul­tant le site de Dalsa, l’un des fabri­cants des plus grands cap­teurs CCD et CMOS, on constate que leur plus grand cap­teur fait 50mmx50mm, donc peut cou­vrir la sur­face en appa­rence rec­tan­gu­laire du Micro­Ti­ter­Plate. Les pixels de ce CCD font 24 microns de côté, ce qui cor­res­pond à peu près à la moi­tié de l’espacement entre les micro­cuves. Ces cap­teurs sont mono­chromes car on n’a besoin de détec­ter qu’une émis­sion de lumière et pas sa cou­leur. Ces cap­teurs sont d’ailleurs aussi uti­li­sés en radio­gra­phie, elle aussi noir et blanc. Cela veut donc dire que si c’est le cap­teur ou le type de cap­teur que la machine uti­lise, quatre pixels du CCD suf­fisent à détec­ter la réac­tion lumi­neuse du pyro­sé­quen­çage. A moins que le cap­teur ne soit plus petit et qu’une simple optique ne réduise l’image des deux plaques du pyro­sé­quen­çage. Ceci étant, on trouve de plus grands cap­teurs, comme chez Agilent dont le Titan fait 165 mm de côté, mais 2Kx2K pixels !

Le pro­ces­sus de pyro­sé­quen­çage dure 23 heures ce qui veut dire que pour une moyenne affi­chée de 700 bases par séquen­çage, la machine est capable de géné­rer un cycle com­plet de détec­tion d’une base en envi­ron 2 minutes, ce qui cor­res­pond aux 2 minutes habi­tuelles du pyro­sé­quen­çage clas­sique. Une bonne règle de trois per­met tou­jours de faire quelques vérifications !

Alors, on lit 700 mil­lions de bases en une passe, donc on peut séquen­cer le génome humain en 5 passes sachant que celui-ci com­prend 3 mil­liards de bases dans sa forme haploide, c’est-à-dire non dupli­quée ? Non, pas si simple ! Un bon séquen­çage de génome néces­site d’avoir beau­coup de redon­dance. On génère habi­tuel­le­ment 20 à 30 fois plus de séquences que n’en contient un génome. Après, un logi­ciel recons­truit le génome par recou­pe­ment entre les séquences obte­nues. La redon­dance per­met à la fois le recou­pe­ment et de détec­ter et sup­pri­mer les erreurs de séquen­çage qui sub­sistent dans tous les pro­cé­dés. Dans le pro­cédé 545, il y a 1% d’erreurs dans le séquençage !

La suite…

Ce petit tour est loin d’être ter­miné. Dans l’article sui­vant de cette série, nous abor­de­rons d’autres tech­no­lo­gies de séquen­çage dites de seconde et troi­sième géné­ra­tion, et dont cer­taines sont vrai­ment fascinantes.

Publié le 10 août 2012 et mis à jour le 7 février 2013 Post de | Photo numérique, Santé | 7230 lectures

PDF Afficher une version imprimable de cet article          

Les 4 commentaires et tweets sur “Les technologies de séquençage du génome humain - 3” :

  • [1] - (@crea_entreprise) (@crea_entreprise) a écrit sur Twitter le 10 août 2012 :

    Les tech­no­lo­gies de séquen­çage du génome humain - 3 http://t.co/6QBjAiqd #inno­va­tion: Les tech­no­lo­gies de séquen… http://t.co/o19eKwRz

  • [2] - patrick a écrit le 14 août 2012 :

    Suis impres­sionné par le tra­vail mis dans cette review. Bravo.
    Quelques petites erreurs:

    le Pyro­Mark Q96 MD Auto­ma­ted du japo­nais Qua­gen
    Qia­gen est une société alle­mande, ins­tal­lée par­tout ds le monde.

    Une plus grosse erreur:

    Dans les séquen­ceurs auto­ma­tiques de seconde géné­ra­tion, on a rem­placé l’électrophorèse sur gel par une chro­ma­to­gra­phie en phase liquide

    Non, l’electrophorèse capil­laire a rem­placé les tech­niques en gel plat.
    Le prin­cipe reste une elec­tro­pho­rèse, mais celle-si est réa­li­sée dans un tube de verre de qques microns de dia­mètre, qui ren­ferme un gel liquide, renou­vellé à chaque nvelle ana­lyse). Cela a per­mis de pas­ser au sequen­cage vrai­ment auto­ma­tique. Injec­tion du gel auto­ma­tique, injec­tion de l’échantillon auto­ma­tique, et mul­ti­plexage (8 capil­laires chez Beck­man Coul­ter, 96 chez Applied Bio­Sys­tems, et jusqu’à 384 me semble-t-il chez Amersham/GE).

    C’est amu­sant, je ne sais pas d’où vient cette idée de chro­mato en phase liquide. J’ai eu expé­ri­menté la chro­mato auto­ma­tique pour puri­fier des plas­mides, mais ces auto­mates n’ont jamais été uti­lisé en séquencage.

  • [3] - patrick a écrit le 14 août 2012 :

    Pour la suite de ta review, un article que j’ai écris en Nov 2009 qui lis­tait déjà plus d’une 20aine de star­tups impli­quées dans la concep­tion des séquen­ceurs dits de nouvelle-nouvelle génération:

    Nou­velles géné­ra­tions de séquen­çeurs d’ADN : tech­no­lo­gies, mar­ché et pers­pec­tives https://www.box.net/shared/1aela8ppqz

    • [3.1] - Olivier Ezratty a répondu le 14 août 2012 :

      Merci Patrick pour ces com­plé­ments d’information très utiles. J’ai cor­rigé le point sur Qia­gen et sur l’électrophorèse capil­laire. J’avais mal com­pris ce que j’avais lu. Il me sem­blait que les tubes per­met­taient de cap­ter la cou­leur des mar­queurs. J’ai extra­polé cela sous forme de chro­mato, qui n’en est effec­ti­ve­ment pas une.




Ajouter un commentaire

Vous pouvez utiliser ces tags dans vos commentaires :<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> , sachant qu'une prévisualisation de votre commentaire est disponible en bas de page après le captcha.

Captcha

Pour valider votre commentaire, veuillez saisir les lettres ci-dessus et cliquer sur le bouton Publier le commentaire ci-dessus.


7,230 views

Derniers articles

Tout, tout, tout sur la high-tech

Le Rapport du CES 2013 est disponible sous forme de livre, publié aux Editions Kawa dans la collection "Tout, tout" dirigée par Henri Kaufman ! Utilisez le code promo OLIVIER pour bénéficier de 10% de réduction !
image

Quelques Femmes du Numérique

Avec Marie-Anne Magnac, j'ai lancé #QFDN, l'exposition photo des femmes du numérique. Installée depuis le 16 octobre 2012 à l'espace Soleilles Cowork de Paris, elle a aussi été présentée et sera présentée dans différentes manifestations. Et je continue régulièrement à enrichir les 200 portraits initiaux de l'opération !
image

Cocktail Orange France lors de la Conférence LeWeb 2012 le 8 décembre 2012. Conférence annuelle des anciennes de l'ESCP organisée au siège du MEDEF le 17 janvier 2013. Conférence La journée de la femme Digitale organisée par Catherine Barba et Delphine Rémy-Boutang le 8 mars 2013. Conférence Osons la France le 5 avril 2013, à l’Espace Cardin. MipTV au Palais des Festivals de Cannes des 8 au 11 avril 2013. Au Web2Day, organisé à Nantes les 16 et 17 mai 2013. A Futur en Seine, organisé en Ile de France par le pôle de compétitivité Cap Digital, dans le cadre du Village des Innovations au 104 à Paris, du 13 au 16 juin 2013. Dans la conférence USIevents, organisée par la SSII Octo et destinée aux DSI, les 24 et 25 juin 2013 au Palais Brongniard.

Derniers commentaires

“Il parait que les bonnes entreprises innovantes sont toujours sur le fil rouge....”
“Je lis ce guide depuis 2011, c'est LA mine d'or des startuper en herbe, et des plus aguerris ! Un grand merci à Olivier Ezratty et tous les experts qui ont contribué à cette 17 ème édition ! A bientôt, Yanis K....”
“Non, position différente des acteurs. Apple est un "problème" dans le rapport. Un grand américain qu'il faut juguler/réguler et qui pourrait/devrait contribuer au financement de la culture, même si les yeux sont plu...”
“Merci de ces éclarcissements à travers cet article très bien rédigé et qui résume les grandes lignes du rapport Lescure notamment. Oui Michel Nizon, votre constat met en lumière la french -don't- touch !...”
“Blog très didactique de @olivez sur les composants optoélectroniques @BellLabs @Alcatel_Lucent...”


Abonnement email

Pour recevoir par email les alertes de parution de nouveaux articles :


 


Téléchargements gratuits

Ces documents sont diffusés gratuitement (sous Creative Commons) et en PDF. Le Guide des Startups, mis à jour environ deux fois par an :
image

Le Rapport du Consummer Electronic Show de Las Vegas, publié chaque année en janvier depuis 2006 :
CouvertureRapportCES

Les clivages de la présidentielle 2012 sur le numérique :
CouvertureClivagesNumeriques

Voir aussi la liste complète des publications de ce blog.

Catégories

Tags


Evénements

image

Les articles sur toutes les éditions de LeWeb depuis 2006.

Voyages

Voici les compte-rendu de divers voyages d'études où j'ai notamment pu découvrir les écosystèmes d'innovation dans le numérique de ces différents pays : Chine (2010) à Shanghai et Beijing Corée du Sud (2009) à Séoul Israël (2010) à Tel Aviv Japon (2009) à Tokyo Japon (2011) au CEATEC de Tokyo Japon (2012) au CEATEC de Tokyo Silicon Valley (2007) Silicon Valley (2011)