Enkeltmolekyle realtidssekventering eller SMRT er en ny generation af DNA-sekventeringsmetode udviklet af Pacific Biosciences .
Ideen med metoden er at bestemme DNA-sekvensen ved at overvåge arbejdet i et enkelt DNA-polymerasemolekyle i realtid. Samtidig fuldender DNA-polymerase den anden streng af DNA- molekylet under undersøgelse ved at bruge nukleotider mærket med forskellige fluorescerende mærker ; ved at registrere mærkedataene er det muligt at forstå, hvilket nukleotid DNA-polymerasen aktuelt indsætter.
Arrangementet af sekventører af denne type gør det muligt at observere, på niveauet af et enkelt molekyle, syntesen af den komplementære streng af et enkeltstrenget DNA-molekyle ved hjælp af et molekyle DNA-polymerase. I denne teknologi tillader fluorescerende mærkede nukleotider og højopløsnings konfokal mikroskopi realtids- og samtidig sekvenssekvensering for mange polymeraser [1] .
ZMWMetoden er baseret på brugen af Zero-mode waveguide (ZMW) - fordybninger adskillige titusvis af nanometer i diameter , til bunden af hvilken et enkelt DNA-polymerase-molekyle er knyttet. Lys føres gennem bunden ind i ZMW-cellen. ZMW-cellens designfunktion tillader ikke lysbølgen at forplante sig og efterlader kun et volumen på omkring 20 zeptoliter (20 × 10 -21 liter) nær bunden af cellen oplyst. Dette gør det muligt at observere fluorescensen af et enkelt fluorescerende mærke, der er knyttet til nukleotidet, der i øjeblikket er indsat af DNA-polymerasen. Derfor sys forskellige fluorescerende mærker til de fire typer nukleotider, hvilket gør det muligt at skelne dem. Som et resultat heraf er det under polymerisationen af en DNA-kæde med et enzym fikseret i ZMW muligt at opnå afhængigheden af fluorescensintensiteten på tid, ud fra grafen af hvilken DNA-sekvensen bestemmes ud fra toppene af et andet spektrum [ 1] .
Ved sekventering anvendes såkaldte SMRT-celler , indeholdende omkring 150.000 ZMW-celler, som er fordybninger i en aluminiumsfilm aflejret på et siliciumsubstrat [2] .
NukleotiderDenne metode anvender mærker ( fluoroforer ) knyttet til nukleotidets terminale fosfatgruppe . Et sådant mærke har mindre effekt på driften af DNA-polymerase, hvilket er ekstremt vigtigt for sekventering i realtid. I processen med at tilføje et nukleotid til den voksende DNA-streng spaltes mærket af DNA-polymerase sammen med pyrophosphat . Som et resultat kan fluoroforen diffundere ud af det observerede volumen og ikke længere påvirke det registrerede signal, og nukleotidet integreres i DNA-kæden uden "makeweights". Ved at måle en langvarig (millisekund) glød af én farve, når et mærket nukleotid er bundet af en polymerase mod en baggrund på hurtigt diffuserende (mikrosekunder) fire, er det således muligt at bestemme sekvensen af DNA-skabelonkæden [1] .
Enkeltmolekyle-realtidssekventeringsmetoden gør det muligt at opnå meget lange aflæsninger (DNA-sekvenser) (i gennemsnit ca. 20.000 nukleotider, op til 60.000 nukleotider), hvilket letter yderligere dataanalyse og undgår en række problemer, der opstår under arbejdet med korte læsninger. Det virker uden forudgående amplifikation af det DNA, der undersøges, ved hjælp af PCR . Denne metode giver en høj sekventeringshastighed (i teorien er den kun begrænset af hastigheden af DNA-polymerasen) [1] . Metoden er kendetegnet ved høj sensitivitet og specificitet: muligheden for at påvise mindre varianter i blandede prøver med en forekomstfrekvens på mindre end 0,1 %. Det muliggør også high fidelity-sekventering. I øjeblikket er den ikke særlig høj (83 %), men nøjagtigheden kan forbedres ved gentagen sekventering af DNA-molekylet (> 99 % ved 15 gentagelser) [3] [4] .
Ulemperne ved metoden omfatter de høje omkostninger ved enheden - $ 600.000 [5] . Det er karakteriseret ved et relativt højt niveau af fejl på grund af skæringspunktet mellem fluoroforernes emissionsspektre. Derudover fører tilfældig binding af polymeraser til bunden af ZMW-cellen til en Poisson-fordeling af antallet af enzymer pr. celle [1] .
Længden af enkelt-molekyle real-time sekventeringslæsninger er sammenlignelig med eller større end i Sanger-metoden , som gør det muligt at sekventere de novo genomer og forenkler deres samling [1] . Lange læsninger giver den kontekst, der er nødvendig for korrekt at lokalisere gentagelsespositioner i genomet. Evnen til at opnå lange strækninger af DNA under sekventering er også vigtig for metagenomics : det er muligt at identificere organismer i blandede populationer - for eksempel i mikrobiomet . Da der kræves færre læsninger af de samme regioner for at samle genomet, kræver dechifrering af genomet ved denne metode mindre indsats. Enkeltmolekyle realtidssekventering er blevet demonstreret på de novo genomsekventering i undersøgelser, der analyserer det tyske tarminfektionsudbrud i 2011 og 2010 koleraepidemien i Haiti [6] [7] .
"Tredje generations" sekventeringsteknologi, kombineret med ældre metoder, kan øge nøjagtigheden af genomsamling. Andengenerations- sekventører er i stand til at læse genomet i små fragmenter på 100-700 basepar, men sådanne aflæsninger er så svære at sammensætte i den rigtige rækkefølge. "Tredje generations" instrumenter (især Pacific Biosciences' PacBio RS) kan generere læsninger på op til 23 kb, men lave flere fejl end normal genomisk analysesoftware kan håndtere. I 2011 brugte forskere fra National Biodefense Analysis and Countermeasures Center ( USA ) korte læsninger opnået under sekventering på andengenerations Illumina og Roche 454 instrumenter til at rette fejl i lange læsninger genereret af PacBio RS sequencer. Efter at have testet den udviklede algoritme på genomerne af bakterien Escherichia coli og gær , samt på majs - transkriptomet , fandt forskerne ud af, at samlingsnøjagtigheden kan øges fra 83 til 99,9%. Forskerne anvendte også den udviklede hybridjusteringsmetode til samlingen af et tidligere usekventeret undulatgenom [8] .
I 2012 blev en hybrid tilgang brugt til at samle genomet af kolera - stammen , der forårsagede Haiti-epidemien i 2010 . Regioner af bakteriegenomet, der er vigtige for behandlingen af sygdommen, er blevet indsamlet med en nøjagtighed på over 99,9 % [9] .
Det samme DNA-molekyle kan sekventeres uafhængigt ved hjælp af en cirkulær DNA-skabelon og et enzym, der adskiller den nyligt syntetiserede DNA-streng fra skabelonen. Dette er vigtigt for analyse og diagnosticering af forskellige sygdomme. Ved at sammenligne millioner og milliarder af læsninger med den originale tekst, kan du få en komplet liste over forskellene mellem det undersøgte genom og "guldstandarden" . Desuden, hvis hvert bogstav i kildeteksten verificeres ved flere læsninger, øger dette den statistiske signifikans af de fundne genetiske træk og anomalier [10] .
Forskere fra Pacific Biosciences brugte sammen med specialister fra andre organisationer denne tilgang til at underbygge hypotesen om en aktiverende tandemduplikation af FLT3 som et terapeutisk mål ved akut myelogen leukæmi [10] . Denne teknologi er også velegnet til transkriptomanalyse og splejsning , da en enkelt lang læsning fra en sequencer kan indeholde et helt mRNA . Enkeltmolekyle realtidssekventering tillader detektion af enkeltnukleotidpolymorfismer med høj nøjagtighed [11] .
Kinetikken af polymerisationsreaktionen under sekventering gør det muligt at bestemme epigenetiske vigtige DNA-modifikationer . I realtidssekventering med et enkelt molekyle bedømmes tilstedeværelsen af methylerede nukleotider ud fra ændringen i perioden indtil næste flash, da methylering påvirker polymerasens aktivitet. Denne metode bruges allerede til at bestemme methyladenin , methylcytosin samt 5-hydroxymethylcytosin [12] [13] [14] . I 2012 brugte en gruppe videnskabsmænd denne tilgang til at analysere den komplette methyleringsprofil af 6 bakterier [15] .
Ved at bruge revers transkriptase i stedet for DNA-polymerase tillader SMRT-teknologi RNA- sekventering . På denne måde er det muligt samtidigt at detektere sekvensen, basemodifikationer, permutationer, der påvirker RNA-strukturen. Kinetikken af revers transkription er også følsom over for den sekundære struktur af RNA, hvilket øger sandsynligheden for lange pauser eller afslutning under reaktionen. Desuden gør SMRT-sekventering det muligt at detektere dynamikken i RNA-genfoldning, for eksempel under revers transkription af retrovira eller under mRNA-nedbrydning af exosomer [16] .
Pacific Biosciences|Pacific Biosciences kommercialiserede SMRT-sekventering i 2011 [17] efter at have udgivet en anden opsætning i slutningen af 2010 [18] .
I april 2013 udgav virksomheden en ny version af sequenceren kaldet "PacBio RS II", som har højere gennemløb og tillader længere DNA-aflæsninger [19] [20] .
SMRT-chipprototypen indeholdt ~3000 ZMW-celler til parallel DNA-sekventering. I 2012 blev SMRT-celler skabt, som hver indeholdt omkring 150.000 ZMW-celler [21] .
Et nyt sæt reagenser frigivet i 2012 gjorde det muligt at øge længden af aflæsningen [22] . I øjeblikket er den gennemsnitlige læselængde omkring 40.000 bp. s., maksimum - 100.000 n. n [23] .