Exome- sekventering er sekventeringen af alle proteinkodende gener i genomet ( dvs. exome ) . Exome-sekventering refererer til to operationer: for det første exon -selektion . Afhængigt af organismen dækker exoner 1-2 % af genomet [1] . Hos mennesker er der omkring 180.000 af dem, cirka 1% af det samlede genom , eller cirka 30 millioner basepar (bp). For det andet, exon- sekventering ved hjælp af en hvilken som helst højgennemløbssekventeringsplatformDNA og analyse af de opnåede resultater [2] .
Exome-sekventering gør det muligt at opdage genetiske ændringer, der fører til ændringer i proteinsekvenser, som igen kan føre til sygdomme som åreforkalkning , Alzheimers sygdom og andre. Den største fordel ved exome-sekventering er evnen til at udføre massescreening af gener og detektere mutationer forbundet med sygdomme, mens denne procedure er enklere og billigere end helgenom-sekventering [1] .
Exome-sekventering omfatter fire trin: DNA-ekstraktion fra det leverede materiale, udvælgelse af DNA- fraktionen af interesse (prøveberigelse), sekventering af det udvalgte materiale og analyse af de opnåede resultater [3] .
Det første trin er at fremstille genomiske DNA- præparater af høj kvalitet fra de leverede prøver ved at adskille DNA'et fra proteiner , lipider osv. Standardmetoden til DNA-isolering er ekstraktion med en blanding af phenol-chloroform [4] .
Prøveberigelsesstrategier tillader selektiv selektion af ønskede genomiske regioner, dvs. exoner, fra DNA-prøver før sekventeringstrinnet. Siden beskrivelsen af den første originale metode i 2005 er der udviklet adskillige prøveberigelsesstrategier, der er egnede til exome-sekventeringsformål [5] . Valget af en specifik metode afhænger af størrelsen af regionerne af interesse, behovet for sekventeringsdækning, det tilgængelige udstyr og andre årsager [6] .
Polymerase kædereaktionPolymerasekædereaktion (PCR) har været meget brugt til at amplificere de nødvendige DNA-fragmenter i mere end 20 år [7] . Normalt bruges der kun 2 primere i PCR , men der er udviklet multiplekse PCR- metoder PCR-tilgange er meget effektive, men tillader ikke arbejde med genomregioner på flere millioner bp lange. på grund af den høje pris og lave kvalitet af de resulterende prøver [1] .
Molekylær inversion metodeDen molekylære inversionsmetode er en teknik, der gør det muligt at opnå DNA-prøver beriget med amplificerede omvendte regioner af målsekvenser . Udvælgelsen af de ønskede sekvenser sker på grund af lukningen af interesseområdet i ringen. Primeren her er et enkeltstrenget DNA- oligonukleotid , hvori den centrale del indeholder en universel sekvens med restriktionssteder , og enderne er komplementære til to sektioner af genomisk DNA, mellem hvilke sekvensen af interesse er. Ikke-reagerede prøver forbliver lineære og fjernes med exonukleaser [5] [8] . Metoden kan være nyttig til at arbejde med et lille antal mål i et stort antal prøver. Den største ulempe er ensartetheden af de opnåede prøver, såvel som den høje pris, hvis det er nødvendigt, for at dække et stort sæt områder [7] .
HybridiseringsberigelseTil hybridiseringsberigelse af prøver med exome-regioner skabes specielle mikroarrays indeholdende enkeltstrengede oligonukleotider ( prober ) fikseret på et substrat med sekvenser fra genomet, der kan dække regionerne af interesse. Genomisk DNA skæres i fragmenter. Enderne af fragmenterne gøres stumpe med restriktionsenzymer , adaptere med universelle primere tilsættes . Efter hybridisering af fragmenter med prober på mikroarrays vaskes uhybridiserede fragmenter fra substratet, og de resterende amplificeres derefter ved hjælp af PCR [5] . Metodens begrænsninger er relateret til de høje omkostninger ved udstyret, antallet af prober, der kan placeres på matrixen, og behovet for tilstrækkeligt store mængder DNA til analyse [1] .
Berigelse i opløsningEt sæt prober syntetiseres i opløsningen, som er fikseret på streptavidinkugler . Perlerne placeres i en opløsning med fragmenteret genomisk DNA, hvor der sker selektiv hybridisering af proberne med de ønskede genomiske regioner, hvorefter perlerne med fragmenterne af interesse udfældes og vaskes. De resterende sektioner sekvenseres derefter. Denne metode blev udviklet for at forbedre hybridiseringsberigelsesmetoden: den giver dig mulighed for at skabe et overskud af prober til målsteder sammenlignet med den nødvendige mængde prøve. Den optimale størrelse af mål-DNA-regionen er omkring 3,5 millioner bp, så efterfølgende sekventering resulterer i god dækning [7] .
Platforme brugt til exome berigelseDe vigtigste udbydere af exome-berigelsesplatforme er NimbleGen , Agilent og Illumina [1] .
Sammenligning af karakteristika for hver af de mest almindelige exomberigelsesplatforme [1]NimbleGens SeqCap EZ Exome-bibliotek | Agilent's Sure Select Human All Exon Kit | Illuminas TruSeq Exome Enrichment Kit | Illuminas Nextera Rapid Capture Exome Kit | |
---|---|---|---|---|
Sondens længde | 55 - 105 [9] | 114 - 126 [9] | 95 | 95 |
Anbefalet mængde af DNA-prøve | 3 μg [10] | 3 μg [10] | 500 ng [10] | 50 ng [10] |
Nukleinsyretype af probe | DNA | RNA | DNA | DNA |
Sondedækningsstrategi for et fragment af interesse | Overlappende sonder [9] | Oftere strengt sekventielle sonder end overlappende | Huller mellem probesekvenser (prober er i nogen afstand fra hinanden langs fragmentsekvensen) | Huller mellem probesekvenser |
fragmenteringsmetode | Ultralyd | Ultralyd | Ultralyd | transposase |
Målfragmentstørrelse (menneske) | 64 | halvtreds | 62 | 62 |
Læser resterende efter filtrering | 66 % | 71,7 % | 54,8 % [11] | 40,1 % |
Hovedstyrker | Høj sensitivitet og specificitet. Mest ensartet dækning i vanskelige områder [9] [12] [13] . | God dækning af indels [9] [13] [11] . Høj nivelleringshastighed . Færre genlæsninger end andre platforme [13] . | God dækning af uoversatte regioner og miRNA'er [9] | God dækning af uoversatte regioner og miRNA'er |
Vigtigste svagheder | Flere genlæsninger end Agilent. Langsommere nivelleringshastighed. | Færre kvalitetslæsninger end NimbleGen [12] | Højt niveau af umålrettet berigelse [9] | Højt niveau af umålrettet berigelse. Offset dækning for områder med højt GC-indhold , hvilket reducerer ensartethed. |
Anvendelser ud over menneskelige sekvenser | Ja | Ja | Ikke | Ikke |
I øjeblikket tilbyder NimbleGen, ud over kits kun for mennesker, kits til majs , byg , hvede , sojabønner , mus og svineeksomer, mens Agilent tilbyder kits til eksomer fra mus , kvæg og zebrafisk . Begge leverandører tilbyder også muligheden for at designe brugerdefinerede sæt til andre arter. Kits til ikke-menneskelige arter bruger protokoller og prober svarende til sælgernes humane kits. Begge producenter tilbyder en fleksibel designproces, der gør det muligt at foretage ændringer for at forbedre dækningen til specifikke regioner og formål [1] .
Der findes flere sekventeringsteknologier, herunder den klassiske Sanger-sekventeringsmetode . Næste generations sekventeringsmetoder bruger Illumina- , SOLiD- og Ion-Torrent- platformene . Alle disse metoder kan også bruges til exome- sekventering [14] .
Primære sekventeringsdata er et stort sæt af små sekvenser (læser), hvis længde og kvalitet afhænger af de tekniske egenskaber af sequenceren og metoden til prøveforberedelse. Kvaliteten af aflæsninger kan styres, for eksempel ved hjælp af FastQC-softwarepakken [15] . De resulterende læsninger filtreres: endeafsnit afskæres, som ofte har et stort antal fejl, adaptersekvenser fjernes (for eksempel ved hjælp af Trimmomatic [16] eller segl [17] ); så rettes fejl (f.eks. ved hjælp af programmerne Blucoo [18] og Lighter [19] ). De filtrerede læsninger kortlægges på genomet, hvor de samles til sekvenser svarende til exoner. I øjeblikket er der mange programmer, der udfører hvert trin af sekventeringsdataforberedelse og analyse, de fleste af dem kræver stor computerkraft , da mængden af modtaget data er meget stor [20] .
Ved hjælp af exome-sekventering kan vi i studier med faste omkostninger sekvensere sekvenser med væsentligt større dækningsdybde sammenlignet med dækningen opnået ved helgenom-sekventeringsmetoder. På grund af dette bruges exome-sekventering oftere til at løse problemer, der kræver pålidelig bestemmelse af enkeltnukleotidpolymorfismer [21] .
Den 29. september 2011 blev Ambry Genetics den første certificerede virksomhed til at tilbyde exome-sekventering og sygdomsdiagnose baseret på det [22] . Virksomheden hævder, at resultaterne af exome-sekventering vil gøre det muligt for medarbejdere at diagnosticere sygdomme, hvor traditionelle diagnostiske tilgange er uanvendelige [23] .
Identifikationen af sygdomsfremkaldende mutationer kan yde et væsentligt bidrag til diagnostiske og terapeutiske tilgange, hjælpe med at forudsige udviklingen af sygdommen og tillade test af slægtninge i risiko [2] [24] [25] [26] [27] [28 ] . Der er flere grunde til, at exome-sekventering foretrækkes frem for monogen analyse: evnen til at identificere mutationer i gener, der ikke er testet på grund af en atypisk klinisk præsentation [28] og identifikation af kliniske tilfælde, hvor mutationer i forskellige gener forårsager forskellige manifestationer i samme patient [24] . Derudover gør metoden det muligt at diagnosticere sygdomme på et tidligt tidspunkt og hos unge patienter, før hele spektret af karakteristiske symptomer viser sig; det bruges også til prænatal diagnose [1] I nogle tilfælde kan prænatal exome-sekventering påvise genetiske sygdomme , mens standardmetoder ( karyotyping og mikroarrays) er ineffektive [29] .
Forfatterne af en skelsættende peer-reviewed publikation om exome-sekventering fremhæver anvendeligheden af denne metode til klinisk praksis. Forfatterne, der brugte exome-sekventering til at identificere mutationen, der forårsager Bartters syndrom og medfødt kloriddiarré , udtaler: "Vi forestiller os en fremtid, hvor sådan information vil blive en del af den rutinemæssige kliniske evaluering af patienter med mistænkte genetiske sygdomme med en uklar diagnose ... Vi forestiller os, at Whole exome sekventering vil yde et kæmpe bidrag til forståelsen af, hvilke gener og på hvilke måder, der er involveret i udviklingen af sjældne og hyppige menneskelige sygdomme, samt i klinisk praksis” [25] .
Kortlægning af sjældne polymorfier i komplekse lidelser og Mendelske sygdommeIgangværende store internationale undersøgelser har til formål at identificere hyppige polymorfier i genomet, der lettest identificeres med moderne metoder. Men på grund af negativ selektion forekommer polymorfier, der forårsager ekstremt alvorlige sygdomme, især Mendelske sygdomme, med en signifikant lavere allelfrekvens og kan forblive uopdaget under søgningen efter kandidatgener ved hjælp af moderne standard genotypemetoder , og oftest de placeret inden for exome. Da et stort antal gener er forbundet med risikoen for sygdom i komplekse lidelser, kræves der meget store prøvestørrelser for at påvise dem, så ud fra et omkostningssynspunkt er helgenomsekventering ikke optimal. Derudover studeres polymorfier i kodende regioner meget detaljeret, og deres funktionelle betydning er lettere at bestemme [30] En succesfuld model til identifikation af mendelske gener involverer identifikation af de novo polymorfier, der opstår ved sekventering af generne af to forældre og en efterkommer [31] .
Plantegenomer kan være ekstremt komplekse , gentagne og ofte polyploide ; som følge heraf kan nogle af de mest økonomisk vigtige afgrøder ikke undersøges ved hjælp af helgenomsekventering. Et kit til berigelse af hvede-exomer baseret på de akkumulerede transkriptomdata [32] blev udviklet , ved hjælp af hvilket undersøgelser blev udført af uønsket intrakulturel genetisk heterogenitet exomet, hvilket påvirker plantefænotypen, især væksthastighed, evne til at lever under forskellige forhold, og andre vigtige for avlsegenskaber . Lignende sæt blev brugt i undersøgelsen af ris Oryza sativa [33] og sojabønne Glycine max [34] . Det er også muligt at identificere genetiske markører , der er ansvarlige for planteafgrøders specifikke resistens over for visse patogener [35] .
I nogle tilfælde kan exome-sekventering bruges som et alternativ til dyrere hele genom-sekventering, for eksempel ved undersøgelse af genetiske variationer inden for og mellem populationer [36] .
Mikroarray-teknikker kræver hybridiseringsprober med en kendt sekvens, så de er begrænset af kravene til probedesign og kan ikke detektere nogle genetiske ændringer. High-throughput sekventeringsteknologier, der anvendes til exome-sekventering, gør det muligt at genkende sekvenserne af et meget større antal loci samtidigt og at identificere hidtil ukendte kilder til mange sygdomme [37] , dvs. de kan omgå begrænsningerne ved genotypechips og klassiske sekventering [38] .
Exome-sekventering er en dyrere procedure, men efterhånden som de økonomiske omkostninger falder og produktiviteten af sekventeringsmetoder øges, bliver denne metode i stigende grad brugt i praksis til diagnosticering af sjældne genetiske sygdomme [39] .
Nogle sygdomme kan være forbundet med mutationer i ikke-kodende regioner eller strukturelle omlejringer, som exome-sekventering ikke vil opdage [2] . Men på grund af de høje omkostninger ved hele genom-sekventering på det nuværende udviklingsstadium af videnskab og teknologi, ser exome-sekventering ud til at være den bedste metode til den kliniske diagnose af sjældne arvelige sygdomme, der ikke detekteres af mikroarrays [25] .
Statistisk analyse af store mængder data under exome-sekventering er en separat tidskrævende opgave. Der er flere tilgange til at forbedre kvaliteten af exome-data [2] :
For nogle biologiske arter er kvaliteten af genomsamlingen og dens annotering meget dårligere end for mennesker (eller der er slet ikke noget sekventeret genom) Dette begrænser betydeligt anvendelsen af exom-sekventering til andre organismer, da det komplicerer berigelsen af DNA-prøver og kortlægningen af sekventeringsresultater til genomet [1] .