Utranslaterede regioner ( NTR , engelsk untranslated regions, UTR ) er specielle mRNA -regioner , der ikke fungerer som skabelon for proteinsyntese og støder på begge sider til den translaterede region (det vil sige den på skabelonen, som proteinet er syntetiseret af) ). Der er to sådanne regioner: 5'-utranslateret region eller 5'- UTR ( eng. 5'-utranslateret region, 5'UTR ) og 3'-utranslateret region eller 3'- UTR ( eng. 3'-utranslateret region , 3' UTR ) placeret ved henholdsvis 5'- og 3'-terminalen af mRNA'et [1] . DNA - segmenterne svarende til 5'-UTR og 3'-UTR af transkriptet har samme navn [2] .
Ikke-oversatte regioner er involveret i reguleringen af lokalisering, translation og nedbrydning af det transkript, hvori de er placeret. De er karakteriseret ved tilstedeværelsen af hårnåle , interne initiatorkodoner og åbne læserammer , ribosombindingssteder , forskellige cis-regulatoriske elementer , der binder til RNA - bindende proteiner [3] . Så de indeholder sådanne elementer som IRES , uORF , ARE [3] , Shine-Dalgarno-sekvensen , riboswitch og andre [4] .
Analyse af genomerne af forskellige organismer viste tilstedeværelsen af en række konservative egenskaber, der er iboende i utranslaterede regioner. Den samlede længde af 5'-UTR er omtrent den samme blandt alle taksonomiske grupper af eukaryoter og varierer fra 100 til 200 nukleotider (i gæren Schizosaccharomyces pombe er længden af 5'-UTR i ste11-transkriptet dog 2273 nukleotider [5] ). Samtidig er længden af 3'-UTR meget mere variabel og kan variere fra 200 nukleotider i planter og nogle dyr til 800 nukleotider hos mennesker og andre hvirveldyr . Påfaldende er det faktum, at længden af både 5'- og 3'-UTR'er varierer betydeligt inden for den samme art : den kan tage en værdi fra 12 til flere tusinde nukleotider [6] . Det er faktisk blevet vist i et in vitro -system, der modellerer pattedyrs genetiske apparat, at selv en 5'-UTR på 1 nukleotid kan give normal translationsinitiering [7] .
En sektion af genomisk DNA svarende til utranslaterede områder af mRNA kan indeholde introner og oftere i 5'-regionen end i 3'-regionen. Omkring 30% af Metazoa -gener har regioner svarende til 5'-UTR, der kun består af exoner , mens 3'-UTR, selvom den er længere, har meget færre introner. Den samlede andel af længden af introner fra den samlede længde i 3'-UTR er 1-11%. Dannelsen af alternative utranslaterede regioner finder sted under anvendelse af forskellige transkriptionsstart-, polyadenylerings- og splejsningssteder . Afhængigt af vævet , udviklingsstadiet , tilstedeværelsen af en sygdomstilstand, kan antallet af alternative ikke-oversatte regioner ændre sig, og de kan signifikant påvirke ekspressionen af visse gener [8] .
Basesammensætningen adskiller sig også i 3'- og 5'-UTR'erne. For eksempel er indholdet af G + C højere i 5'-UTR end i 3'-UTR. Denne forskel er især mærkbar i mRNA fra varmblodede hvirveldyr, hvor indholdet af G+C i 5'-UTR er 60%, og i 3'-UTR er det 45% [6] . Der er også et klart forhold mellem indholdet af G+C i 5'-UTR og 3'-UTR og de tredje positioner i kodonerne i den tilsvarende translaterede region. Der er også fundet en vigtig omvendt sammenhæng mellem G+C indholdet af 5'-UTR og 3'-UTR og deres længder [9] . Det er især kendt, at gener lokaliseret i GC-rige regioner af kromosomer (tunge isochorer) har kortere 5'-UTR'er og 3'-UTR'er end gener lokaliseret i isochorer, der er fattigere i GC. Et lignende forhold er blevet vist for kodende sekvenser og introner [10] .
Endelig blev der i de utranslaterede områder af eukaryotisk mRNA fundet tilstedeværelsen af gentagne sekvenser af forskellige typer, for eksempel SINE'er (inklusive Alu-gentagelser ) og LINE'er , minisatellitter og mikrosatellitter . Hos mennesker er mRNA-gentagelser 12% 5'-UTR og 36% 3'-UTR; i andre taxaer, herunder andre pattedyr , er et lavere indhold af gentagelser blevet vist [3] .
Utranslaterede regioner udfører nøglefunktioner i den post-transkriptionelle regulering af genekspression, herunder modulering af mRNA-transport fra kernen , regulering af intracellulær mRNA-lokalisering [11] , dets stabilitet [12] og translationseffektivitet [13] . Utranslaterede regioner kan også spille en rolle i andre processer, for eksempel i den co -translationelle inklusion af den ikke-standardiserede aminosyre selenocystein ved UGA- kodonet (normalt et stopkodon) af mRNA'er, der koder for selenoproteiner (denne proces involverer en konserveret hårnål placeret i 3'-UTR - SECIS elementet ) [14] . Betydningen af utranslaterede regioner i reguleringen af genekspression bekræftes også af det faktum, at mutationer , der påvirker disse regioner, kan føre til alvorlige patologier [15] (for flere detaljer om sygdomme forårsaget af mutationer i NTR, se nedenfor).
Regulering af utranslaterede mRNA-regioner kan medieres på flere måder. Nukleotidmotiver placeret ved 3'-UTR og 5'-UTR kan interagere med specifikke RNA-bindende proteiner. I modsætning til regulatoriske elementer lokaliseret i DNA, hvor den primære struktur af DNA (det vil sige sekvensen af nukleotider) spiller en ledende rolle, bestemmes den biologiske aktivitet af regulatoriske motiver placeret på RNA af både deres primære og sekundære strukturer . Også nøgleroller i regulering er blevet vist for interaktioner mellem regioner af utranslaterede regioner og specifikke komplementære ikke-kodende RNA'er , især miRNA'er [16] . Endelig kendes eksempler på gentagne elementer, der er vigtige for reguleringen af genekspression på RNA-niveau, for eksempel kan CUG-bindende proteiner interagere med CUG-gentagelser i 5'-UTR af et specifikt mRNA (f.eks. transkriptionsfaktor C/EBPβ) og derved påvirke translationseffektiviteten [17] .
Effektiviteten af mRNA-translation kan være forskellig, derfor er regulering af mængden af det resulterende protein mulig. Dette er en vigtig mekanisme til regulering af genekspression. Faktisk er der kun for udskilte proteiner en klar sammenhæng mellem mængden af mRNA og protein (jo mere mRNA, jo mere protein). I proteiner beregnet til intracellulær brug er dette forhold i høj grad forvrænget af de forskellige translationshastigheder af forskellige mRNA'er [18] .
Strukturelle træk ved 5'-UTR er vigtige for kontrollen af oversættelse. Det er blevet vist, at mRNA'er, der koder for proteiner involveret i udviklingsprocesser, for eksempel vækstfaktorer , transkriptionsfaktorer eller produkter af proto-onkogener (proteiner, der kræver præcis kontrol af ekspression), har en 5'-UTR længere end gennemsnittet [19] , indeholdende initieringskodoner ( engelsk upstream initiation codons ) og åbne læserammer , samt stabile elementer af den sekundære struktur, der forhindrer translationsprocessen (for eksempel quadruplexes ). Andre specifikke motiver og sekundære strukturelementer af 5'-UTR kan modulere effektiviteten af translation [3] .
Normalt, efter at mRNA'et bevæger sig fra kernen til cytoplasmaet , samles eIF4F-proteinkomplekset i cap -regionen placeret ved 5'-enden af mRNA'et. Dette kompleks omfatter 3 underenheder: eIF4E (cap-bindende protein); eIF4A med helicaseaktivitet ; eIF4G interagerer med forskellige andre proteiner, herunder det polyadenylat - bindende protein. Den ATP -afhængige helicaseaktivitet af eIF4A, stimuleret af det RNA-bindende protein eIF4B, sikrer afviklingen af ethvert element i den sekundære mRNA-struktur, hvilket resulterer i dannelsen af et "landingssted" for den lille (40S) ribosomunderenhed [20 ] . Hvis translationen er begrænset af antallet af ribosomer eller koncentrationen af translationsfaktorer, kan 3'-poly(A)-halen interagere med 5'-hætten, hvilket øger translationsinitiering ved at introducere et polyadenylat-bindende protein, der kan interagere med eIF4F kompleks [21] .
Det antages, at i eukaryote mRNA'er begynder translation med det første AUG-kodon (startkodon), som ribosomet møder langs sin vej fra 5'- til 3'-enden. Sekvenserne omkring startkodonerne er ikke-tilfældige og udgør Kozak-konsensussekvensen . Hos pattedyr er denne sekvens: , og de mest konserverede nukleotider er R ( purin , sædvanligvis A ) i position -3 af AUG og G i position +4 af AUG. Det strenge arrangement af A i -3-stillingen og G i +4-stillingen er også karakteristisk for andre dyr, planter og svampe . Sekvenserne, der udgør AUG-miljøet (delvis strækker sig ind i det utranslaterede område) kan modulere effektiviteten af translation ved at tilvejebringe et passende miljø til initiering [3] . GCCRCCaugG
Det skal bemærkes, at 15% til 50% af 5'-UTR'er indeholder AUG-startkodonet internt. Derfor er reglen om, at ribosomet starter translation fra det første startkodon, som det møder, når det bevæger sig fra 5'- til 3'-enden af mRNA'et, ikke altid opfyldt. Dette betyder, at nogle gange kan ribosomet springe over de AUG-tripletter, det støder på, og starte translation fra et mere fjernt startkodon, muligvis fordi disse tripletter har et "svagt" nukleotidmiljø. Således kan flere forskellige proteiner syntetiseres fra ét mRNA [22] . Desuden blev det fundet, at tilstedeværelsen af interne AUG-kodoner i 5'-UTR korrelerer med en øget længde af denne region og et "svagere" miljø af det almindeligt anvendte startkodon og i transkripter med et optimalt miljø for start-AUG. , den 5'-utranslaterede region er kort og indeholder ikke AUG [23] . I denne henseende kan AUG'er i 5'-UTR reducere niveauet af translation af deres mRNA.
Hvis der i 5'-UTR efter den interne AUG, men før hovedstartkodonen, er en intern stopkodon, så dannes en kort åben læseramme ( engelsk opstrøms åben læseramme, uORF ). Efter translation af uORF og dissociation fra mRNA'et i den store (60S) ribosomunderenhed kan skæbnen for den lille underenhed være anderledes, og dette kan påvirke translationseffektiviteten og mRNA-stabiliteten. Den lille underenhed kan forblive på mRNA'et, genoptage læsning og starte translation fra den underliggende AUG-kodon, eller den kan forlade mRNA'et og derved sænke niveauet af translation af den åbne hovedlæseramme. Hos eukaryoter er ribosomets evne til at genoptage translationen begrænset, for det første af stopkodoner [24] og for det andet af uORF-længden: hvis uORF-længden overstiger 30 kodoner [25] vil ribosomet ikke være i stand til at genoptages oversættelse. På denne måde blokeres translationen af mRNA'er indeholdende uORF'er, der koder for gærtranskriptionsfaktorer GCN 4 og YAP 1 [26] .
Den sekundære struktur af 5'-UTR spiller en vigtig rolle i reguleringen af oversættelse. Eksperimentelle data viser, at moderat stabile elementer i den sekundære struktur (værdien af fri energiændring ΔG over -30 kcal/mol), der direkte indeholder startkodonen AUG, ikke stopper den lille underenhed af ribosomet. Meget stabile strukturer (ΔG under -50 kcal/mol) har en signifikant effekt på effektiviteten af translation, hvilket reducerer den. En stigning i koncentrationen af eIF4A bidrager til at overvinde indflydelsen af sådanne strukturer [27] .
Der er en alternativ translationsinitieringsmekanisme, som ikke er forbundet med 5'-hætten. Det blev først beskrevet i picornavirus [28] . I dette tilfælde er der inde i 5'-UTR en speciel sekvens, der tjener til at binde ribosomet - IRES . Efterfølgende blev IRES fundet i mange cellulære mRNA'er, der koder for regulatoriske proteiner, for eksempel c-Myc proto-onkogenprodukter , homeodomæneproteiner , vækstfaktorer (f.eks. fibroblast vækstfaktor FGF2 ), såvel som deres receptorer [3] . Sammenlignende analyse af kendte cellulære IRES'er gjorde det muligt at isolere et fælles strukturelt motiv, der er karakteristisk for mRNA'er, der indeholder dem. Især for mRNA'et fra immunoglobulin -tungkæde-bindende protein (BiP) og mRNA'et fra FGF-2-proteinet er der beskrevet en Y-formet hårnål , placeret umiddelbart før startkodonet AUG [29] . Det er blevet fastslået, at korte strukturelle motiver komplementære til lille ribosomalt RNA også kan fungere som IRES 30] .
Sekvenser, der er mål for trans -fungerende RNA-bindende proteiner, kan også være involveret i reguleringen af translation. For eksempel kan det jern -responsive element IRE ( jern -responsive element ) lokaliseret i 5'-UTR-mRNA-kodende proteiner involveret i jernmetabolisme ( ferritin , 5-aminolevulinatsyntase og aconitase ) blokere translation. I dette tilfælde forekommer jernafhængig binding af jernmetabolismeproteiner, hvilket undertrykker den normale scanning af mRNA, udført af den lille underenhed af ribosomet under initieringen af translation. Endelig indeholder de fleste hvirveldyr-mRNA'er, der koder for ribosomale proteiner og translationsforlængelsefaktorer , en 5'- terminal oligopyrimidinkanal ( TOP ) umiddelbart ved siden af hætten. Denne kanal er nødvendig for koordineret translationel undertrykkelse under vækst, differentiering og udviklingsforsinkelser og aktiveres også af visse lægemidler [31] .
Skæbnen for mRNA'er er et andet nøglepunkt i den post-transkriptionelle regulering af genekspression, da i fravær af ødelæggelse af visse mRNA'er, vil deres antal stige, hvilket betyder, at mængden af protein, de koder for, vil stige, hvilket kan påvirke ekspressionen af visse gener. Flere mulige mekanismer for mRNA-nedbrydning er blevet foreslået: dens nedbrydning kan udløses ved at forkorte eller løsne 3'-poly(A)-halen eller 5'-hætten [32] . Skæbnen for mRNA er hovedsageligt reguleret af cis -regulatoriske elementer placeret i 3'-UTR, såsom AU-rige elementer ( AREs ), som udløser mRNA-nedbrydning under indflydelse af forskellige intra- og ekstracellulære signaler. Ifølge de tilgængelige eksperimentelle data blev ARE'er opdelt i 3 klasser: medlemmer af klasse I og II er karakteriseret ved tilstedeværelsen af flere kopier af pentanukleotidet AUUUA, som ikke er til stede i medlemmer af klasse III [33] . Klasse I ARE'er kontrollerer cytoplasmatisk deadenylering ved at nedbryde hele poly(A)-halen med samme hastighed for alle transkripter, idet de først danner mellemprodukter med en poly(A)-hale på 30-60 nukleotider, som derefter nedbrydes fuldstændigt. Sådanne elementer findes hovedsageligt i mRNA'er, der koder for nukleare transkriptionsfaktorer, såsom c-Fos og c-Myc (produkter af "quick response" gener), såvel som mRNA'er, der koder for visse cytokiner , såsom interleukin 4 og 6 . Et strukturelt kendetegn ved klasse I ARE'er er tilstedeværelsen af en eller flere kopier af pentanukleotidet AUUUAefter den U-rige region. Klasse II ARE'er driver asynkron cytoplasmatisk deadenylering (dvs. poly(A)-halen af forskellige transkripter nedbrydes med forskellige hastigheder), hvilket resulterer i mRNA uden poly(A)-halen. De mRNA'er, der indeholder sådanne elementer, indbefatter mRNA'et fra cytokinerne GM-CSF, interleukin 2 , tumornekrosefaktor a (TNF-a), interferon -a . Et strukturelt træk ved ARE'er af anden klasse er tilstedeværelsen af tandem -pentanukleotid- gentagelser AUUUA, og den AU-rige region er placeret før disse gentagelser. Klasse III ARE'er mangler et pentanukleotid AUUUAog har kun en U -rig region. Et sådant element findes for eksempel i mRNA'et, der koder for c-Jun. Kinetikken af mRNA-nedbrydning i dette tilfælde svarer til kinetikken for AREs I [3] .
mRNA-nedbrydning kan også forekomme på grund af endonukleaseaktivitet , og denne mekanisme er afhængig af både deadenylering og decapping. Denne mekanisme er blevet fundet i mRNA'er, der koder for transferrinreceptoren . Nedbrydningen af disse mRNA'er inkluderer endonukleasespaltning af 3'-UTR, hvor IRE-genkendelse er et mellemtrin og regulering bestemt af intracellulære jernniveauer [34] .
Initiatorkodonerne i 5'-UTR og uORF kan også spille en rolle i en særlig mekanisme for nonsens - medieret mRNA-henfald ( nonsens - medieret mRNA-henfald ) . Signalet, der udløser denne pathway, er et meningsløst kodon, efterfulgt af en forbindelse mellem to exoner dannet under splejsning - et exon splejsningskompleks eller EJC ( engelsk Exon junction complex ) [35] (tilstedeværelsen af en sådan forbindelse adskiller en prematur terminator codon fra den vigtigste, da stopkodonet og 3'-UTR er placeret efter det sidste exon). Exon-forbindelser genkendes af markørproteiner, der binder til det ubehandlede transkript, mens de stadig er i kernen og forbliver forbundet med det efter mRNA-behandling og overførsel til cytoplasmaet [36] . I tilfælde af vildtype (dvs. "ikke-defekte") mRNA'er, fjerner translationsmaskineriet markørproteinet for at forhindre nedbrydning af transkriptet. Hvis ribosomet støder på et for tidligt stopkodon, eller hvis uORF'er er til stede i transkriptet, desintegrerer det, og det defekte mRNA mærket med markørproteiner er involveret i NMD [37] . I gæren Saccharomyces cerevisiae (de har et andet signal, der udløser NMD - downstream exonic elements ( DSE) ), nedbrydes mRNA'er indeholdende funktionelt aktive uORF'er, for eksempel kodende for GCN 4 og YAP 1 , ikke langs NMD-vejen. uORF og den kodende sekvens er der mRNA-specifikke stabiliserende sekvenser, der forhindrer NMD-aktivering på grund af interaktion med den RNA-bindende ubiquitin - ligase Pub1 [ 38] .
uORF'er kan også regulere mRNA-stabilitet uafhængigt af NMD. 5'-UTR af mRNA'et fra YAP2-genet fra S. cerevisiae indeholder 2 uORF'er, som undertrykker transkriptscanning af ribosomet og fremmer mRNA-nedbrydning [26] . Den destabiliserende effekt afhænger af terminatorkodonets miljø, som regulerer translationseffektivitet og mRNA-stabilitet.
Adskillige undersøgelser tyder på, at mange heterogene nukleare ribonukleoproteiner (hnRNP'er) kun fungerer i kernen, men også styrer skæbnen for mRNA i cytoplasmaet [39] , regulerer translation, mRNA-stabilitet og dets lokalisering i cytoplasma [37] . Et eksempel er amyloid precursor protein ( APP ) . En stigning i APP-indhold er en vigtig faktor i udviklingen af Alzheimers sygdom . Stabiliteten af APP-mRNA afhænger af et stærkt konserveret 29-nukleotidelement placeret i 3'-UTR og interagerer med forskellige RNA-bindende cytoplasmatiske proteiner [40] .
Kontrollen af genekspression på det post-transkriptionelle niveau, udført af ikke-translaterede regioner, er særlig vigtig under udvikling. Det asymmetriske arrangement af nogle mRNA'er i cellen fører til et asymmetrisk arrangement af proteinerne kodet af dem. Dette er den mest bekvemme mekanisme til proteinlokalisering, da et mRNA kan tjene som skabelon for flere oversættelsesrunder. I mange tilfælde er mRNA'er lokaliseret i ribonukleoproteinkomplekser sammen med proteiner i translationsapparatet, hvilket garanterer den nødvendige translationseffektivitet [3] .
Der er 3 hovedmekanismer for det asymmetriske arrangement af mRNA:
Myelin basic protein ( MBP) mRNA leveres til processerne af oligodendrocytter , der danner myelinskeden af CNS axoner gennem aktiv retningsbestemt transport . Hos mus transporteres og lokaliseres mRNA af specielle signalsekvenser placeret i 3'-UTR: RNA-transportsignalet (21 nukleotider langt) og et yderligere element, RNA-lokaliseringsregionen [41] .
Mange eksempler på lokal transkriptstabilisering er blevet fundet i de tidlige stadier af Drosophila udvikling . Transkripterne, der koder for det RNA-bindende protein Nanos og varmechokproteinet Hsp83, nedbrydes således overalt undtagen i cytoplasmaet ved embryonets bageste pol . Forskellige cis-regulatoriske elementer placeret i 3'-UTR'erne af de respektive mRNA'er er ansvarlige for både nedbrydningen af disse mRNA'er gennem hele embryoet og deres stabilisering ved den bageste ende af embryoet [42] .
Fænomenet med miljøbestemt mRNA-diffusion er godt demonstreret af mRNA'et fra Bicoid -proteinet i Drosophila. Elementerne involveret i nøgletrinet i denne proces, transkriptforankring, er ikke fuldstændigt beskrevet, men et af de involverede proteiner, Staufen , er et dsRNA-bindende protein, der kræves for at stoppe Bicoid i den forreste ende af embryoet [43 ] .
I alle ovenstående eksempler blev lokalisering reguleret af cis-regulatoriske elementer placeret i 3'-UTR, men sådanne elementer placeret i 5'-UTR og endda kodningsområdet er også kendte. Sådanne elementer er kendt som mRNA-arkiveringskoder ( eng. mRNA zip codes ), de interagerer med de tilsvarende bindingsproteiner ( eng. zip-code-bindende proteiner ), for eksempel den allerede nævnte Staufen. Arkiveringskoder mangler nogen lighed i primær og sekundær struktur . De kan have en kompleks (kompleks) sekundær og tertiær struktur , hvor den primære struktur ( nukleotidsekvens ) ikke er så vigtig som den rumlige struktur [44] , men tværtimod kan de være korte nukleotidsekvenser [45] , nogle gange inkluderet i gentagne elementer (f.eks. i tilfælde af Vg1 transkriptet i frøen Xenopus [46] ).
Alternativ splejsning er den vigtigste måde at generere forskellige mRNA'er fra et originalt transkript, der koder for det samme eller forskellige proteiner. I dette tilfælde kan der udover lange proteinkodende mRNA'er også dannes ikke-kodende RNA'er. Det spaltede mRNA kan gennemgå en recapping-proces for at danne et mRNA med en trunkeret 5'-utranslateret region eller kun koder for et fragment af det originale protein. Derudover er det kendt, at 3'-UTR-fragmenter dannet under alternativ splejsning kan begynde at fungere som trans-regulatoriske ikke-kodende RNA'er, uafhængigt af hoved-RNA'et [47] .
Det er kendt, at mRNA er i stand til at lukke sig ind i en løkke (cirkularisering) på grund af interaktionen af specifikke proteiner, der binder til poly(A)-halen , som fremmer bindingen af eIF4F-faktoren til hætten . Som et resultat antager mRNA en lukket form, translationsinitiering stimuleres, og translationseffektiviteten øges. I nogle tilfælde kan 5'-UTR og 3'-UTR af det samme mRNA imidlertid binde komplementært til hinanden. Således har mRNA fra det humane gen, der koder for transkriptionsfaktoren p53 , områder i 5'-UTR og 3'-UTR, som er komplementære til hinanden. Ved at binde sig til hinanden og til translationsfaktoren RPL26 øger de derved translationseffektiviteten, hvilket er en af årsagerne til den hurtige ophobning af p53-proteinet som reaktion på DNA- skade [48] .
Analyse af mRNA'er af forskellige menneskelige gener viste, at 5'-UTR'en indeholder motivet , der specifikt interagerer med 3'-enderne af miRNA'erne, mens mange af disse mRNA'er har et sted, der er komplementært til 3'-UTR'en i 5'-enden . Yderligere undersøgelser har vist, at binding af 5'-UTR til miRNA letter bindingen af 5'-enden af mRNA til 3'-enden, og mRNA'er, hvis aktivitet er stærkt bestemt af miRNA'et, har forudsigelige bindingssteder på begge UTR'er. Sådanne mRNA'er kaldes miBridge. Det blev endvidere fundet, at tabet af disse bindingssteder reducerede miRNA-drevet undertrykkelse af transskriptionstranslation. Det blev således fundet, at bindingssteder for NTO'er med hinanden er nødvendige for undertrykkelse af mRNA-translation. Dette indikerer, at den komplementære interaktion mellem 5'-UTR og 3'-UTR er nødvendig for præcis regulering af genekspression [49] .
Bakterielt mRNA indeholder også 5'- og 3'-utranslaterede områder [51] [52] . Længden af 5'-UTR af bakterier er meget mindre end eukaryotes og er sædvanligvis 3-10 nukleotider. For eksempel er længden af 5'-UTR-transkriptet af Escherichia coli lactoseoperon kun 7 nukleotider [53] . I bakteriers 5'-UTR er Shine-Dalgarno-sekvensen ( ) [54] lokaliseret , som tjener til at binde ribosomet og adskilles af en spacer fra startkodonen AUG. Selvom 5'-UTR'erne for bakterier og eukaryoter er forskellige, blev det vist, at tilføjelsen af CC-nukleotider til mRNA-spaceren af Ner -genet fra bakteriofag Mu , som er godt udtrykt i Escherichia coli- og Streptomyces -celler , førte til vellykket ekspression af dette gen i retikulocytceller fra kanin [55] . AGGAGG
Elementer af den sekundære struktur lokaliseret i 5'-UTR har som regel en undertrykkende effekt på translation [56] . Det er især i 5'-UTR, at attenuatorer normalt er placeret - elementer af operoner , der forårsager for tidlig afbrydelse af translation [57] (det mest berømte eksempel på dæmpning er udtryk for tryptofan operon ).
Derudover er 5'-UTR af bakterier vært for de fleste riboswitch [58] - mRNA regulatoriske elementer, der er i stand til at binde til små molekyler , hvilket fører til en ændring i effektiviteten af proteindannelse kodet af dette mRNA [59] .
I modsætning til eukaryoter er lange 3'-UTR'er sjældne i bakterier og dårligt forståede. Imidlertid er nogle bakterier, især Salmonella enterica , kendt for at have eukaryot-lignende mRNA'er med lange 3'-UTR'er (i S. enterica er dette hilD- mRNA'et ). Det antages, at hilD 3'-UTR'er udfører forskellige funktioner, især påvirker de omsætningen af deres mRNA'er, da deletionen af disse regioner forårsagede en stigning i mængden af de tilsvarende mRNA'er [60] .
Utranslaterede regioner findes også i mRNA'et fra mange arkæer . Især i 5'- og 3'-UTR'erne af mRNA'et fra den methanogene archaea Methanocaldococcus jannaschii (som i andre medlemmer af Methanopyrales- og Methanococcales -ordenerne ) er SECIS- elementet lokaliseret , som er ansvarligt for indsættelsen af aminosyren selenocystein ind i polypeptidkæden [ 61] .
Det er blevet fastslået, at mRNA'et fra de fleste haloarchaea såvel som Pyrobaculum og Sulfolobus mangler en udtalt 5'-UTR, men mRNA'et fra archaea - methanogener har lang 5'-UTR. I denne henseende antages det, at mekanismen for translationsinitiering i methanogene archaea kan være anderledes end andre repræsentanter for dette domæne [56] . Imidlertid indeholder haloarchaeal mRNA 3'-UTR'er, og deres 3'-ender gennemgår ikke post-transkriptionel modifikation. Overraskende nok mangler de haloarchaeale transkripter, der har en 5'-UTR, Shine-Dalgarno-sekvensen. Længden af 3'-UTR af haloarchaea varierede fra 20 til 80 nukleotider; ingen konserverede strukturelle motiver og sekvenser, bortset fra penta-U-nukleotidet i translationstermineringsregionen, er blevet identificeret [62] .
For arkæisk mRNA er riboswitches blevet beskrevet , herunder TPP-riboswitches (binding til thiaminpyrophosphat (TPP)), som er placeret i 5'-UTR (lignende riboswitches findes også i bakterier og eukaryoter) [63] .
I mange vira sker translationsinitiering af en cap - uafhængig mekanisme og udføres gennem de allerede nævnte IRES -elementer lokaliseret i 5'-UTR [64] . For eksempel sker dette ved HIV , hepatitis A og C virus [65] . Denne mekanisme for translationsinitiering er praktisk, fordi der i dets tilfælde ikke er behov for at samle præinitiatorproteinkomplekset, og viruset kan formere sig hurtigt [53] .
Vira har også en anden cap-uafhængig translationsinitieringsmekanisme, som ikke er forbundet med IRES. Denne mekanisme er til stede i mange plantevirus . I dette tilfælde er der et særligt cap - uafhængig translation element (CITE) placeret i 3'-UTR. Ofte binder CITE translationsfaktorer, for eksempel eIF4F-komplekset, og interagerer derefter komplementært med 5'-enden og leverer translationsinitieringsfaktorer til stedet for dets start [66] .
I vira, hvis genom er repræsenteret af et enkeltstrenget RNA-molekyle med positiv polaritet , påvirker 3'-UTR ikke kun translation, men er også involveret i replikation : det er fra det, at replikationen af det virale genom begynder [67 ] .
Mæslingevirussen (slægten Morbillivirus af Paramyxoviridae - familien ) har et genom repræsenteret af et enkeltstrenget RNA-molekyle med negativ polaritet. En interessant mekanisme er blevet etableret for dets M- og F-gener. Disse geners mRNA'er har lange UTR'er; de tegner sig for ~6,4% af det samlede mRNA. Selvom disse gener ikke er direkte involveret i replikation, øger 3'-UTR-mRNA'et fra M-genet akkumuleringshastigheden af M-proteinet og udløser således genomreplikation. Samtidig reducerer 5'-UTR af F-genets mRNA dannelsen af F-proteinet og undertrykker dermed replikation [68] .
Da uoversatte regioner spiller en kritisk rolle i reguleringen af genekspression , fører forskellige ændringer, der påvirker disse regioner, ofte til sygdomstilstande såsom arvelig trombocytæmi , brystkræft , fragilt X-syndrom , bipolar affektiv lidelse , Alzheimers sygdom og andre [69] . Diagrammerne nedenfor viser sammenhænge mellem mutationer, der påvirker et eller andet funktionelt element i 3'-UTR og 5'-UTR og forskellige sygdomme.