Promoter ( eng. promoter ) er en DNA- nukleotidsekvens , der genkendes af RNA-polymerase som en startpude til at starte transkription . Promotoren spiller en af nøglerollerne i transkriptionsinitieringsprocessen [1] .
Normalt er promotoren placeret omkring transkriptionsstartpunktet - det første nukleotid, hvorfra transkriptet er opnået, som har en koordinat på +1 (det foregående nukleotid er angivet som -1). Promotoren inkluderer sædvanligvis en række motiver , der er vigtige for dens genkendelse af RNA-polymerase. Især -10 og -35 elementer i bakterier , TATA-boks i eukaryoter [1] .
Promotoren er asymmetrisk, hvilket tillader RNA-polymerase at starte transkription i den korrekte retning og angiver, hvilken af de to DNA-strenge, der vil tjene som skabelon for RNA- syntese . DNA-skabelonkæden kaldes ikke-kodende, mens den anden kodende kæde matcher det resulterende RNA i sekvens (eksklusive erstatning af thymin med uracil ) [1] .
Promotoren, under hvilken den kodende RNA-region af DNA er placeret, spiller en afgørende rolle i intensiteten af ekspression af dette gen i hver specifik celletype. Efter aktivitet opdeles promotorer i konstitutive (konstant niveau af transkription) og inducerbare (transkription afhænger af forhold i cellen, for eksempel tilstedeværelsen af visse stoffer eller tilstedeværelsen af varmechok). Promotoraktivering bestemmes af tilstedeværelsen af et sæt transkriptionsfaktorer [1] .
Den bakterielle kerne -RNA-polymerase (bestående af α2ββ'ω-underenheder) kan initiere transkription hvor som helst i genomet. I cellen forekommer initiering imidlertid kun i promotorregionerne. Denne specificitet tilvejebringes af σ-underenheden ( σ-faktor ), som i kompleks med kerneenzymet danner et holoenzym . Den vigtigste σ-faktor for Escherichia coli-celler er σ 70 -underenheden [1] .
Den klassiske (σ 70 ) promotor består af to konserverede sekvenser på 6 nukleotider i længden, placeret opstrøms for transkriptionsstartstedet med 10 og 35 bp, adskilt af 17 nukleotider. Disse sekvenser kaldes henholdsvis -10 og -35 elementer . Elementerne er ikke identiske i alle promotorer, men konsensussekvenser kan opnås for dem [1] .
Nogle stærke promotorer har også et UP-element opstrøms for -35-elementet, hvilket øger niveauet af RNA-polymerasebinding. Nogle σ 70 -promotorer har ikke -35-elementet, men har i stedet -10-elementet forlænget et par nukleotider op ( forlænget -10 ). Dette er promotoren for galactoseoperonen E. coli . Nogle gange er der under -10-elementet et andet forbindelseselement - diskriminatoren [1] .
Alternative σ-underenheder af RNA-polymerase ændrer specificiteten af promotorgenkendelse. For eksempel forårsager σ 32 -underenheden genkendelse af promotorer af varmechokresponsgener, σ 54 er forbundet med nitrogenmetabolismegener [1] .
Eukaryote celler indeholder flere typer RNA-polymeraser. Transskription af mRNA udføres af RNA-polymerase II sammen med et sæt proteintranskriptionsfaktorer [1] .
Den eukaryote kernepromotor er det mindste sæt af sekvenselementer, der kræves til binding af RNA-polymerase II og transkriptionsfaktorer involveret i starten af transkriptionsinitiering. Typisk er kernepromotoren 40-60 bp lang og kan være placeret enten over eller under transkriptionsstartpunktet. Det komplette sæt af kernepromotorelementer inkluderer BRE-element , TATA-boks , Inr (initiator) og/eller downstream-elementer (DPE, DCE og MTE). Normalt indeholder promotoren en kombination af disse elementer. For eksempel forekommer DPE og TATA-boks normalt ikke på samme tid i én promotor. Ofte er der en kombination af TATA box, DPE og Inr [1] .
promotorelement | Bindende protein | Koordinater | Konsensussekvens |
---|---|---|---|
BRE element | TFIIB | -37 -32 | [GC][GC][GA]CGCCC |
TATA boks | TBP | -31 -26 | TATA[AT]A[AT] |
Indr | TFIID | -2 +4 | [CT][CT]AN[TA][CT][CT] |
DCE I | TFIID | +6 +11 | CTTC |
DCE II | TFIID | +16 +21 | CTGT |
MTE | +21 +28 | ||
DPE | TFIID | +28 +32 | [AG]G[AT]CGTG |
DCE III | TFIID | +30 +34 | AGC |
For at transskriptionen af eukaryoter kan fortsætte, er interaktion med regulatoriske sekvenser lokaliseret fra transkriptionsstartpunktet også nødvendig - proksimale sekvenser, forstærkere , lyddæmpere , isolatorer, grænseelementer [1] .
I eukaryote celler er der udover RNA-polymerase II yderligere to RNA-polymeraser, der transkriberer rRNA ( RNA-polymerase I er ansvarlig for dette ) og ikke-kodende RNA'er såsom tRNA og 5sRNA (de transskriberes af RNA-polymerase III ) [1 ] .
RNA-polymerase I i eukaryote celler transkriberer et enkelt rRNA -precursorgen , der findes i mange kopier i genomet. rRNA-genpromotoren indeholder kerneelementer (koordinater omkring -45 +20) og UCE ( opstrøms kontrolelement , koordinater omkring -150 -100). Transkriptionsinitiering af dette gen kræver også adskillige transkriptionsfaktorer, TBP, SL1 (består af TBP-proteinerne og tre TAF'er) og UBF. UBF binder UCE-elementet, SF1 binder kernepromotoren. Bundet UBF stimulerer polymerasebinding til kernepromotorregionen [1] .
RNA-polymerase III transkriberer generne af noget af cellens ikke-kodende RNA ( tRNA , 5sRNA). Promotorerne af RNA-polymerase III er meget forskellige og ligger normalt under transkriptionsstartpunktet. Promotorer af tRNA-gener indeholder især A- og B-bokse; transkriptionsfaktorerne TFIIIB og TFIIIC er nødvendige for initiering. Andre promotorer kan indeholde A- og C-bokse (for eksempel 5sRNA); transkriptionsfaktorer TFIIIA, TFIIIB, TFIIIC er nødvendige for initiering. RNA-polymerase III-promotorgruppen indeholder TATA-bokse [1] .
Regulering af transkriptionsniveauet sker ofte på initieringsstadiet, det vil sige fra bindingen af RNA-polymerase til promotoren før starten af forlængelsen [1] .
Promotorregionen i en operon i bakterier kan overlappe eller slet ikke overlappe med operatorregionen af et cistron ( gen ) . Hos bakterier bestemmes binding til promotoren af den strukturelle del af polymerasen, σ-underenheden. Regulatoriske proteiner er også ofte involveret i reguleringen, hvilket kan fremskynde processen og øge dens effektivitet (aktivatorer) eller bremse den (repressorer) [1] .
Transskription af eukaryoter reguleres på samme måde som bakterier (på grund af forskellige regulatoriske proteiner), men er også forskellig. Eukaryote gener danner ikke operoner; hvert gen har sin egen promotor. Eukaryoter har kromatin sammensat af DNA og nukleosomer. Både DNA og nukleosomer kan gennemgå kemisk modifikation, der påvirker niveauet af transkription. Også andre DNA-regioner, såsom forstærkere, lyddæmpere, isolatorer, grænseelementer, er involveret i reguleringen af promotorer i eukaryoter [1] .
Sekvenserne og regulatoriske træk af mange promotorer fra forskellige levende organismer er nu velforståede. Denne viden bruges i vid udstrækning i skabelsen af biotekniske genetiske konstruktioner ( plasmider , vektorer ). Til produktekspression i bakterielle eller eukaryote celler kan både en promotor, der er karakteristisk for denne gruppe af organismer, der findes i genomet, og en promotor, for eksempel fra vira, der inficerer denne organisme, anvendes [1] .
Klassiske eksempler på bakterielle operoner med kendt regulering af prokaryote promotorer er: lactose-promotor , tryptophan-promotor , arabinose-promotor , GABA-operon , galactose-operon . Velundersøgte eukaryote cellepromotorer er gær-GAL1-promotoren, den inducerbare TRE-tetracyclin-promotor og den inducerbare edkyson-promotor. I det virale genom, såvel som i pro- og eukaryote, er der promotorer, for eksempel T5-fag-promotoren, T7-fag-promotoren, de konstitutive promotorer af SV40-vira (polyomavirus), RSV, CMV (cytomegalovirus) [1] .
Ofte producerer promotorforudsigelsesalgoritmer et stort antal falske positiver (forudsige promotorsekvenser, der ikke er promotorer). For eksempel forudsiger forskellige algoritmer i gennemsnit en promotor pr. 1000 bp, mens det menneskelige genom indeholder cirka et gen pr. 30.000-40.000 bp. [2] Dette resultat skyldes det faktum, at mange faktorer skal tages i betragtning, når man forudsiger promotorer [2] :
På trods af de ovenfor beskrevne vanskeligheder er der mange algoritmer til at forudsige promotorregioner i forskellige organismer. Tabellen nedenfor viser nogle af dem.
Algoritme navn | Hvordan algoritmen fungerer | Hvad algoritmen forudsiger |
---|---|---|
TSSW [3] | Algoritmen forudsiger potentielle transkriptionsstartsteder ved hjælp af en lineær diskriminantfunktion, der kombinerer karakteristika, der beskriver de funktionelle motiver og oligonukleotidsammensætningen af disse steder. TSSW bruger TRANSFAC funktionelle webstedsdatabase (forfattet af E. Wingender [4] , deraf det sidste bogstav i navnet på TSSW-metoden). | PolII human promotorregion. |
TSSG [3] /Fprom [3] | TSSG-algoritmen fungerer på samme måde som TSSW, men bruger en anden database, TFD [5] . Fprom er den samme TSSG trænet på et andet sæt promotorsekvenser. | TSSG, human PolII promotorregion; Fprom, human promotorregion. |
TSSP [3] | Algoritmen fungerer på samme måde som TSSW, ved hjælp af databasen over planteregulerende elementer RegSite [6] . På samme tid blev algoritmen trænet på sekvenserne af plantepromotorregioner. | plantefremmende region. |
Peber [7] | Algoritmen forudsiger promotorregionen baseret på en kureret positionel vægtmatrix og skjult Markov-model for -35 og -10 konsensussekvenserne, såvel som forskellige bindingssteder for Bacillus subtilis og Escherichia coli (taget som repræsentanter for Gram-positive og Gram - henholdsvis negative bakterier). | Promotorregion af prokaryoter (hovedsageligt egnet til bakterielle genomer). |
PromoterInspector [8] | Den heuristiske algoritme er baseret på det genomiske miljø i promotorregionen af en prøve af pattedyrsekvenser. | PolII-promotorregion af pattedyr. |
BPROM [3] | Algoritmen fungerer på samme måde som TSSW ved hjælp af DPInteract [9] funktionelle webstedsdatabase . | σ 70 E. coli promotorregion . |
NNPP 2.2 [10] | Programmet er et neuralt netværk med forsinkelse, som består af to funktionelle lag, et til TATA-boks-genkendelse og et til Inr-element-genkendelse. | Promotorregion af eukaryoter og prokaryoter. |
G4PromFinder [11] | Algoritmen identificerer formodede promotorer baseret på AT-rige elementer og G-quadruplex DNA-motiver i den GC-rige region. | Promotorregion af bakterier. |
Med stigningen i antallet af forudsagte, eksperimentelt viste promotorregioner af forskellige organismer, blev det nødvendigt at oprette en database med promotorsekvenser. Den største database med eukaryote promotorsekvenser (hovedsageligt hvirveldyr) er Eukaryotic Promoter Database [12] . Databasen er opdelt i to dele. Den første (EPD) er en kurateret samling af promotorsekvenser opnået ved at behandle eksperimentelle data, den anden (EPDnew) er resultatet af sammenlægning af promotorinformation fra EPD-databasen med dataanalyse fra high-throughput sekventeringsmetoder. Ved hjælp af high-throughput metoder til opnåelse af transkriptomer var det muligt at opnå et sæt promotorer for nogle repræsentanter for planter og svampe: Arabidopsis thaliana (Tal's coli), Zea mays (Sukkermajs), Saccharomyces cerevisiae , Schizosaccharomyces pombe [13 ] .
Ordbøger og encyklopædier | |
---|---|
I bibliografiske kataloger |
Transskription (biologi) | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Transskriptionsregulering _ |
| ||||||||||||
Aktivering | |||||||||||||
Indvielse | Startside for transskription | ||||||||||||
Forlængelse |
| ||||||||||||
Afslutning |