Promotor

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 14. april 2022; verifikation kræver 1 redigering .

Promoter ( eng.  promoter ) er en DNA- nukleotidsekvens , der genkendes af RNA-polymerase som en startpude til at starte transkription . Promotoren spiller en af ​​nøglerollerne i transkriptionsinitieringsprocessen [1] .

Generel information

Normalt er promotoren placeret omkring transkriptionsstartpunktet - det første nukleotid, hvorfra transkriptet er opnået, som har en koordinat på +1 (det foregående nukleotid er angivet som -1). Promotoren inkluderer sædvanligvis en række motiver , der er vigtige for dens genkendelse af RNA-polymerase. Især -10 og -35 elementer i bakterier , TATA-boks i eukaryoter [1] .

Promotoren er asymmetrisk, hvilket tillader RNA-polymerase at starte transkription i den korrekte retning og angiver, hvilken af ​​de to DNA-strenge, der vil tjene som skabelon for RNA- syntese . DNA-skabelonkæden kaldes ikke-kodende, mens den anden kodende kæde matcher det resulterende RNA i sekvens (eksklusive erstatning af thymin med uracil ) [1] .

Promotoren, under hvilken den kodende RNA-region af DNA er placeret, spiller en afgørende rolle i intensiteten af ​​ekspression af dette gen i hver specifik celletype. Efter aktivitet opdeles promotorer i konstitutive (konstant niveau af transkription) og inducerbare (transkription afhænger af forhold i cellen, for eksempel tilstedeværelsen af ​​visse stoffer eller tilstedeværelsen af ​​varmechok). Promotoraktivering bestemmes af tilstedeværelsen af ​​et sæt transkriptionsfaktorer [1] .

Strukturen af ​​promotorer

I bakterier

Den bakterielle kerne -RNA-polymerase (bestående af α2ββ'ω-underenheder) kan initiere transkription hvor som helst i genomet. I cellen forekommer initiering imidlertid kun i promotorregionerne. Denne specificitet tilvejebringes af σ-underenheden ( σ-faktor ), som i kompleks med kerneenzymet danner et holoenzym . Den vigtigste σ-faktor for Escherichia coli-celler er σ 70 -underenheden [1] .

Den klassiske (σ 70 ) promotor består af to konserverede sekvenser på 6 nukleotider i længden, placeret opstrøms for transkriptionsstartstedet med 10 og 35 bp, adskilt af 17 nukleotider. Disse sekvenser kaldes henholdsvis -10 og -35 elementer . Elementerne er ikke identiske i alle promotorer, men konsensussekvenser kan opnås for dem [1] .

Nogle stærke promotorer har også et UP-element opstrøms for -35-elementet, hvilket øger niveauet af RNA-polymerasebinding. Nogle σ 70 -promotorer har ikke -35-elementet, men har i stedet -10-elementet forlænget et par nukleotider op ( forlænget -10 ). Dette er promotoren for galactoseoperonen E. coli . Nogle gange er der under -10-elementet et andet forbindelseselement - diskriminatoren [1] .

Alternative σ-underenheder af RNA-polymerase ændrer specificiteten af ​​promotorgenkendelse. For eksempel forårsager σ 32 -underenheden genkendelse af promotorer af varmechokresponsgener, σ 54 er forbundet med nitrogenmetabolismegener [1] .

I eukaryoter

Eukaryote celler indeholder flere typer RNA-polymeraser. Transskription af mRNA udføres af RNA-polymerase II sammen med et sæt proteintranskriptionsfaktorer [1] .

Den eukaryote kernepromotor er det mindste sæt af sekvenselementer, der kræves til binding af RNA-polymerase II og transkriptionsfaktorer involveret i starten af ​​transkriptionsinitiering. Typisk er kernepromotoren 40-60 bp lang og kan være placeret enten over eller under transkriptionsstartpunktet. Det komplette sæt af kernepromotorelementer inkluderer BRE-element , TATA-boks , Inr (initiator) og/eller downstream-elementer (DPE, DCE og MTE). Normalt indeholder promotoren en kombination af disse elementer. For eksempel forekommer DPE og TATA-boks normalt ikke på samme tid i én promotor. Ofte er der en kombination af TATA box, DPE og Inr [1] .

promotorelement Bindende protein Koordinater Konsensussekvens
BRE element TFIIB -37 -32 [GC][GC][GA]CGCCC
TATA boks TBP -31 -26 TATA[AT]A[AT]
Indr TFIID -2 +4 [CT][CT]AN[TA][CT][CT]
DCE I TFIID +6 +11 CTTC
DCE II TFIID +16 +21 CTGT
MTE +21 +28
DPE TFIID +28 +32 [AG]G[AT]CGTG
DCE III TFIID +30 +34 AGC

For at transskriptionen af ​​eukaryoter kan fortsætte, er interaktion med regulatoriske sekvenser lokaliseret fra transkriptionsstartpunktet også nødvendig - proksimale sekvenser, forstærkere , lyddæmpere , isolatorer, grænseelementer [1] .

I eukaryote celler er der udover RNA-polymerase II yderligere to RNA-polymeraser, der transkriberer rRNA ( RNA-polymerase I er ansvarlig for dette ) og ikke-kodende RNA'er såsom tRNA og 5sRNA (de transskriberes af RNA-polymerase III ) [1 ] .

RNA-polymerase I i eukaryote celler transkriberer et enkelt rRNA -precursorgen , der findes i mange kopier i genomet. rRNA-genpromotoren indeholder kerneelementer (koordinater omkring -45 +20) og UCE ( opstrøms kontrolelement , koordinater omkring -150 -100). Transkriptionsinitiering af dette gen kræver også adskillige transkriptionsfaktorer, TBP, SL1 (består af TBP-proteinerne og tre TAF'er) og UBF. UBF binder UCE-elementet, SF1 binder kernepromotoren. Bundet UBF stimulerer polymerasebinding til kernepromotorregionen [1] .

RNA-polymerase III transkriberer generne af noget af cellens ikke-kodende RNA ( tRNA , 5sRNA). Promotorerne af RNA-polymerase III er meget forskellige og ligger normalt under transkriptionsstartpunktet. Promotorer af tRNA-gener indeholder især A- og B-bokse; transkriptionsfaktorerne TFIIIB og TFIIIC er nødvendige for initiering. Andre promotorer kan indeholde A- og C-bokse (for eksempel 5sRNA); transkriptionsfaktorer TFIIIA, TFIIIB, TFIIIC er nødvendige for initiering. RNA-polymerase III-promotorgruppen indeholder TATA-bokse [1] .

Regulering af initiativtagere

Regulering af transkriptionsniveauet sker ofte på initieringsstadiet, det vil sige fra bindingen af ​​RNA-polymerase til promotoren før starten af ​​forlængelsen [1] .

Promotorregionen i en operon i bakterier kan overlappe eller slet ikke overlappe med operatorregionen af ​​et cistron ( gen ) . Hos bakterier bestemmes binding til promotoren af ​​den strukturelle del af polymerasen, σ-underenheden. Regulatoriske proteiner er også ofte involveret i reguleringen, hvilket kan fremskynde processen og øge dens effektivitet (aktivatorer) eller bremse den (repressorer) [1] .

Transskription af eukaryoter reguleres på samme måde som bakterier (på grund af forskellige regulatoriske proteiner), men er også forskellig. Eukaryote gener danner ikke operoner; hvert gen har sin egen promotor. Eukaryoter har kromatin sammensat af DNA og nukleosomer. Både DNA og nukleosomer kan gennemgå kemisk modifikation, der påvirker niveauet af transkription. Også andre DNA-regioner, såsom forstærkere, lyddæmpere, isolatorer, grænseelementer, er involveret i reguleringen af ​​promotorer i eukaryoter [1] .

Eksempler på promotorer

Sekvenserne og regulatoriske træk af mange promotorer fra forskellige levende organismer er nu velforståede. Denne viden bruges i vid udstrækning i skabelsen af ​​biotekniske genetiske konstruktioner ( plasmider , vektorer ). Til produktekspression i bakterielle eller eukaryote celler kan både en promotor, der er karakteristisk for denne gruppe af organismer, der findes i genomet, og en promotor, for eksempel fra vira, der inficerer denne organisme, anvendes [1] .

Klassiske eksempler på bakterielle operoner med kendt regulering af prokaryote promotorer er: lactose-promotor , tryptophan-promotor , arabinose-promotor , GABA-operon , galactose-operon . Velundersøgte eukaryote cellepromotorer er gær-GAL1-promotoren, den inducerbare TRE-tetracyclin-promotor og den inducerbare edkyson-promotor. I det virale genom, såvel som i pro- og eukaryote, er der promotorer, for eksempel T5-fag-promotoren, T7-fag-promotoren, de konstitutive promotorer af SV40-vira (polyomavirus), RSV, CMV (cytomegalovirus) [1] .

Forudsigelse af promotorregion

Ofte producerer promotorforudsigelsesalgoritmer et stort antal falske positiver (forudsige promotorsekvenser, der ikke er promotorer). For eksempel forudsiger forskellige algoritmer i gennemsnit en promotor pr. 1000 bp, mens det menneskelige genom indeholder cirka et gen pr. 30.000-40.000 bp. [2] Dette resultat skyldes det faktum, at mange faktorer skal tages i betragtning, når man forudsiger promotorer [2] :

På trods af de ovenfor beskrevne vanskeligheder er der mange algoritmer til at forudsige promotorregioner i forskellige organismer. Tabellen nedenfor viser nogle af dem.

Algoritme navn Hvordan algoritmen fungerer Hvad algoritmen forudsiger
TSSW [3] Algoritmen forudsiger potentielle transkriptionsstartsteder ved hjælp af en lineær diskriminantfunktion, der kombinerer karakteristika, der beskriver de funktionelle motiver og oligonukleotidsammensætningen af ​​disse steder. TSSW bruger TRANSFAC funktionelle webstedsdatabase (forfattet af E. Wingender [4] , deraf det sidste bogstav i navnet på TSSW-metoden). PolII human promotorregion.
TSSG [3] /Fprom [3] TSSG-algoritmen fungerer på samme måde som TSSW, men bruger en anden database, TFD [5] . Fprom er den samme TSSG trænet på et andet sæt promotorsekvenser. TSSG, human PolII promotorregion; Fprom, human promotorregion.
TSSP [3] Algoritmen fungerer på samme måde som TSSW, ved hjælp af databasen over planteregulerende elementer RegSite [6] . På samme tid blev algoritmen trænet på sekvenserne af plantepromotorregioner. plantefremmende region.
Peber [7] Algoritmen forudsiger promotorregionen baseret på en kureret positionel vægtmatrix og skjult Markov-model for -35 og -10 konsensussekvenserne, såvel som forskellige bindingssteder for Bacillus subtilis og Escherichia coli (taget som repræsentanter for Gram-positive og Gram - henholdsvis negative bakterier). Promotorregion af prokaryoter (hovedsageligt egnet til bakterielle genomer).
PromoterInspector [8] Den heuristiske algoritme er baseret på det genomiske miljø i promotorregionen af ​​en prøve af pattedyrsekvenser. PolII-promotorregion af pattedyr.
BPROM [3] Algoritmen fungerer på samme måde som TSSW ved hjælp af DPInteract [9] funktionelle webstedsdatabase . σ 70 E. coli promotorregion .
NNPP 2.2 [10] Programmet er et neuralt netværk med forsinkelse, som består af to funktionelle lag, et til TATA-boks-genkendelse og et til Inr-element-genkendelse. Promotorregion af eukaryoter og prokaryoter.
G4PromFinder [11] Algoritmen identificerer formodede promotorer baseret på AT-rige elementer og G-quadruplex DNA-motiver i den GC-rige region. Promotorregion af bakterier.

Med stigningen i antallet af forudsagte, eksperimentelt viste promotorregioner af forskellige organismer, blev det nødvendigt at oprette en database med promotorsekvenser. Den største database med eukaryote promotorsekvenser (hovedsageligt hvirveldyr) er Eukaryotic Promoter Database [12] . Databasen er opdelt i to dele. Den første (EPD) er en kurateret samling af promotorsekvenser opnået ved at behandle eksperimentelle data, den anden (EPDnew) er resultatet af sammenlægning af promotorinformation fra EPD-databasen med dataanalyse fra high-throughput sekventeringsmetoder. Ved hjælp af high-throughput metoder til opnåelse af transkriptomer var det muligt at opnå et sæt promotorer for nogle repræsentanter for planter og svampe: Arabidopsis thaliana (Tal's coli), Zea mays (Sukkermajs), Saccharomyces cerevisiae , Schizosaccharomyces pombe [13 ] .

Noter

  1. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Watson JD, Baker TA, Bell SP, Gann AA, Levine M., Losick RM Molecular Biology of the  Gene . — 7. - Pearson, 2014.
  2. 1 2 Pedersen Anders Gorm , Baldi Pierre , Chauvin Yves , Brunak Søren. Biologien bag forudsigelse af eukaryote promotorer - en gennemgang  //  Computere og kemi. - 1999. - Juni ( bind 23 , nr. 3-4 ). - S. 191-207 . — ISSN 0097-8485 . - doi : 10.1016/S0097-8485(99)00015-7 .
  3. 1 2 3 4 5 Solovyev Victor V. , Shahmuradov Ilham A. , Salamov Asaf A. Identifikation af promotorregioner og reguleringssteder  (engelsk)  // Methods in Molecular Biology. - 2010. - S. 57-83 . — ISBN 9781607618539 . — ISSN 1064-3745 . - doi : 10.1007/978-1-60761-854-6_5 .
  4. Wingender E. TRANSFAC: en database over transkriptionsfaktorer og deres DNA-bindingssteder  //  Nucleic Acids Research. - 1996. - 1. januar ( bind 24 , nr. 1 ). - S. 238-241 . — ISSN 1362-4962 . doi : 10.1093 / nar/24.1.238 .
  5. David Ghosh. En relationel database over transkriptionsfaktorer  //  Nukleinsyreforskning. - 1990. - Bd. 18 , nr. 7 . - S. 1749-1756 . — ISSN 0305-1048 . - doi : 10.1093/nar/18.7.1749 .
  6. RegSite Database . SoftBerry . Hentet 7. april 2019. Arkiveret fra originalen 22. oktober 2019.
  7. de Jong Anne , Pietersma Hilco , Cordes Martijn , Kuipers Oscar P , Kok Jan. PePPER: en webserver til forudsigelse af prokaryote promotorelementer og reguloner  //  BMC Genomics. - 2012. - Bd. 13 , nr. 1 . — S. 299 . — ISSN 1471-2164 . - doi : 10.1186/1471-2164-13-299 .
  8. Scherf Matthias , Klingenhoff Andreas , Werner Thomas. Meget specifik lokalisering af promotorregioner i store genomiske sekvenser af PromoterInspector: en ny kontekstanalysetilgang  //  Journal of Molecular Biology. - 2000. - Marts ( bd. 297 , nr. 3 ). - S. 599-606 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.2000.3589 .
  9. Robison Keith , McGuire Abigail Manson , Church George M. Et omfattende bibliotek af DNA-bindingssted-matricer for 55 proteiner påført det komplette Escherichia coli K-12-genom 1 1Redigeret af R. Ebright  //  Journal of Molecular Biology. - 1998. - November ( bind 284 , nr. 2 ). - S. 241-254 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.1998.2160 .
  10. Burden S. , Lin Y.-X. , Zhang R. Forbedring af promotorforudsigelse Forbedring af promotorforudsigelse for NNPP2.2-algoritmen: et casestudie ved brug af Escherichia coli DNA-sekvenser   // Bioinformatik . - 2004. - 28. september ( bind 21 , nr. 5 ). - s. 601-607 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/bti047 .
  11. Di Salvo Marco , Pinatel Eva , Talà Adelfia , Fondi Marco , Peano Clelia , Alifano Pietro. G4PromFinder: en algoritme til forudsigelse af transkriptionspromotorer i GC-rige bakterielle genomer baseret på AT-rige elementer og G-quadruplex-motiver  //  BMC Bioinformatics. - 2018. - 6. februar ( bd. 19 , nr. 1 ). — ISSN 1471-2105 . - doi : 10.1186/s12859-018-2049-x .
  12. Cavin Perier R. The Eukaryotic Promoter Database EPD  //  Nucleic Acids Research. - 1998. - 1. januar ( bind 26 , nr. 1 ). - S. 353-357 . — ISSN 1362-4962 . doi : 10.1093 / nar/26.1.353 .
  13. Dreos René , Ambrosini Giovanna , Groux Romain , Cavin Périer Rouaïda , Bucher Philipp. Den eukaryote promotordatabase i sit 30. år: fokus på ikke-hvirveldyr  //  Nucleic Acids Research. - 2016. - 28. november ( bd. 45 , nr. D1 ). -P.D51- D55 . — ISSN 0305-1048 . doi : 10.1093 / nar/gkw1069 .