Konsensussekvens

En konsensussekvens er en kunstig DNA- eller RNA-sekvens, der i hver position indeholder det nukleotid , der oftest findes i flere homologe sekvenser. Det er resultatet af flere sekvensopstillinger, hvor homologe sekvenser sammenlignes med hinanden. Sådan information er vigtig, når man studerer DNA- eller RNA-bindende proteiner, såsom transkriptionsfaktorer eller RNA-polymerase [1] .

Biologisk betydning

Proteinbindingsstedet repræsenteret af konsensussekvensen kan være en kort sekvens af nukleotider, der forekommer flere gange i genomet og menes at spille den samme rolle forskellige steder. For eksempel genkender mange transkriptionsfaktorer visse mønstre i promotorerne af disse gener , som de regulerer. Tilsvarende har restriktionsenzymer typisk palindromiske konsensussekvenser, normalt svarende til det sted, hvor de skærer DNA . Transposoner virker stort set på samme måde ved at identificere målsekvenser til transposition. Endelig kan splejsningssteder (sekvensen umiddelbart omkring exon  -intron-grænserne) også betragtes som konsensussekvenser. En konsensussekvens er således en model af et formodet DNA-bindingssted: den opnås ved at matche alle kendte eksempler på et bestemt genkendelsessted og er defineret som en idealiseret sekvens, der repræsenterer den dominerende base i hver position. Alle virkelige eksempler bør ikke adskille sig fra konsensus med mere end et par substitutioner, men en sådan optælling kan føre til uoverensstemmelser. Enhver mutation, der tillader et muteret nukleotid i hovedpromotorsekvensen at ligne konsensussekvensen mere, er kendt som en op-mutation. Denne form for mutation gør normalt promotoren stærkere, og dermed danner RNA-polymerasen en stærkere binding med det DNA, den ønsker at transskribere, og transskription aktiveres. I modsætning hertil er mutationer, der ødelægger konserverede nukleotider i konsensussekvensen, kendt som nedmutationer. Disse typer af mutationer undertrykker transkription, fordi RNA-polymerasen ikke længere kan binde så tæt til hovedpromotorsekvensen. Konsensussekvens [2] .

Cis-regulatoriske elementer af DNA og RNA

Cis-virkende regulatoriske elementer (cis-regulatoriske elementer): DNA- eller RNA- regioner , der binder til regulatoriske molekyler, sædvanligvis proteiner, og indeholder signaler til regulering af funktionen af ​​gener placeret på det samme DNA-molekyle som det regulatoriske element. De cis-regulatoriske elementer består af en række korte DNA-sekvenser - moduler, der gentages i forskellige kombinationer i forskellige regulatoriske elementer. Sådanne moduler inkluderer for eksempel TATA-boksen (konsensussekvens TATA(A/T)A(A/T)), CAAT-boksen (konsensus GGCCAATCT), GC-boksen (konsensus GGGCGG), oktamerboks (konsensus ATTTGCAT) og andre [ Sverdlov E. D. 2009 ].

DNA-region: CAAT-boks (promotorsekvens)

CAAT-boks: konsensussekvens GGCCAATCT er en kort DNA-sekvens, et modul, der gentager sig i regulatoriske elementer.

CCAAT-sekvensen (CAAT) forekommer i promotorzonen af ​​forskellige vævsspecifikke gener: i position -80-50 af forskellige globin -gener , i thyroglobulingenet og i andre gener. CAAT - Blokken er placeret i samme område som GC-blokken.

CCAAT-motivets rolle kan være ret vigtig i reguleringen af ​​aktiviteten af ​​globin-gener aktiveret eller undertrykt på visse udviklingsstadier. Undertrykkelse af føtal nu-globinsyntese i en voksen organisme fjernes i tilfælde af en mutationel substitution af et nukleotid i CCAAT-sekvensen. Mutationen fører til den såkaldte arvelige persistens (bevarelse af syntesen af ​​føtalt nu-globin hos voksne).

Der er intet GC-motiv i promotorerne af globin-gener [3] .

TATA-boks (Hogness-boks, TATA-boks)

TATA-boks (Hogness-boks, TATA-boks): i eukaryoter, en konsensus-DNA-sekvens, der er rig på A-T-par (TATA (A/T) A (A/T)), sædvanligvis indeholdende 7 eller 8 nukleotider og placeret omkring 25 basepar før transkriptionsstartstedet. Modul gentaget i regulatoriske elementer; tjener som et bindingssted for RNA-polymerase.

Positionen af ​​TATA-boksen definerer strengt stedet for transkriptionsinitiering, dvs. 5'-enden af ​​transkriptet. Når TATA-boksen er beskadiget eller fjernet, dannes et sæt RNA-molekyler med forskellige 5'-ender. Individuelle nukleotidsubstitutioner i TATA-boksen kan føre til et kraftigt fald i transskriptionseffektiviteten.

Promotorzonen af ​​nogle gener (f.eks. genet for hydroxymethylglutaryl KoA-reduktase, et nøgleenzym i human kolesterolbiosyntese ) indeholder ikke en TATA-boks, og transkriptionen starter fra flere forskellige steder. De resulterende RNA'er adskiller sig i deres 5'-ender i regionen af ​​den utranslaterede ledersekvens . Det er muligt, at forskellige lederzoner bestemmer arten af ​​reguleringen af ​​genekspression på translationsniveau [4] .

Noter

  1. Nukleinsyrer: fra A til Z / B. Appel [et al.]. - M. : Binom: Videnlaboratoriet, 2013. - 413 s. - 700 eksemplarer.  - ISBN 978-5-9963-0376-2 .
  2. Victor Kusnetsov, Martin Landsberger, Jörg Meurer, Ralf Oelmüller. Samlingen af ​​CAAT-box-bindingskomplekset ved en fotosyntese-genpromoter er reguleret af lys, cytokinin og stadiet af plastiderne  //  Journal of Biological Chemistry. — 1999-12. — Bd. 274 , udg. 50 . — S. 36009–36014 . doi : 10.1074 / jbc.274.50.36009 . Arkiveret 25. maj 2021.
  3. Thomas Lathrop Stedman. Stedmans medicinske ordbog. . — 28. udg. - Philadelphia: Lippincott Williams & Wilkins, 2006. - 1 bind (diverse sider) s. - ISBN 0-7817-3390-1 , 978-0-7817-3390-8, 978-0-7817-6450-6, 0-7817-6450-5.
  4. Xu et al. Kernepromotorspecifik genregulering: TATA-boksselektivitet og initiatorafhængig bi-direktionalitet af serumresponsfaktoraktiveret transkription // Biochimica et Biophysica Acta  (  BBA) - Gene Regulatory Mechanisms. - 2016. - Bd. 4 . - S. 553-63 . - doi : 10.1016/j.bbagrm.2016.01.005 .