Proteinsuperfamilien er den største gruppe af proteiner , der kan antages at have en fælles evolutionær stamfader (se homologi (biologi) ). Normalt er en superfamilie forenet i henhold til princippet om lighed mellem sekundære og tertiære strukturer ("strukturel lighed") af proteinerne inkluderet i den [1] og ifølge princippet om lighed mellem proteiners virkningsmekanisme ("mekanistisk lighed") ” eller “funktionel lighed”), på trods af at aminosyrelighedssekvenser inden for en superfamilie muligvis ikke observeres og oftest ikke observeres [2] . Superfamilier indeholder typisk flere familier af proteiner, der viser lighed i aminosyresekvenser inden for familier, men ikke mellem familier. Udtrykket "proteinklan" anvendes ofte på protease -superfamilier baseret på MEROPS-klassifikationen [2] .
Medlemmer af en protein-superfamilie, der tilhører forskellige familier, viser sædvanligvis ikke nogen signifikant eller let påviselig aminosyresekvenshomologi, men alligevel deler de lignende sekundære og tertiære strukturer og har ofte en vis funktionel lighed. Ofte er de næsten umulige eller i det mindste meget svære at tilpasse til aminosyresekvenser på grund af de hyppigt observerede insertioner og deletioner . For eksempel i PA-protease-superfamilien er ikke en enkelt aminosyrerest bevaret gennem hele superfamilien, inklusive selv de aminosyrerester, der er en del af de katalytiske triader af disse proteiner.
Og omvendt bestemmes medlemmer af individuelle familier, der er en del af en superfamilie, præcist af princippet om homologi af aminosyresekvenser (primære strukturer) af proteiner inkluderet i familien. For eksempel indbefatter PA-protease-superfamilien C04-familien af proteaser.
De sekundære og tertiære strukturer af proteiner, der direkte påvirker deres funktionalitet (for eksempel en receptors evne til at genkende ligander - agonister og antagonister , eller et enzyms evne til at katalysere visse kemiske reaktioner ) er meget mere evolutionært konserverede end aminosyren rækkefølge. Et eksempel på dette er PA-protease-superfamilien. I den udviser meget få aminosyrerester af proteiner en signifikant grad af evolutionær konservatisme, mens de karakteristiske elementer i den sekundære struktur, såvel som deres rumlige rækkefølge i tertiære strukturer, er meget højt konserverede.
Strukturelle bestillings- og tilpasningsprogrammer, såsom DALI -programmet , kan bruge de tredimensionelle sekundære og tertiære strukturer af proteiner af interesse for forskeren med deres database over proteinstrukturer for at finde proteiner med lignende foldning . Sammenligning af de tredimensionelle sekundære og tertiære strukturer af proteiner hjælper med at identificere mange tilfælde af evolutionært beslægtede (der deler en evolutionær forfader) proteiner, der ikke ville være ens ved blot at analysere og sammenligne deres primære strukturer (aminosyresekvenser).
Den katalytiske mekanisme af enzymer , der er medlemmer af superfamilien, er normalt mere eller mindre bevaret på tværs af hele superfamilien, men deres substratspecificitet kan variere ganske betydeligt på tværs af superfamilien. Som et resultat kan det endelige funktionelle formål med proteiner i kroppen variere betydeligt afhængigt af deres substratspecificitet. Det vil sige, at der muligvis ikke er nogen ekstern funktionel lighed.
Også (selv om det ikke nødvendigvis og ikke altid) har det katalytiske domæne af enzymer, der er medlemmer af superfamilien, tendens til en høj grad af konservering af aminosyresekvensen inden for dette særlige domæne (og endnu mere, den sekundære og tertiære struktur af katalytisk domæne). Men selvom aminosyresekvensen af det katalytiske domæne ikke er konserveret, kan selve den katalytiske mekanisme og/eller de sekundære og tertiære strukturer af det katalytiske domæne være konserveret.
Et eksempel på den overfamilieomfattende tilbageholdelse af den katalytiske mekanisme beskrevet ovenfor er igen PA-protease-superfamilien. Det indeholder proteiner med meget forskellige endelige funktionelle formål (dvs. der er ingen ekstern funktionel lighed) - blandt dem er der et fordøjelsesenzym chymotrypsin , et trombolytisk enzym - plasminogenaktivator , bakterie- og slangetoksiner og virale proteaser, der sikrer samlingen af virale partikler. Som nævnt ovenfor, på skalaen af denne superfamilie, er ikke en enkelt aminosyrerest evolutionært konserveret , selv i det katalytiske domæne. Og alligevel deler alle medlemmer af superfamilien betydelige ligheder i de specifikke katalytiske elementer i deres tredimensionelle strukturer. Desuden, selvom medlemmer af forskellige familier af PA-protease-superfamilien anvender forskellige nukleofiler , producerer de alle kovalent nukleofil katalytisk proteolyse af proteiner eller peptider ved en fælles katalytisk mekanisme.
Protein superfamilier afspejler begrænsningerne af vores nuværende evne til at identificere en fælles forfader [3] . Protein-superfamilier er den største evolutionært signifikante forening af lignende proteiner og gener, der i øjeblikket kan laves baseret på direkte beviser for lighed (i tilfælde af superfamilier, for det meste strukturelle og delvist mekaniske). Derfor er opdagelsen af en tredimensionel strukturel lighed mellem funktionelt og aminosyre forskellige proteiner i levende væsener, der er meget langt væk på den evolutionære stigen, et af beviserne for meget ældgamle (måske den ældste blandt dem, der generelt er tilgængelige til at studere) evolutionære begivenheder.
Nogle protein-superfamilier indeholder proteiner, der er til stede i en eller anden form i alle undersøgte levende væsener (for eksempel kaliumkanaler ), i alle kongeriger (inklusive dyr , planter , svampe , bakterier og andre prokaryoter ). Dette kan indikere, at den fælles forfader til proteinerne i disse superfamilier var proteiner til stede i den universelle fælles forfader for alle levende væsener [4] .
Medlemmer af superfamilien kan findes i forskellige typer dyr, planter, encellede skabninger ( ortologe proteiner). Samtidig er de mest evolutionært ældgamle naturligvis de medlemmer af superfamilien, der tilhører væsener, der er på de laveste trin af den evolutionære stigen. Den fælles forfader for disse proteiner er tilsyneladende den for et gammelt uddødt væsen, der var den fælles forfader til alle de arter, hvori superfamiliens proteiner findes. Studiet af orthologe proteiner inden for proteinsuperfamilier kan således give en mulighed for mere præcist at tegne arternes evolutionære træ.
Derudover kan der i den samme organisme af et dyr, plante eller encellede væsen af samme art findes flere forskellige repræsentanter for en bestemt superfamilie af proteiner (inklusive dem, der udfører forskellige funktioner). Sådanne proteiner kaldes paralogous . Disse paralogiske proteiner kan også komme fra en enkelt fælles protein-forfader, som på et eller andet trin af udviklingen duplikerede i genomet af en given art. Studiet af paraloge proteiner, deres ligheder og forskelle, hjælper med at kaste lys over vejen for funktionel udvikling af proteiner.
Adskillige biologiske databaser dokumenterer protein superfamilier, især:
Enzymer | |
---|---|
Aktivitet | |
Regulering | |
Klassifikation | |
Typer |
|