Evolutionær afstand er en størrelse, der karakteriserer de genetiske forskelle mellem to organismer. Det findes ved at sammenligne nukleotidsekvenserne af homologe gener. Et mål for genetiske forskelle er procentdelen af nukleotid-mismatch i de tilsvarende positioner af genet [1] .
Den enkleste værdi, der karakteriserer den evolutionære afstand, er andelen af mismatchede nukleotider i en parvis sammenligning af de tilsvarende positioner i genet. Denne mængde kaldes "parvis afstand" (normalt angivet med symbolet p ).
For eksempel, når man sammenligner de følgende to områder af genet
CAGACAGTCA CA C AC T G C CAder er tre fejlparringer pr. 10 nukleotider, p = 0,3.
Parvis afstand beskriver ikke tilstrækkeligt de evolutionære forskelle mellem organismer:
Ulemperne ved den parvise afstand elimineres ved at bruge mere komplekse formler til bestemmelse af afstanden:
og andre metoder.
Jukes-Cantor-metoden [ 2] er det enkleste forsøg på at udelukke tilfældige nukleotidmatches fra overvejelse, hvis sandsynlighed er 25 %. Dette er en metode med én parameter, der bruger andelen af nukleotid-fejlparringer (dvs. parvis afstand p ) som en parameter. Afstanden beregnes ved hjælp af følgende formel
Metoden antager, at alle fire nukleotider (A, C, T, D) er til stede i DNA i samme forhold, og sandsynligheden for at erstatte et nukleotid med et andet er den samme for ethvert nukleotidpar.
Som det kan ses af formlen, giver udtrykket for p > 0,75 ikke mening (negativt udtryk under logaritmens fortegn). Dette er en ulempe ved metoden, da situationer med p > 0,75 (mere end 75% af forskellige nukleotider) i princippet ikke er udelukket.
Formlen blev foreslået i 1965, ved begyndelsen af forskning inden for molekylærbiologi, af Thomas Jukes , en professor i kemi ved University of Californiaog en studerende fra samme fakultet, Charles Cantor. I midten af 1960'erne nåede biokemisk teknologi et niveau, hvor det blev muligt at dechifrere individuelle fragmenter af DNA og aminosyresekvenser af proteiner. Dette gjorde det muligt ved at sammenligne nukleotidsekvenser at spore forskellige organismers evolutionære nærhed og individuelle arters evolutionære veje. Jukes og Kantor var blandt pionererne i formaliseringen af denne metode, og Kantor blev forfatter til et af de første computerprogrammer til analyse af nukleotidsekvenser [3] .
Som et eksempel på anvendelsen af formlen kan fragmenter af gener, der koder for humant a- og β-hæmoglobin, nævnes. Det menes, at for omkring 400 millioner år siden stammede begge gener fra det samme forfædres gen [3] .
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hæmoglobin) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hæmoglobin)Fragmentsammenligning afslører 12 forskelle pr. 30 nukleotider ( p = 0,4). En simpel uoverensstemmelsesberegning tager dog ikke højde for sandsynligheden for, at flere mutationer forekom i nogle positioner, herunder dem, der førte til genoprettelse af det oprindelige nukleotid. Jukes-Cantor-formlen giver afstand
Det følger således af formlen, at under hensyntagen til flere substitutioner, forekom 0,572·30=17 mutationer i det betragtede DNA-fragment.
Motoo Kimura foreslog en metode til at beregne afstanden, som blev kaldt "Kimura 2-parameter distance" ( engelsk Kimura 2-parameter distance, K2P ). Kimura-modellen antager, at forskellige varianter af nukleotidsubstitutioner ikke er lige sandsynlige og overvejer to typer substitutioner:
Afstanden i Kimura-modellen bestemmes af formlen
hvor P er andelen af overgange, Q er andelen af transversioner.
Tager vi som eksempel den evolutionære afstand mellem α- og β-hæmoglobingenfragmenter, får vi:
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hæmoglobin) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hæmoglobin) Q PPQ P QQ QPQ QQI Tajima- Ney -modellen er afstanden bestemt af følgende relationer [4] :
hvor
x ij — relative frekvenser af nukleotidpar; g i - relative frekvenser af nukleotider.Lad os som et eksempel beregne afstanden mellem fragmenter af gener, der koder for humant α- og β-hæmoglobin.
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hæmoglobin) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hæmoglobin)Nukleotid _ |
xij _ | gi _ | ||
---|---|---|---|---|
EN | T | C | ||
EN | 10/60 = 0,167 | |||
T | 1/30 = 0,0333 | 13/60 = 0,217 | ||
C | 2/30 = 0,0667 | 3/30 = 0,100 | 15/60 = 0,250 | |
G | 1/30 = 0,0333 | 3/30 = 0,100 | 2/30 = 0,0667 | 22/60 = 0,367 |
I nogle kilder kaldes Tajima-Nei-afstanden for beregningen ved hjælp af en enklere formel
hvor
I det tilfælde, hvor alle nukleotider forekommer med samme frekvens ( gi = 0,25 ), falder denne formel sammen med Jukes-Cantor-formlen ( b = 0,75).
Beregninger ved hjælp af disse formler giver det samme eksempel