Bayesiansk tilgang i fylogenetik

Den Bayesianske tilgang inden for fylogenetik gør det muligt at opnå det mest sandsynlige fylogenetiske træ givet de oprindelige data, DNA eller proteinsekvenser for de undersøgte organismer og den evolutionære erstatningsmodel [1] . For at reducere algoritmens beregningsmæssige kompleksitet implementeres beregningen af ​​den posteriore sandsynlighed af forskellige algoritmer ved hjælp af Monte Carlo-metoden for Markov-kæder [2] . De vigtigste fordele ved den Bayesianske tilgang sammenlignet med metoder med maksimal sandsynlighedog den maksimale økonomi er beregningseffektivitet, evnen til at arbejde med komplekse evolutionsmodeller og også det faktum, at i modsætning til metoder, der peger på et enkelt bedste træ ifølge et givet kriterium, giver det dig mulighed for at vælge flere varianter af det fylogenetiske træ. med den højeste værdi af den posteriore sandsynlighed [3] .

Metodens historie og grundlæggende principper

Den Bayesianske tilgang er en udvikling af den probabilistiske metode udviklet af den engelske matematiker og præst Thomas Bayes baseret på Bayes' teorem . Denne metode blev offentliggjort i 1763 [4] , to år efter hans død. Senere blev den moderne formulering af sætningen udviklet af Pierre-Simon Laplace [1] .

I 1953 introducerede Nicholas Metropolis Monte Carlo-metoder til Markov-kæder (MCMC, Markov-kæden Monte Carlo) [5] . Fordelene ved beregningshastighed og evnen til at integrere med MCMC - metoder har gjort det muligt for den Bayesianske tilgang at blive en af ​​de mest populære metoder til statistisk inferens . Den Bayesianske tilgang har mange anvendelser inden for molekylær fylogenetik og systematik . Sammenlignet med andre metoder til at konstruere fylogenetiske træer (maksimal sparsomhed, maksimal sandsynlighed ), giver det mulighed for fylogenetisk usikkerhed, brug af a priori information og komplekse evolutionsmodeller , for hvilke traditionelle metoder har beregningsmæssige begrænsninger.

Anvendelsen af ​​den Bayesianske tilgang i fylogenetik er som følger. Hele sættet af tilladte fylogenetiske træer er beskrevet af diskrete parametre (trætopologi) og kontinuerte parametre (længder af trægrene og parametre for den evolutionære erstatningsmodel). For at beregne værdien af ​​den posteriore sandsynlighedsfordelingstæthed for et træ med topologi og parametre , givet startdata , anvendes den Bayesianske formel , hvor  er den betingede sandsynlighedsfordelingstæthed af de indledende data . Nævneren i denne formel beregnes ved hjælp af den samlede sandsynlighedsformel som en sum over integraler af produktet over , hvor  er a priori-fordelingstætheden for træer [6] . Eksplicitte analytiske beregninger ved hjælp af denne formel er ikke altid mulige, og numeriske kræver et stort antal beregninger, når man søger efter funktionens maksimum i forhold til . Anvendelsen af ​​den statistiske testmetode (også kaldet Monte Carlo-metoden) på Markov-kæder gør det muligt at opnå omtrentlige værdier af de posteriore sandsynligheder og reducere beregningskompleksiteten af ​​algoritmen til at finde det mest sandsynlige træ med den maksimale posteriore sandsynlighed kriterium.

I MCMC-metoder beregnes den bageste tæthed ved at simulere arbejdet i en Markov-kæde, hvis tilstande er fylogenetiske træer [2] . Beregningen af ​​den posteriore tæthed udføres som hyppigheden af ​​at besøge disse tilstande i steady state. Det mest sandsynlige træ bestemmes af den maksimale frekvens for den hyppigst besøgte stat, eller flere af de hyppigst besøgte. MCMC-metoder kan beskrives i to trin: den første bruger en stokastisk mekanisme til at opnå en ny tilstand af Markov-kæden ; på den anden, beregnes sandsynligheden for overgang til denne tilstand, og en tilfældig tilstandsændringshændelse afspilles. Denne procedure gentages tusinder eller millioner af gange. Den brøkdel af tid, som et enkelt træ besøges under en Markov-kæde, er en ret præcis tilnærmelse af dets bageste sandsynlighed. De mest almindeligt anvendte algoritmer, der bruges i MCMC-metoder, omfatter Metropolis-Hastings-algoritmen, Metropolis-algoritmen i kombination med MCMC (MC³) og den LOKALE algoritme for Larget og Simon.

Metropolis-Hastings algoritme

Metropolis-Hastings-algoritmen [7] er en af ​​de mest almindelige MCMC-metoder og er en modificeret version af Metropolis-algoritmen [5] af Hastings . Metropolis-Hastings-algoritmen bygger en tilfældig implementering af en Markov-kæde, hvis tilstande er fylogenetiske træer. Når man simulerer en tilstandsændring, foretages der ved hvert trin en overgang fra et træ til et andet ved at ændre topologien eller parametrene for den evolutionære model i henhold til en bestemt regel. Algoritmen består af følgende trin [8] :

  1. et starttræ med en tilfældig topologi og modelparametre vælges og accepteres som det aktuelle;
  2. et træ er bygget med en ny topologi eller nye modelparametre;
  3. forholdet mellem sandsynligheder (eller sandsynlighedstæthedsfunktioner ) for det nye træ og det gamle træ beregnes :

(ved hjælp af den betingede sandsynlighed eller fordelingstæthed for givne indledende data );

  1. derefter gentages processen fra trin 2) n gange, indtil den når ligevægtsfordelingen .

Den originale Metropolis-algoritme antager, at sandsynligheden for overgange fra træ til træ og tilbage er lige store. Hvis denne betingelse ikke er opfyldt, så anvendes Hastings-korrektionerne, som består af følgende: overgangssandsynligheden beregnes ved formlen , hvor  er den fælles fordelingsfunktion.

Metropolis algoritme kombineret med MSMS

Den Metropolis-koblede MCMC (MC³) [9] , også kendt som den parallelle annealing-algoritme , er en modificeret version af Metropolis-Hastings-algoritmen for Markov-kæder med komplekse og multimodale tilstandssandsynlighedsfordelinger. I disse tilfælde kan algoritmer til heuristisk træsøgning ved hjælp af MP (maximum parsimony method), ML ( maximum likelihood method ) og ME (minimum evolution method), samt MCMS, nå et lokalt maksimum, hvilket vil føre til en forkert tilnærmelse af den posteriore sandsynlighedsfordelingstæthed . MC³-algoritmen, ved at blande Markov-kæder med forskellige temperaturer, gør det muligt at tilnærme fordelingen af ​​posteriore sandsynligheder korrekt og undgå at falde i lokale optima.

Algoritmen kører kæder parallelt, ved iterationer i hver kæde med forskellige stationære fordelinger , , hvor den første fordeling med måltætheden kaldes en kold kæde, og andre kæder med fordelinger kaldes opvarmet [10] . Fordelingstæthederne af opvarmede kredsløb har formen:

hvor  er temperaturfaktoren.

Forhøjelse af tætheden til en effekt ved har den effekt, at fordelingen udjævnes, analogt med opvarmning af et metal. I denne fordeling er det lettere at bevæge sig mellem toppe adskilt af dale end i den oprindelige fordeling. Efter hver iteration instruerer algoritmen at udføre en tilstandsudveksling mellem to tilfældigt udvalgte kredsløb ved at bruge det trin, der er foreslået af Metropolis. Udvekslingen mellem staterne og sker med sandsynlighed:

hvor  er den aktuelle tilstand i kæden nummereret , [11] .

Heuristisk set vil varme kæder ret nemt besøge lokale toppe, og statsudveksling mellem kæder vil tillade, at en kold kæde nogle gange kan hoppe over dale. Hvis for lille, vil tilstandsudveksling sjældent forekomme, så algoritmen bruger flere kredsløb med forskellige temperaturfaktorer for at forbedre blandingen [6] .

For at opnå en stationær sandsynlighedsfordeling anvendes kun tilstandene fra kølekæden, og tilstandene fra de opvarmede kredsløb kasseres.

GLOBALE og LOKALE algoritmer

For at generere en ny tilstand af en Markov-kæde er der forskellige probabilistiske måder at ændre træer på, for eksempel gennemskæring med efterfølgende genbinding, grenudskiftning, udskiftning med et nærmeste nabotræ. Algoritmerne LOCAL [2] og GLOBAL [12] tilbyder en anden måde at bygge et nyt træ på baseret på det nuværende ved at ændre topologi og grenlængder. Dette resulterer i en betydelig reduktion i beregninger for store træer sammenlignet med bootstrap- algoritmer for maksimal sandsynlighed og maksimal sparsomhed .

Den generelle idé er, at et træ er repræsenteret som følgende parametre: træets topologi og længden af ​​dets grene, samt parametrene for erstatningsmodellen . Når tilstandene i Markov-kæden ændres, udføres successive trin, hvor enten træets topologi og længden af ​​dets grene ændres separat, eller kun parametrene for udskiftningsmodellen ændres. Beslutningen om at flytte til et nyt træ som den nuværende tilstand af Markov-kæden træffes på samme måde som i Metropolis-Hastings-algoritmen , men tærskelsandsynlighedsværdien beregnes ved hjælp af parametrene for det modificerede træ.

I den GLOBALE algoritme [12] introduceret af Mau, Newton og Larget i 1999 ændres alle trægrenlængder med en lille mængde i hver cyklus. Larget og Simon LOCAL algoritmen [2] involverer ændring af et træ i et lille kvarter af en tilfældigt udvalgt indre gren af ​​træet.

Konstruktionen af ​​et nyt træ i den LOKALE algoritme ved ændring af topologi og længder af grene udføres i henhold til følgende regel: en vilkårlig indre kant af træet med hjørner og vælges med lige stor sandsynlighed . På grund af det faktum, at det fylogenetiske træ skal være binært, og kanten er intern, skal hver af hjørnerne have to tilstødende. Tilstødende hjørner for er vilkårligt betegnet med bogstaver og , og tilstødende knudepunkter for  er angivet med bogstaver og . Yderligere, for toppunkterne og , er det lige sandsynligt, at en tilstødende vil blive valgt, for eksempel, og , og vejen mellem hjørnerne og , der består af tre kanter, tages i betragtning. Længderne af disse kanter modificeres proportionalt ved at gange med et tilfældigt tal i henhold til reglen , hvor  er den gamle vejlængde,  er den nye vejlængde,  er en ensartet fordelt tilfældig variabel på segmentet og  er en positiv justerbar parameter. Det næste trin i at ændre træet består i at løsne et af hjørnerne, eller , valgt med lige stor sandsynlighed, og vedhæfte det på et punkt, der er tilfældigt valgt i henhold til en ensartet lov på stien fra toppunkt til toppunkt , sammen med dens undergren. Med en sådan modifikation er det muligt at ændre træets topologi, hvis rækkefølgen af ​​hjørnerne og langs stien fra til har ændret sig, ellers ændres træets topologi ikke. Hastings-korrektionen er lig med kvadratet på forholdet mellem længderne af de nye og gamle stier: .

Ved ændring af modelparametrene overvejer algoritmen to muligheder: i den første mulighed, når en parameter er begrænset af værdisættet , beregnes den nye værdi af parameteren ved at tilføje en ensartet fordelt tilfældig variabel fra intervallet . Hvis den nye værdi er uden for det tilladte område [2] , så afspejles resten inde i dette segment. Hastings-korrektionen tages lig med 1. Den anden mulighed er tilfældet, når et sæt parametre ændres, hvis sum er lig med en konstant. I dette tilfælde vælges et nyt sæt værdier for disse parametre fra en Dirichlet-distribution centreret om de aktuelle værdier af parametrene. Hastings-korrektionen beregnes som forholdet mellem Dirichlet-densiteterne og de nye og gamle parametre.

Kritik og diskussion

MRBAYES-program

MrBayes Arkiveret 25. september 2018 på Wayback Machine  er et gratis program, der udfører Bayesiansk fylogenianalyse. Oprindeligt skrevet af John Huelsenbeck og Frederik Roncust i 2001 [16] . Da Bayesianske metoder blev populære, begyndte mange molekylære fylogenetikere at vælge MrBayes. Programmet bruger standard MCMC-algoritmen og Metropolis-algoritmen forbundet med MCMC.

MrBayes bruger MSMS til at tilnærme de posteriore sandsynligheder for træer [5] . Brugeren kan ændre antagelser om substitutionsmodellen, tidligere sandsynligheder og detaljer i MS-analysen. Programmet giver dig også mulighed for at fjerne og tilføje taxa og symboler til analyse. En lang række substitutionsmodeller kan bruges i programmet - fra standard DNA 4x4 substitutionsmodellen, også kaldet JC69, hvor basefrekvenser antages at være ens og alle nukleotidsubstitutioner forekommer med lige stor sandsynlighed [17] , til de mest generelle GTR-model, i hvilken og basisfrekvenser og substitutionssandsynligheder. Programmet omfatter også adskillige 20x20 aminosyresubstitutionsmodeller, kodon- og dublet-DNA-substitutionsmodeller. Programmet tilbyder forskellige metoder til at svække antagelsen om ens substitutionshastigheder ved nukleotidpositioner [18] . MrBayes kan også udlæse arvelige tilstande, der indeholder usikkerheden af ​​det fylogenetiske træ og modelparametre.

MrBayes 3 [19]  er en fuldstændig omdannet og omvendt manipuleret version af det originale MrBayes-program. Den vigtigste nyskabelse er programmets evne til at tilpasse sig datasættenes heterogenitet. Denne struktur giver brugeren mulighed for at blande modeller og drage fordel af ydeevnen af ​​Bayesiansk MCMC-analyse, når de håndterer forskellige typer data (f.eks. proteiner, nukleotider, morfologiske data). Som standard bruger programmet Metropolis MSMS-algoritmen.

MrBayes 3.2 er en ny version af MrBayes udgivet i 2012 [20] . Den nye version giver brugeren mulighed for at køre flere analyser parallelt. Det giver også hurtigere sandsynlighedsberegninger og mulighed for at bruge GPU-ressourcer til at udføre disse beregninger. Version 3.2 giver flere outputmuligheder, der er kompatible med FigTree og andre træfremvisere.

Liste over programmer, der bruger den Bayesianske tilgang

Navnet på programmet Beskrivelse Metode Forfatterne Link
Armadillo Workflow Platform Et program designet til fylogenetisk og generel bioinformatikanalyse Afledning af fylogenetiske træer ved hjælp af ML, MP, Bayesiansk tilgang osv. E. Lord, M. Leclercq, A. Boc, AB Diallo, V. Makarenkov [21] https://web.archive.org/web/20161024081942/http://www.bioinfo.uqam.ca/armadillo/ .
Bali Phy At få justering og træ samtidigt baseret på Bayesiansk tilgang Bayesiansk slutning af justeringer og fylogenetiske træer MA Suchard, BD Redelings [22] http://www.bali-phy.org Arkiveret 22. marts 2021 på Wayback Machine
BATWING Træinferens ved Bayesiansk metode med oprettelse af interne noder Bayesiansk analyse, demografisk historie, befolkningsopdelingsmetode IJ Wilson, D. Weale, D. Balding [23] http://heidi.chnebu.ch/doku.php?id=batwing Arkiveret 5. maj 2016 på Wayback Machine
Bayes Phylogenies Bayesiansk træinferens ved hjælp af Monte Carlo-metoder for Markov-kæder og Metropolis kombineret med MCMC Bayesiansk analyse, flere, blandede modeller (med automatisk partitionering) M. Pagel, A. Meade [24] http://www.evolution.rdg.ac.uk/BayesPhy.html Arkiveret 19. februar 2020 på Wayback Machine
PhyloBayes/PhyloBayes MPI MCMC sampler til fylogenetiske rekonstruktioner. MCMC, en probabilistisk CAT-model, der overvejer stedspecifikke nukleotider eller aminosyrer N. Lartillot, N. Rodrigue, D. Stubbs, J. Richer [25] https://web.archive.org/web/20181218053945/http://www.phylobayes.org/
DYR Molekylær sekvensanalyse med MCMC (Bayesian Evolutionary Analysis Sampling Trees) Bayesiansk analyse, afslappet molekylært ur, demografisk historie A. J. Drummond, A. Rambaut & M. A. Suchard [26] http://beast.bio.ed.ac.uk Arkiveret 22. december 2007 på Wayback Machine
BUCKy Bayesiansk matchning af fylogenetiske træer for gener Bayesiansk matchning ved hjælp af modificeret grådig konsensus for urodfæstede kvartetter C. Ané, B. Larget, D.A. Baum, SD Smith, A. Rokas, B. Larget, SK Kotha, CN Dewey, C. Ané [27] http://www.stat.wisc.edu/~ane/bucky/ Arkiveret 24. februar 2019 på Wayback Machine
Geneious (MrBayes plugin) Værktøjer til undersøgelse af genomer og proteomer Neighbor-joining , UPGMA, MrBayes plugins, PHYML, RAxML, FastTree, GARLi, PAUP* AJ Drummond, M. Suchard, V. Lefort et al. [28] http://www.geneious.com Arkiveret 26. januar 2021 på Wayback Machine
TOPALi Fylogenetisk slutning Fylogenetisk modelvalg, Bayesiansk analyse og maksimal sandsynlighedsevaluering af fylogenetiske træer, bestemmelse af lokaliteter under positiv selektion, analyse af positionen af ​​rekombinationspunkter I.Milne, D.Lindner og andre [29] http://www.topali.org Arkiveret 9. april 2021 på Wayback Machine

Ansøgninger

Den Bayesianske tilgang er meget brugt af molekylære fylogenetikere til forskellige anvendelser:

Noter

  1. 1 2 Laplace, P. Memoir on the Probability of the Causes of Events  //  Statistical Science: Online Journal. - 1986. - Iss. 1(3) . - ISSN 359-378 .
  2. 1 2 3 4 5 Larget, B. & Simon, D. L. Markov Chain Monte Carlo-algoritmer til Bayesiansk analyse af fylogenetiske træer. (engelsk)  // Mol. Biol. Evol. : online magasin. - 1999. - Iss. 16 . — ISSN 750–759 .
  3. Mark Holder1 & Paul O. Lewis1. Fylogenisk estimering: traditionelle og Bayesianske tilgange  //  Nature Reviews Genetics: online tidsskrift. - 2003. - Iss. 4 . — ISSN 275-284 . doi : 10.1038 / nrg1044 .
  4. Bayes Thomas, Price Richard. Et essay om at løse et problem i tilfældighedslæren. Af afdøde Rev. Hr. Bayes, meddelt af Mr. Price, i et brev til John Canton, AMFRS  //  Philosophical Transactions of the Royal Society of London: online journal. - 1763. - Iss. 53 . - doi : 10.1098/rstl.1763.0053 . Arkiveret fra originalen den 10. april 2011.
  5. 1 2 3 N. Metropolis, A. W. Rosenbluth, M. N. Rosenbluth, A. H. Teller, E. Teller. [ http://aip.scitation.org/doi/abs/10.1063/1.1699114 Ligning af tilstandsberegninger ved hurtige computermaskiner]  //  The Journal of Chemical Physics: onlinetidsskrift. - Macmillan Publishers Limited, 1953. - Iss. 21 . - ISSN 1087-1092 . - doi : 10.1063/1.1699114 .
  6. 1 2 Rannala B., Yang Z. Sandsynlighedsfordeling af molekylære evolutionære træer: en ny metode til fylogenetisk inferens. (engelsk)  // J. Mol. Evol. : online magasin. - 1996. - Iss. 43 . — ISSN 304–311 .
  7. Hastings, WK Monte Carlo prøveudtagningsmetoder ved hjælp af Markov-kæder og deres applikationer  //  Biometrika : online journal. - Oxford Academic, 1970. - Iss. 57 . — ISSN 97-109 .
  8. Felsenstein, J. Inferring phylogenies. - Massachusetts: Sinauer Associates, 2004. - 664 s.
  9. Geyer, CJ Markov-kæden Monte Carlo maksimale sandsynlighed. (eng.)  // Computing Science and Statistics: Proceedings of the 23rd Symposium on the Interface. : online magasin. - Interface Foundation, Fairfax Station, 1991.
  10. Li, S., Pearl, DK & Doss, H. Phylogenetic tree construction using Markov Chain Monte Carlo. (engelsk)  // J. Am. stat. Assoc. : online magasin. - 2000. - Iss. 95 . — ISSN 493–508 .
  11. Yang, ZH & Rannala, B. Bayesiansk fylogenetisk inferens ved hjælp af DNA-sekvenser: en Markov Chain Monte Carlo-metode. (engelsk)  // Mol. Biol. Evol. : online magasin. - 1997. - Iss. 14 . — ISSN 717–724 .
  12. 1 2 Mau, B., Newton, M. og Larget, B. Bayesiansk fylogenetisk slutning via Markov-kæden Monte carlo-metoder. (engelsk)  // Biometri: online journal. - 1999. - Iss. 55(1) . — ISSN 1-12 .
  13. Garcia-Sandoval, R. Hvorfor nogle klader har lave bootstrap-frekvenser og høje Bayesianske posteriore sandsynligheder. (engelsk)  // Israel Journal of Ecology & Evolution: online tidsskrift. - 2014. - Iss. 60(1) . — ISSN 41-44 .
  14. Suzuki, Y. et al. Over troværdighed af molekylære fylogenier opnået ved Bayesiansk fylogenetik. (engelsk)  // Proc. Natl. Acad. sci. USA: online magasin. - 2002. - Iss. 99 . — ISSN 16138-16143 .
  15. Erixon, P. et al. Pålidelighed af Bayesianske posteriore sandsynligheder og bootstrap-frekvenser i fylogenetik. (engelsk)  // Syst. Biol. : online magasin. - 2003. - Iss. 52 . - ISSN 665-673 .
  16. Huelsenbeck, JP og F. Ronquist. MrBayes: Bayesiansk slutning om fylogeni. (engelsk)  // Bioinformatik: online tidsskrift. - 2001. - Iss. 17 . — ISSN 754-755 .
  17. Jukes, T.H. og Cantor, C.R. Evolution of Protein Molecules. (engelsk)  // New York: Academic Press: online tidsskrift. - 1969.
  18. Yang, Z. Maksimal sandsynlighed estimering af fylogeni fra DNA-sekvenser, når substitutionshastigheder varierer fra steder til sted. (engelsk)  // Mol. Biol. Evol. : online magasin. - 1993. - Iss. 10 . - ISSN 1396-1401 .
  19. Ronquist F., Huelsenbeck JP Mrbayes 3: Bayesiansk fylogenetisk inferens under blandede modeller. (engelsk)  // Bioinformatik: online tidsskrift. - 2003. - Iss. 19 . — ISSN 1572-1 .
  20. Ronquist F., Teslenko M., Van Der Mark P., Ayres DL, Darling A., Hhna S., Larget B., Liu L., Suchard MA, Huelsenbeck J. Mrbayes 3.2: Efficient bayesian phylogenetic inference and model choice på tværs af et stort modelrum. (engelsk)  // Syst. Biol. : online magasin. - 2012. - Iss. 61 . — ISSN 539-542 .
  21. Lord, E., Leclercq, M., Boc, A., Diallo, AB, Makarenkov, V. Armadillo 1.1: An Original Workflow Platform for Designing and Conducting Phylogenetic Analysis and Simulations. (eng.)  // PLoS ONE: onlinemagasin. - 2012. - Iss. 7(1) . - doi : 10.1371/journal.pone.0029903 .
  22. Suchard, MA og Redelings, BD BAli-Phy: simultan Bayesian inference of alignment and phylogeny  //  Bioinformatics: online journal. - 2006. - Iss. 22 . — ISSN 2047-2048 .
  23. Wilson, I., Weale, D. og Balding, M. Inferenser fra DNA-data: befolkningshistorier, evolutionære processer og retsmedicinske matchsandsynligheder. (engelsk)  // Journal of the Royal Statistical Society: Series A (Statistics in Society): online tidsskrift. - 2003. - Iss. 166 . — ISSN 155-188 .
  24. Pagel, M. og Meade, A. Bayesiansk analyse af korreleret udvikling af diskrete karakterer ved Markov-kæden Monte Carlo med reversibelt spring. (engelsk)  // American Naturalist: online journal. - 2006. - Iss. 167 . — ISSN 808-825 .
  25. Lartillot N., Philippe H. En bayesiansk blandingsmodel for heterogeniteter på tværs af stedet i aminosyreerstatningsprocessen. (engelsk)  // Molecular Biology and Evolution : online tidsskrift. - 2004. - Iss. 21(6) . — ISSN 1095-1109 .
  26. Drummond, AJ, Rambaut, A. Beast: Bayesiansk evolutionær analyse ved prøveudtagning af træer. (engelsk)  // BMC Evol Biol. : online magasin. - 2007. - Iss. 7:214 .
  27. Ané, C., Larget, B., Baum, DA, Smith, SD, Rokas, A. Bayesiansk estimering af konkordans blandt gentræer. (engelsk)  // Molecular Biology and Evolution : online tidsskrift. - 2007. - Iss. 24(2) . - ISSN 412-426 .
  28. Kearse, M., Moir, R., Wilson, A., Stones-Havas, S., Cheung, M., Sturrock, S., Buxton, S., Cooper, A., Markowitz, S., Duran, C., Thierer, T., Ashton, B., Mentjies, P., & Drummond, A. Geneious Basic: en integreret og udvidelig desktopsoftwareplatform til organisering og analyse af sekvensdata. (engelsk)  // Bioinformatik: online tidsskrift. - 2012. - Iss. 28(12) . — ISSN 1647-1649 .
  29. Milne, I., Lindner, D., Bayer, M., Husmeier, D., McGuire, G., Marshall, DF og Wright, F. TOPALi v2: en rig grafisk grænseflade til evolutionære analyser af flere justeringer på HPC-klynger og multi-core desktops. (engelsk)  // Bioinformatik: online tidsskrift. - 2008. - Iss. 25(1) . — ISSN 126-127 .
  30. Alonso, R., Crawford, AJ & Bermingham, E. Molekylær fylogeni af en endemisk stråling af cubanske tudser (Bufonidae: Peltophryne) baseret på mitokondrie- og nukleare gener. (engelsk)  // Journal of Biogeography : online tidsskrift. - 2011. - Iss. 39(3) . - ISSN 434-451 .
  31. Antonelli, A., Sanmart.n, I. Massextinction , Gradual Cooling, or Rapid Radiation? Rekonstruering af den spatiotemporale udvikling af den antikke angiosperm-slægt Hedyosmum (Chloranthaceae) ved hjælp af empiriske og simulerede tilgange. (engelsk)  // Syst. Biol. : online magasin. - 2011. - Iss. 60(5) . — ISSN 596-615 .
  32. Bacon, CD, Baker, WJ, Simmons, MP. Miocæn-spredning driver ø-stråling i palmestammen Trachycarpeae (Arecaceae). (engelsk)  // Systematic Biology : online tidsskrift. - 2012. - Iss. 61 . - ISSN 426-442 .
  33. Särkinen, T., Bohs, L., Olmstead, RG og Knapp, S. En fylogenetisk ramme for evolutionær undersøgelse af natskyggerne (Solanaceae): et dateret træ med 1000 spidser. (engelsk)  // BMC Evolutionary Biology. : online magasin. - 2013.
  34. Ronquist, F. Bayesiansk slutning om karakterudvikling. (engelsk)  // Trends in Ecology and Evolution: online tidsskrift. - 2004. - Iss. 19 nr. 9 . - ISSN 475-481 .
  35. Schäffer, S., Koblmüller, S., Pfingstl, T., Sturmbauer, C., Krisper, G. Forfædres tilstandsrekonstruktion afslører flere uafhængige udviklinger af diagnostiske morfologiske karakterer i "Højere Oribatida" (Acari), der er i modstrid med den nuværende klassificering ordninger. (engelsk)  // BMC Evolutionary Biology: online tidsskrift. - 2010. - Iss. 10:246 .
  36. Filipowicz, N., Renner, S. Brunfelsia (Solanaceae): En slægt jævnt fordelt mellem Sydamerika og udstråling på Cuba og andre antilliske øer. (engelsk)  // Molecular Phylogenetics and Evolution : online tidsskrift. - 2012. - Iss. 64 . — ISSN 1-11 .
  37. Silvestro, D., Schnitzler, J., Liow, LH, Antonelli, A., Salamin, N. Bayesiansk estimering af arter og udryddelse fra ufuldstændige fossile forekomstdata. (engelsk)  // Syst. Biol. : online magasin. - 2014. - Iss. 63(3) . — ISSN 349-367 .
  38. Lemey, P., Rambaut, A., Drummond, AJ, Suchard, MA Bayesian Phylogeography Finds its Roots. (engelsk)  // PLoS Comput Biol: online tidsskrift. - 2009. - Iss. 5(9) .