Computational genomics

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 26. juni 2013; checks kræver 6 redigeringer .

Computational genomics bruger computational analyse til at dechifrere genomsekvenser og relaterede data [1] , herunder DNA- og RNA-sekvenser . Computational genomics kan også defineres som en gren af ​​bioinformatik , men med den forskel, at opmærksomheden rettes mod analysen af ​​komplette genomer (i stedet for individuelle gener) for at forstå principperne for, hvordan forskellige DNA'er styrer en organisme på molekylært niveau [2] .

Historie

Computational genomics begyndte sin udvikling samtidig med bioinformatik. I 1960'erne oprettede Margaret Dayhoff og andre ved National Biomedical Research Foundation databaser med forskellige proteinsekvenser til evolutionær forskning [3] . Deres undersøgelse byggede et fylogenetisk træ, der bestemte de ændringer, der var nødvendige for, at et bestemt protein kunne udvikle sig til et andet protein. Dette førte til oprettelsen af ​​en substitutionsmatrix, der evaluerer sandsynligheden for, at et protein binder til et andet.

Begyndende i 1980'erne begyndte genomsekvensdatabaser at dukke op, men der opstod nye udfordringer med at finde og sammenligne data om individuelle gener. I modsætning til tekstsøgningsalgoritmer, der bruges på hjemmesider, er det nødvendigt at identificere sekvenser, der ikke nødvendigvis er identiske, men blot ens, når man leder efter genetisk lighed. Dette førte til fremkomsten af ​​Needleman-Wunsch-algoritmen , som er en dynamisk programmeringsalgoritme til at sammenligne sæt af aminosyresekvenser med hinanden ved hjælp af substitutionsmatricer opnået i en tidligere undersøgelse af M. Deyhoff. Senere dukkede BLAST - algoritmen op , som giver mulighed for hurtige og optimerede søgninger i databaser med gensekvenser. BLAST og dens modifikationer er blandt de mest udbredte algoritmer til dette formål [4] .

Fremkomsten af ​​udtrykket "computational genomics" falder sammen med fremkomsten af ​​komplette kommenterede genomer i anden halvdel af 1990'erne. Den første årlige konference om computational genomics blev arrangeret af forskere fra Institute for Genomic Research (TIGR) i 1998, hvilket gav et forum for dette speciale og effektivt adskiller dette videnskabsområde fra de mere generelle områder inden for genomics eller computational biologi [5] [ 6] . For første gang i den videnskabelige litteratur blev dette udtryk ifølge MEDLINE brugt et år tidligere (i tidsskriftet Nucleic Acids Research [7] ).

Noter

  1. Koonin EV (2001) Computational Genomics, National Center for Biotechnology Information, National Library of Medicine, NIH (PubMed ID: 11267880)
  2. Computational Genomics and Proteomics ved MIT (link ikke tilgængeligt) . Hentet 13. december 2010. Arkiveret fra originalen 22. marts 2018. 
  3. David Mount (2000), Bioinformatics, Sequence and Genome Analysis, pp. 2-3, Cold Spring Harbor Laboratory Press, ISBN 0-87969-597-8
  4. T. A. Brown (1999), Genomes, John Wiley & Sons, ISBN 0-471-31618-0
  5. [backPid]=67&cHash=fd69079f5e [https://web.archive.org/web/20170107160058/http://www.jcvi.org/cms/press/press-releases/full-text/archive/2004// article/computational-genomics-conference-to-attract-leading-scientists/?tx_ttnews[backPid]=67&cHash=fd69079f5e Arkiveret 7. januar 2017 på Wayback Machine The 7th Annual Conference on Computational Genomics (2004)]
  6. The 9th Annual Conference on Computational Genomics (2006) Arkiveret 12. februar 2007.
  7. A. Wagner (1997), A computational genomics approach to the identification of gene networks, Nucleic Acids Res., Sep 15;25(18):3594-604, ISSN 0305-1048