Computational genomics bruger computational analyse til at dechifrere genomsekvenser og relaterede data [1] , herunder DNA- og RNA-sekvenser . Computational genomics kan også defineres som en gren af bioinformatik , men med den forskel, at opmærksomheden rettes mod analysen af komplette genomer (i stedet for individuelle gener) for at forstå principperne for, hvordan forskellige DNA'er styrer en organisme på molekylært niveau [2] .
Computational genomics begyndte sin udvikling samtidig med bioinformatik. I 1960'erne oprettede Margaret Dayhoff og andre ved National Biomedical Research Foundation databaser med forskellige proteinsekvenser til evolutionær forskning [3] . Deres undersøgelse byggede et fylogenetisk træ, der bestemte de ændringer, der var nødvendige for, at et bestemt protein kunne udvikle sig til et andet protein. Dette førte til oprettelsen af en substitutionsmatrix, der evaluerer sandsynligheden for, at et protein binder til et andet.
Begyndende i 1980'erne begyndte genomsekvensdatabaser at dukke op, men der opstod nye udfordringer med at finde og sammenligne data om individuelle gener. I modsætning til tekstsøgningsalgoritmer, der bruges på hjemmesider, er det nødvendigt at identificere sekvenser, der ikke nødvendigvis er identiske, men blot ens, når man leder efter genetisk lighed. Dette førte til fremkomsten af Needleman-Wunsch-algoritmen , som er en dynamisk programmeringsalgoritme til at sammenligne sæt af aminosyresekvenser med hinanden ved hjælp af substitutionsmatricer opnået i en tidligere undersøgelse af M. Deyhoff. Senere dukkede BLAST - algoritmen op , som giver mulighed for hurtige og optimerede søgninger i databaser med gensekvenser. BLAST og dens modifikationer er blandt de mest udbredte algoritmer til dette formål [4] .
Fremkomsten af udtrykket "computational genomics" falder sammen med fremkomsten af komplette kommenterede genomer i anden halvdel af 1990'erne. Den første årlige konference om computational genomics blev arrangeret af forskere fra Institute for Genomic Research (TIGR) i 1998, hvilket gav et forum for dette speciale og effektivt adskiller dette videnskabsområde fra de mere generelle områder inden for genomics eller computational biologi [5] [ 6] . For første gang i den videnskabelige litteratur blev dette udtryk ifølge MEDLINE brugt et år tidligere (i tidsskriftet Nucleic Acids Research [7] ).