Gen-ontologi

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 30. september 2017; checks kræver 15 redigeringer .

"Gene Ontology" ( Eng. Gene Ontology , eller GO ) er et bioinformatikprojekt dedikeret til skabelsen af en samlet terminologi til annotering af gener og genprodukter fra alle biologiske arter [1] .

Målet med projektet er at vedligeholde og udfylde en vis liste over attributter for gener og deres produkter, kompilere annoteringer af gener og produkter, udvikle værktøjer til at arbejde med projektdatabasen , samt til at analysere nye eksperimentelle data, især analysere repræsentationen af funktionelle grupper af gener . Det er værd at bemærke, at GO-projektet skabte et markup-sprog til klassificering af data (information om gener og deres produkter, det vil sige RNA og proteiner, samt deres funktioner), som giver dig mulighed for hurtigt at finde systematisk information om genprodukter [2 ] [3] [4] .

"Gene Ontology" er en del af et større klassifikationsprojekt - "Open Biomedical Ontologies" ( OBO ) [5] .

Historie og nuværende tilstand

Ontologier i datalogi bruges til at formalisere visse vidensområder ved hjælp af et system af data om objekter fra den virkelige verden og relationer mellem dem (den såkaldte vidensbase ). I biologi og beslægtede discipliner er problemet med manglen på en universel standard for terminologi opstået. Udtryk , der udtrykker lignende begreber , men bruges til forskellige biologiske arter , forskellige forskningsområder eller endda inden for forskellige grupper af videnskabsmænd, kan have fundamentalt forskellige betydninger, hvilket gør dataudveksling vanskelig. I denne henseende var opgaven for Gene Ontology-projektet at skabe en ontologi af termer, der afspejler egenskaberne af gener og deres produkter og er anvendelige på alle organismer [2] [3] [4] .

"Gene Ontology" blev skabt i 1998 af et konsortium af videnskabsmænd, som studerede genomerne af tre modelorganismer : Drosophila melanogaster (frugtflue), Mus musculus (mus) og Saccharomyces cerevisiae (bagegær) [6] . Siden da har mange databaser for andre modelorganismer tilsluttet sig GO-konsortiet, og har derved ikke kun bidraget til udvidelsen af annotationsdatabasen, men også til oprettelsen af tjenester til visning og anvendelse af data.

GO Consortium ( GOC ) er et sæt biologiske databaser og forskningsgrupper, der er aktivt involveret i Gene Ontology-projektet [7] . Det omfatter adskillige databaser for forskellige modelorganismer, generelle proteindatabaser, softwareudviklingsteams og Gene Ontology-redaktører.

Gene Ontology er et storstilet og hurtigt udviklende projekt. Fra september 2011 indeholdt Gene Ontology mere end 33 tusinde termer og omkring 12 millioner annoteringer af genprodukter gældende for mere end 360 tusinde levende organismer [2] . Efter 2016 oversteg antallet af termer 44 tusinde kopier, mens antallet af organismer annoteret i denne videnbase oversteg 460 tusinde individer [3]

I løbet af de sidste par år har GO-konsortiet implementeret en række ontologiændringer for at øge kvantiteten, kvaliteten og specificiteten af GO-annoteringer. I 2013 oversteg antallet af annoteringer 96 millioner. Kvaliteten af annoteringer er blevet forbedret gennem automatiske kvalitetstjek. Annoteringen af data præsenteret i GO-databasen er også blevet forbedret, nye termer er tilføjet. [4] . I 2007 blev en ny tjeneste InterMine [8] oprettet , som har til formål at integrere genomiske data fra en lang række forskellige kilder og lette beregningsopgaver såsom at søge efter specifikke genomiske regioner og udføre statistiske tests. Projektet blev oprindeligt skabt for at integrere data for Drosophila, men omfatter nu en lang række modelorganismer. I de senere år har udviklingen af LEGO-tjenesten (Linked Expressions using the Gene Ontology) været i gang, som giver dig mulighed for at udforske interaktionen mellem forskellige annoteringer i GO-databasen og kombinere dem til mere generelle modeller af gener og deres funktioner [3 ] .

Struktur og termer

Det skal forstås, at "genontologi" beskriver komplekse biologiske fænomener og ikke specifikke biologiske objekter. Gene Ontology-databasen omfatter tre uafhængige ordbøger [1] [9] :

Molecular function ( eng. molecular function ) - klassificering efter den specifikke funktion af genproduktet (protein eller RNA) på molekylært niveau, for eksempel kulhydratbinding eller ATPase - aktivitet.
Biologiske processer ( engelsk biologisk proces ) - klassificering i henhold til en kompleks proces, normalt nødvendig for organismers liv og opstår på grund af implementeringen af en sekvens af molekylære reaktioner, for eksempel mitose eller purinbiosyntese .
Cellulære komponenter ( eng. cellular component ) - klassificering efter den del af cellen eller det ekstracellulære rum, hvor genproduktets funktion udføres, for eksempel kernen eller ribosomet .

Hvert udtryk i "Gene Ontology" har en række attributter: en unik digital identifikator, et navn, en ordbog, som udtrykket tilhører, og en definition. Begreber kan have synonymer, som er opdelt i nøjagtigt svarende til begrebets betydning, bredere, snævrere og have en vis relation til begrebet. Attributter såsom links til kilder, andre databaser og kommentarer til betydningen og brugen af udtrykket [1] [9] kan også være til stede .

Ontologien er bygget på princippet om en rettet acyklisk graf : hvert led er forbundet med et eller flere andre led gennem en anden type relation . Der er følgende typer relationer [1] :

"A er et B" - A er et specialtilfælde af B,
"En del af B" - A er en del af B,
"B har del A" - B inkluderer A,
"A regulerer B" - A regulerer B,
"A regulerer positivt B" - A regulerer positivt B,
"A negativt regulerer B" - A negativt regulerer B,
"A forekommer i B" - A forekommer ved B.

Et eksempel på et af GO-projektets termer [10] :

id: GO:0043417 navn: negativ regulering af skeletmuskelvævsregenerering navneområde: biologisk_proces def: "Enhver proces, der stopper, forhindrer eller reducerer hyppigheden, hastigheden eller omfanget af gendannelse af skeletmuskler." [GOC:jl] synonym: "nedregulering af skeletmuskelregenerering" PRÆCIS [] synonym: "nedregulering af skeletmuskelregenerering" PRÆCIS [] synonym: "nedregulering af skeletmuskelregenerering" PRÆCIS [] synonym: "hæmning af skeletmuskulaturgenerering" SMAL [] is_a:GO:0043416! regulering af skeletmuskelvævsregenerering is_a: GO:0048640 ! negativ regulering af udviklingsvækst forhold: negative_regulates GO:0043403! regenerering af skeletmuskelvæv

Gene Ontology-databasen bliver løbende ændret og suppleret af både GO-projektets kuratorer og andre forskere. Foreslåede brugerændringer gennemgås af projektredaktører og anvendes, hvis ændringerne godkendes [9] .

Filen, der indeholder hele databasen [10] kan fås i forskellige formater fra det officielle Gene Ontology-websted, og vilkårene er også tilgængelige online ved hjælp af AmiGO Gene Ontology-browseren. Derudover kan det bruges til at udtrække et dataarray af genprodukter relateret til et bestemt udtryk. Også på webstedet kan du downloade kort over korrespondancen af GO-udtryk til andre klassifikationssystemer [11] .

Anmærkninger

Genom annotering er rettet mod at indhente information om egenskaberne af genprodukter. GO-annoteringer bruger udtrykkene "Gene Ontology" til dette. Medlemmer af GO-konsortiet poster deres annoteringer på Gene Ontology-webstedet, hvor annoteringerne er tilgængelige til direkte download eller til visning i AmiGO-browseren [12] .

Genannotationen indeholder følgende data: navn og identifikator for genproduktet; det tilsvarende GO-udtryk; typen af data annoteringen er baseret på ( beviskode ); link til kilden; og skaberen og datoen, hvor annoteringen blev oprettet. For datatyper, der angiver gyldigheden af en annotation ( evidenskode ), er der en særlig ontologi relateret til OBO -projektet [13] . Det inkluderer forskellige annoteringsmetoder, både manuelle og automatiske. For eksempel [1] :

IDA (Inferred from Direct Assay) - eksperimentelle data.
TAS (Traceable Author Statement) - data fra en videnskabelig publikation.
IMP (Inferred from Mutant Phenotype) - data opnået på basis af den mutante fænotype .
IGI (Inferred from Genetic Interaction) - baseret på interaktionen af gener .
IPI (Inferred from Physical Interaction) - baseret på fysisk interaktion.
RCA (Inferred from Reviewed Computational Analysis) - baseret på pålidelig beregningsanalyse.
ISS (Inferred from Sequence Similarity) - baseret på sekvenslighed.
IGC (Inferred from Genomic Context) - baseret på den genomiske kontekst.
IEP (Inferred from Expression Pattern) - baseret på udtrykkets natur .
NAS (Non-traceable Author Statement) - baseret på upublicerede data.
IEA (Inferred from Electronic Annotation) - baseret på automatisk udtræk fra andre annotationsdatabaser.
IC (Inferred by Curator) - data tilskrevet af kurator.
ND (Ingen biologiske data tilgængelige) - der er ingen pålidelige data.

Fra september 2012 blev mere end 99% af alle Gene Ontology-annotationer opnået automatisk [4] . Da sådanne annoteringer ikke bekræftes manuelt, betragtes de som mindre pålidelige af GO-konsortiet, og kun en brøkdel af dem er tilgængelige i AmiGO-browseren. Den fulde database med annoteringer kan downloades fra Gene Ontology-webstedet.

AmiGO

AmiGO [9] er en webapplikation (GO-tjeneste), der giver brugerne mulighed for at forespørge, finde og visualisere GO-termer og genproduktannotationer. Derudover indeholder applikationen BLAST -værktøjet (tilgængeligt i AmiGO 1, blev fjernet i AmiGO 2), tjenester, der giver dig mulighed for at analysere store datasæt og en grænseflade til søgning direkte i GO-databasen [14] . AmiGO kan bruges online på Gene Ontology-webstedet for at få adgang til data leveret af GO-konsortiet, eller det kan downloades og installeres til lokal applikation til enhver GO-lignende database. AmiGO 2 er open source og gratis software .

Dataudforskning

Visualisering

Visualisering giver brugeren mulighed for at bygge en graf, der karakteriserer genontologien for et specifikt GO-udtryk. Der er to inputformater [15] :

Standardformatet er en liste over id GO-termer (f.eks. GO:1234567) adskilt af et mellemrum.
Avanceret format - beskrivelse af noder i en graf i JSON-format (JavaScript Object Notation). Afhængigt af det foreskrevne format kan indholdet af noden ændre sig (tilføje yderligere anmærkninger, ændre farver osv.)

JSON input eksempel:

{"GO:0002244":{"title": "foo", "body": "bar", "fill": "#ccccf", "font": "#0000ff", "border":"rød"}, "GO:0005575":{"title":"alene", "legeme":""}, "GO:0033060":{}}

Kodning af et forhold til farve:

Holdning	Farve
er en	blå
del af	lyseblå
udvikler_fra	Brun
regulerer	sort
negativ_regulerer	rød
positivt_regulerer	grøn

Termvisualisering består i at bygge en graf fra en knude, der repræsenterer det oprindelige GO-udtryk, til en rodknude, som er repræsenteret ved navnet på et af de tre hovedordforråd: biologiske processer , molekylære funktioner og cellulære komponenter [1] [9] .

Dataoversigt

Udover muligheden for at lave grafer, der viser et terms GO-genontologi, implementerer AmiGO også flere værktøjer, der kan give brugeren en idé om projektets GO-data. Blandt dem [14] :

Grundlæggende statistik - information om GO-data i form af forskellige histogrammer (for eksempel fordelingen af annoteringer og deres karakter (eksperimentel / ikke-eksperimentel) i forhold til forskellige typer af levende organismer). Implementeret ved hjælp af Plotly-tjenesten.
Drill-down browser - giver dig mulighed for at udforske ontologier og annoteringer, bevæger dig gennem hierarkiet, startende fra et højt niveau. Dette værktøj giver dig mulighed for at bruge forskellige filtre.
Søgeskabeloner - en grænseflade, der er bokse til at indtaste data og udføre typiske forespørgsler til GO-databasen for dem.

GÅS

GOOSE [16] er et online SQL - forespørgselsmiljø tilgængeligt for brugere af AmiGO-tjenesten til oprettelse af datasæt. Denne service bruger SQL-syntaks til at lave forskellige forespørgsler til GO-databasen. EBI (UK, Cambridge), Berkeley BOP og Berkeley BOP (lite) spejle (begge placeret i Berkeley, Californien) er også tilgængelige for at reducere systembelastningen.

Udover at skrive en forespørgsel direkte manuelt, er det muligt at bruge skabeloner til delvist at forenkle denne opgave. En typisk databaseforespørgsel er vist nedenfor (søg efter den maksimale trædybde for en cellulær komponent) [16] :

VÆLG afstand som maks. fra graph_path, term HVOR graph_path.term2_id =term.id og term.term_type = 'cellular_component' BESTIL EFTER afstand besk grænse1;

Databasen i GO har en kompleks struktur og består af mange tabeller. Hoveddatabaser [16] :

termdb er en database, der indeholder information om GO-vilkår og relationer mellem dem.

assocdb er en database, der indeholder GO-ordforråd og annoteringer mellem GO-termer og genprodukter. Denne database er afhængig af termdb.

seqdb er en database, der indeholder GO-termer, genprodukter og sekvenser, der er annoteret med disse genprodukter. Afhænger af termdb og assocdb. Derudover er seqbdlite-databasen implementeret, hvori der ikke er nogen IEA-annoteringer.

Følgende dataeksportformater er mulige som et resultat af en forespørgsel [16] :

.rdf-xml
.obo-xml
.ugle-UGLE
.tabeller
.sql

Dataanalyse

PANTHER

PANTHER ( P rotein Analysis TH rough Evolutionary R elationships ) er en enorm database over gen/protein-familier og underfamilier, der funktionelt ligner dem, som kan bruges til at klassificere det funktionelle spektrum af genprodukter [ 17] . PANTHER er en del af GO-projektet, hvis hovedmål er klassificering af proteiner og deres gener.

I PANTHER redigeres databasen ikke kun af projektpersonalet, men også af klassifikationsalgoritmerne. Proteiner klassificeres efter deres familie (og underfamilie), molekylære funktion eller biologiske proces [17] .

Hovedanvendelsen af PANTHER er at belyse funktionerne af uforklarede gener i enhver organisme baseret på deres evolutionære forhold til gener, hvis funktioner er kendt i databasen. Ved at bruge genfunktioner, ontologi og statistiske analysemetoder tillader PANTHER biologer at analysere big data, hele genomer opnået gennem sekventering eller genekspressionsundersøgelser [18] .

De vigtigste værktøjer, der er tilgængelige på PANTHER-webstedet [18] er:

Genlisteanalyse:
- Funktionel analyse af gener og deres klassificering - omfatter information om genernes familie og underfamilie, deres molekylære funktion, de biologiske processer, de er involveret i, om de cellulære komponenter, hvor de kan findes. Disse data kan præsenteres både i form af en liste og i form af et cirkeldiagram.
- Statistiske test (Overrepræsentationstest og berigelsestest) er designet til at finde de generelle biologiske funktioner af gener, der indsendes til input af brugeren.
Studie af dataontologi, annoteringer mellem termer og familier, PANTHER underfamilier.
Søg efter proteinsekvenser i PANTHER-biblioteker
Analyse af enkeltnukleotidpolymorfismer (cSNP) er en vurdering af sandsynligheden for, at en ikke-synonym enkeltnukleotidmutation ændrer den funktionelle aktivitet af et gen.

GO Slimmer

GO Slimmer [19] er et værktøj til at kortlægge detaljerede gensætannotationer til en eller flere overordnede termer (GO slim-termer). GO slim-termer er trunkerede versioner af GO-ontologien, der indeholder en undergruppe af vilkårene for hele GO uden en detaljeret beskrivelse af specifikke lavniveau-termer.

Brugen af GO Slimmer gør det muligt at præsentere GO-genomannoteringer, analysere resultaterne af ekspressionsmikroarrays eller komplementære DNA-samlinger, når der er behov for en omfattende klassificering af genproduktfunktioner [19] .

Resultatet af denne algoritme er repræsenteret af tre kolonner [19] :

GO Slank sigt
Antallet af genprodukter fundet i forespørgslen, der matcher den givne slanke term.
Begrebets placering i de tre hoveddele af GO-ontologien: biologisk proces (P), cellulær komponent (C) og molekylær funktion (F).

AmiGO-versionen af dette værktøj er skrevet i Perl -scriptet map2slim [19] . Kuratorerne for projektet bemærker, at GO slankere-tjenesten i øjeblikket er indlæst, og inputdata af imponerende størrelse kan påvirke dens drift negativt. Driftstiden for tjenesten til behandling af inputsekvenser er begrænset.

BLAST

BLAST ( Basic L local Alignment Search Tool ) er en familie af computerprogrammer, der bruges til at søge efter homologer af proteiner eller nukleinsyrer, som sekvensen er kendt for, ved hjælp af alignment. Ved hjælp af BLAST kan forskeren sammenligne den sekvens, han har, med sekvenser fra databasen og finde den, der ligner den givne, som vil være de formodede homologer.

Implementeringen af dette værktøj i AmiGO 1 præsenteres i form af WU-BLAST-pakken udviklet af Washington University i St. Louis (Washington University i St. Louis). [tyve]

I AmiGO 2 er dette værktøj (GO BLAST) blevet fjernet, men du kan bruge søgningen i AmiGO 1 . Værktøjet giver dig mulighed for at filtrere søgeresultater efter genprodukt, database, taksonomisk tilknytning, GO-ordbog, OBO-annotering.

Term Matrix

Term Matrix [21] (en matrix af termer) er et AmiGO-værktøj til at studere information om ligheden mellem genproduktionen af termer. Resultatet af hans arbejde er en matrix, hvis elementer er antallet af genprodukter, der er kommenteret for et bestemt par GO-termer. For at bruge funktionen [21] skal du indtaste en liste over GO-identifikatorer for at se fælles annoteringer - antallet af almindelige genprodukter annoteret af termpar. Det er muligt at angive specifikke arter eller taxaer. Farvelægningen af varmekortet kan udføres i form af en graduering fra sort til hvid, eller ved at bruge kortets standardpalet.

OBO-Rediger

OBO-Edit [22] er en open source ontologi editor udviklet og vedligeholdt af GO Consortium. Det er implementeret i Java og bruger en grafbaseret tilgang til at visualisere og redigere ontologier. OBO-Edit har en brugervenlig søge- og filtergrænseflade, der giver dig mulighed for at visualisere og adskille delmængder af GO-termer. Interfacet kan tilpasses efter brugerens præferencer. OBO-Edit giver dig også mulighed for automatisk at oprette nye relationer baseret på eksisterende relationer og deres egenskaber. Selvom OBO-Edit blev udviklet til biomedicinske ontologier, kan det bruges til at se og redigere enhver ontologi.

MALING

PAINT [23] ( P hylogenetic Annotation and IN ference Tool ) er en JAVA - applikation, der er en del af Reference Genome Annotation Project og er baseret på " transive annotation"-princippet. Begrebet transitiv annotation består i at tildele den eksperimentelt etablerede funktion af et gen til et andet på grund af ligheden mellem deres nukleotidsekvenser.

Med PAINT kan brugeren udforske eksperimentelle annotationer for gener fra en bestemt familie og bruge denne information til at udlede nye annotationer for genfamiliemedlemmer, der endnu ikke er blevet tilstrækkeligt udforsket [3] . PAINT-værktøjet giver dig mulighed for at bygge en model, der vil forklare nedarvningen eller tabet af en bestemt genfunktionalitet inden for individuelle grene af fylogenetiske træer . Nye annotationer genereret af denne model omtales som Inferred from Biological Ancestry (IBA) [1] .

Denne applikation er gratis tilgængelig til download på Github.

Se også

Ontologi i datalogi
" Åbne biomedicinske ontologier "

Noter

↑ 1 2 3 4 5 6 7 du Plessis L., Skunca N., Dessimoz C. Genontologiens hvad, hvor, hvordan og hvorfor — en primer for bioinformatikere // Brief Bioinform. : journal. - 2011. - November ( bind 12 , nr. 6 ). - s. 723-735 . doi : 10.1093 / bib/bbr002 . — PMID 21330331 .
↑ 1 2 3 Gene Ontology Consortium. The Gene Ontology: enhancements for 2011. // Nucleic Acids Res. : journal. - 2012. - Januar ( bind 40 , nr. Databaseudgave ). - P. D559-64 . doi : 10.1093 / nar/gkr1028 . — PMID 22102568 .
↑ 1 2 3 4 5 Gene Ontology Consortium. Udvidelse af genontologiens videnbase og ressourcer // Nucleic Acids Res . : journal. - 2017. - Januar ( bind 45 , nr. D1 ). - P. D331-D338 . - doi : 10.1093/nar/gkw1108 .
↑ 1 2 3 4 Gene Ontology Consortium. Gene Ontologi annotationer og ressourcer // Nucleic Acids Res . : journal. - 2013. - Januar ( bind 41 , nr. Databaseudgave ). - P. D530-5 . - doi : 10.1093/nar/gks1050 . — PMID 23161678 .
↑ Smith B., Ashburner M., Rosse C., Bard J., Bug W., Ceusters W., Goldberg LJ, Eilbeck K., Ireland A., Mungall CJ, Leontis N., Rocca-Serra P., Ruttenberg A., Sansone SA, Scheuermann RH, Shah N., Whetzel PL, Lewis S. OBO Foundry: koordineret udvikling af ontologier til støtte for biomedicinsk dataintegration // Nature Biotechnology : journal . - Nature Publishing Group , 2007. - November ( vol. 25 , nr. 11 ). - S. 1251-1255 . - doi : 10.1038/nbt1346 . — PMID 17989687 .
↑ Ashburner M., Ball CA, Blake JA, Botstein D., Butler H., Cherry JM, Davis AP, Dolinski K., Dwight SS, Eppig JT, Harris MA, Hill DP, Issel-Tarver L., Kasarskis A. , Lewis S., Matese JC, Richardson JE, Ringwald M., Rubin GM, Sherlock G. Genontologi: værktøj til forening af biologi. The Gene Ontology Consortium (engelsk) // Nat. Genet. : journal. - 2000. - Maj ( bind 25 , nr. 1 ). - S. 25-9 . - doi : 10.1038/75556 . — PMID 10802651 .
↑ GO-konsortiet . Dato for adgang: 9. maj 2014. Arkiveret fra originalen 2. juli 2014. (ubestemt)
↑ Richard N. Smith, Jelena Aleksic, Daniela Butano, Adrian Carr, Sergio Contrino. InterMine: et fleksibelt datavarehussystem til integration og analyse af heterogene biologiske data // Bioinformatik . - 2012-12-01. — Bd. 28 , udg. 23 . - s. 3163-3165 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/bts577 . Arkiveret fra originalen den 19. april 2018.
↑ 1 2 3 4 5 Carbon S., Irland A., Mungall CJ, Shu S., Marshall B., Lewis S; AmiGO Hub; Web tilstedeværelse arbejdsgruppe. AmiGO: Online adgang til ontologi og annotationsdata. (engelsk) // Bioinformatik: tidsskrift. - 2008. - Januar ( bind 25 , nr. 2 ). - S. 288-289 . - doi : 10.1093/bioinformatics/btn615 . — PMID 19033274 .
↑ 1 2 GO-konsortiet. Gene Ontology database i .obo format (OBO 1.2 flad fil). Hentet 9. maj 2014. Arkiveret fra originalen 6. oktober 2015. (ubestemt)
↑ GO-konsortiet. Kortlægninger af eksterne klassifikationssystemer til GO. (utilgængeligt link) . Hentet 9. maj 2014. Arkiveret fra originalen 25. juni 2014. (ubestemt)
↑ GO-konsortiet. søg annoteringer. . Hentet 9. maj 2014. Arkiveret fra originalen 16. marts 2014. (ubestemt)
↑ The Open Biological and Biomedical Ontologies: Evidence Codes. . Arkiveret fra originalen den 26. november 2009. (ubestemt)
↑ 1 2 AmiGO Guide. . Hentet 9. maj 2014. Arkiveret fra originalen 13. marts 2014. (ubestemt)
↑ GO-konsortiet. Manuel visualisering . Hentet 10. marts 2017. Arkiveret fra originalen 12. marts 2017. (ubestemt)
↑ 1 2 3 4 GO-konsortiet. Manuel GOOSE (downlink) . Hentet 15. marts 2017. Arkiveret fra originalen 6. juni 2017. (ubestemt)
↑ 1 2 Huaiyu Mi, Xiaosong Huang, Anushya Muruganujan, Haiming Tang, Caitlin Mills, Diane Kang og Paul D. Thomas. PANTHER version 11: udvidede annotationsdata fra Gene Ontology og Reactome pathways og forbedringer af dataanalyseværktøj // Nucleic Acids Research : journal. - 2016. - 28. november ( vol. 45 , nr. Database ). - P. D183-D189 . - doi : 10.1093/nar/gkw1138 .
↑ 1 2 GO-konsortiet. Manuel PANTHER . Hentet 28. maj 2017. Arkiveret fra originalen 28. juni 2017. (ubestemt)
↑ 1 2 3 4 GO-konsortiet. Manuel GO Slimmer . Hentet 28. marts 2017. Arkiveret fra originalen 29. marts 2017. (ubestemt)
↑ GO-konsortiet. Manuel GO BLAST . Hentet 28. maj 2017. Arkiveret fra originalen 12. september 2016. (ubestemt)
↑ 1 2 Gene Ontology Consortium. AmiGO 2: Matrix (engelsk) . amigo2.berkeleybop.org. Dato for adgang: 4. april 2018.
↑ Day-Richter J., Harris MA, Haendel M., Gene Ontology OBO-Edit Working Group, Lewis S. OBO-Edit – en ontologiredaktør for biologer. (neopr.) // Bioinformatik. - 2007. - August ( bind 23 , nr. 16 ). - S. 2198-2200 . - doi : 10.1093/bioinformatik/btm112 . — PMID 17545183 .
↑ GO-konsortiet. Manuel MALING . Hentet 28. marts 2017. Arkiveret fra originalen 29. marts 2017. (ubestemt)