ImageNet- databasen er et projekt til at skabe og vedligeholde en massiv database med kommenterede billeder, designet til at udvikle og teste billedgenkendelse og maskinsynsmetoder . Fra 2016 blev der registreret omkring ti millioner URL'er med billeder i databasen, som blev manuelt kommenteret til ImageNet, annoteringerne listede de objekter, der faldt på billedet, og rektanglerne med deres koordinater. [1] En database med kommenterede og URL-billeder fra tredjeparter er tilgængelig direkte gennem ImageNet, men selve billederne ejes ikke af projektet [2] . Siden 2010 har projektet ILSVRC ( ImageNet Large Scale Visual Recognition Challenge ) været i gang , hvor forskellige softwareprodukter årligt konkurrerer om klassificering og genkendelse af objekter og scener i ImageNet-databasen.
ImageNet bruger crowdsourcing til billedannotering.
Anmærkninger på billedets niveau viser tilstedeværelsen eller fraværet af et objekt fra denne klasse (for eksempel "der er en tiger på billedet" eller "der er ingen tigre på billedet"). På objektniveau inkluderer annoteringen et rektangel med koordinaterne for den synlige del af objektet. ImageNet bruger en variant af WordNets semantiske netværk til at kategorisere objekter, som er ret detaljeret, for eksempel er hunderacer repræsenteret af 120 klasser. Hver WordNet -node har hundreder eller tusindvis af billeder tilknyttet, men gennemsnittet for 2016 er omkring 500 billeder [3] .
Fra august 2017 har ImageNet 14.197.122 billeder fordelt på 21.841 kategorier.
Siden 2010 har der inden for rammerne af ILSVRC-projektet været afholdt konkurrencer mellem forskergrupper i klassificering af objekter. ILSVCR var inspireret af den lille PASCAL VOC-kampagne fra 2005, som havde et sæt på 20.000 billeder og 20 feature-klasser [3] . Der blev gjort betydelige fremskridt med hensyn til mønstergenkendelse i 2010. I 2011 blev en klassifikationsfejl på 25 % betragtet som et godt resultat. I 2012 var et dybt læringssystem baseret på et foldet neuralt netværk i stand til at opnå 16 % fejl; og i de følgende år faldt fejlen til nogle få procent [4] . I 2015 udtalte forskere, at programmerne i visse opgaver i ILSVRC-projektet oversteg menneskelige evner [5] . Men som Olga Russakovskaya, en af arrangørerne af kampagnen, påpegede, skal programmer stadig bestemme objekter for en af de tusinde kategorier, og folk kan genkende flere kategorier og (i modsætning til programmer) også indikere billedernes kontekst [6 ] .
I 2014 sluttede mere end 50 organisationer sig til kampagnen [3] . I 2015 blev forskere fra Baidu -projektet suspenderet i et år, fordi de gik ind i projektet under flere forskellige navne for at omgå to-ugers grænsen [7] [8] . Baidu udtalte senere, at teamlederen var blevet fyret, og at en særlig videnskabelig rådgivende gruppe ville blive samlet [9] .