Caltech 101

Caltech 101 -  databasen er en stor billeddatabase designet til at udvikle og teste metoder til mønstergenkendelse og maskinsyn . Dette datasæt blev oprettet i september 2003 hos Caltech af Fei-fei Li, Marc Aurelio Ranzato og Petro Perona. Databasen indeholder 9146 billeder fordelt på 101 kategorier - ansigter, ure, myrer, klaverer og andre. Hvert billede er ledsaget af en annotering samt et MATLAB -biblioteksscript til visning.

Udnævnelse

Databasen indeholder standardiserede maskinlæringsmønstre til udvikling og fejlretning af computervisionsmoduler . For at forbedre effektiviteten kræves der en stor mængde data. For eksempel blev real-time objektgenkendelsesmetoden foreslået af Paul Viola og Michael J. Jones trænet på 4916 prøver af menneskelige ansigter med tilføjede etiketter. [en]

Billedforberedelse – udskæring, dimensionering, etikettering – kræver en masse manuelt arbejde. Derudover fokuserer hver udvikler på deres egne opgaver og opererer på deres egne data, hvilket gør det nødvendigt at sammenligne forskellige metoder og tilgange til maskinlæring. [2]

Caltech 101-sættet er nyttigt som et alternativ til at teste mønstergenkendelsesmetoder og har følgende fordele:

Nylige undersøgelser [3] viser dog, at test baseret på ukontrollerede naturlige prøver (som Caltech 101) også kan være alvorligt vildledende og føre udvikling i den forkerte retning.

Prøvesæt

Billeder

De 9146 billeder i databasen er opdelt i 101 kategorier.

Hver kategori har 40 til 800 billeder. Almindelige billeder (såsom ansigter) har flere billeder end andre.

Billedstørrelsen er cirka 300x200 pixels. Orienterede objekter (f.eks. motorcykler, fly) ses altid fra venstre mod højre, mens lodrette strukturer (f.eks. huse) roteres for at være uden for aksen.

Anmærkninger

Hvert billede er ledsaget af flere anmærkninger - koordinaterne for den ramme, hvori objektet er placeret, og en detaljeret beskrivelse.

MATLAB -bibliotekets script giver dig mulighed for at uploade et billede og den tilhørende annotering.

Ansøgninger

Analyse og sammenligning

Fordele

Caltech 101 har følgende fordele:

Ulemper

Manglerne i Caltech 101-databasen [3] [4] tilskrives nogle gange bevidst indførte forvrængninger og nogle gange til et begrænset sæt.

Følgende er noteret som ulemper:

Udvikling

Se også

Noter

  1. P. Viola og MJ Jones, Robust Real-Time Object Detection, IJCV 2004
  2. Oertel, C., Colder, B., Colombe, J., High, J., Ingram, M., Sallee, P., Current Challenges in Automating Visual Perception. Proceedings of IEEE Advanced Imagery Pattern Recognition Workshop 2008
  3. 1 2 3 Hvorfor er real-world visuel objektgenkendelse svært? Pinto N, Cox DD, DiCarlo JJ PLoS Computational Biology Vol. 4, nr. 1, e27 Arkiveret fra originalen den 15. april 2013. doi : 10.1371/journal.pcbi.0040027
  4. Datasætproblemer i objektgenkendelse. J. Ponce, TL Berg, M. Everingham, DA Forsyth, M. Hebert, S. Lazebnik, M. Marszalek, C. Schmid, BC Russell, A. Torralba, CKI Williams, J. Zhang og A. Zisserman. Toward Category-Level Object Recognition, Springer-Verlag Lecture Notes in Computer Science. J. Ponce, M. Hebert, C. Schmid og A. Zisserman (red.), 2006 (link ikke tilgængeligt) . Dato for adgang: 23. december 2016. Arkiveret fra originalen 24. december 2016. 
  5. F. Tanner, B. Colder, C. Pullen, D. Heagy, C. Oertel og P. Sallee, Overhead Imagery Research Data Set (OIRDS) - et kommenteret databibliotek og værktøjer til at hjælpe med udviklingen af ​​computere vision algorithms , juni 2009, < http://sourceforge.net/apps/mediawiki/oirds/index.php?title=Documentation Arkiveret 9. november 2012 på Wayback Machine > (28. december 2009)
  6. L. Ballan, M. Bertini, A. Del Bimbo, A. M. Serain, G. Serra, B. F. Zaccone. Kombination af generative og diskriminerende modeller til klassificering af sociale billeder fra 101 objektkategorier. Int. Conference on Pattern Recognition (ICPR), 2012. Arkiveret fra originalen den 26. august 2014.

Kilder