Fishers iris

Fishers iris  er et datasæt for klassifikationsproblemet , hvorpå Ronald Fisher demonstrerede arbejdet med den diskriminantanalysemetode, han udviklede i 1936 [1] . Det bliver nogle gange også omtalt som Andersons iris , da dataene blev indsamlet af den amerikanske botaniker Edgar Anderson [2] . Dette datasæt er blevet en klassiker og bruges ofte i litteraturen til at illustrere driften af ​​forskellige statistiske algoritmer [3] .

Beskrivelse

Fishers iris består af data på 150 irisprøver , 50 prøver hver fra tre arter - børstet iris ( Iris setosa ), jomfru iris ( Iris virginica ) og flerfarvet iris ( Iris versicolor ). For hver prøve blev fire karakteristika målt (i centimeter ):

  1. Længden af ​​den ydre perianthlap ( eng.  bægerbladslængde );
  2. Bredden af ​​den ydre perianthlap ( eng.  bægerbladsbredde );
  3. Længden af ​​det indre segment af perianth ( eng.  kronbladslængde );
  4. Bredden af ​​det indre segment af perianten ( eng.  kronbladsbredde ).

På baggrund af dette datasæt er det påkrævet at bygge en klassificeringsregel, der bestemmer anlægstypen i henhold til måledataene. Dette er et klassificeringsproblem med flere klasser , da der er tre klasser - tre typer iris.

En af klasserne (Iris setosa) kan lineært adskilles fra de to andre.

Datasæt

Fishers iris

bægerbladslængde _
Begerbladsbredde
_

kronblads længde

kronblads bredde

Iris art
5.1 3.5 1.4 0,2 setosa
4.9 3.0 1.4 0,2 setosa
4.7 3.2 1.3 0,2 setosa
4.6 3.1 1.5 0,2 setosa
5,0 3.6 1.4 0,2 setosa
5.4 3.9 1.7 0,4 setosa
4.6 3.4 1.4 0,3 setosa
5,0 3.4 1.5 0,2 setosa
4.4 2.9 1.4 0,2 setosa
4.9 3.1 1.5 0,1 setosa
5.4 3.7 1.5 0,2 setosa
4.8 3.4 1.6 0,2 setosa
4.8 3.0 1.4 0,1 setosa
4.3 3.0 1.1 0,1 setosa
5.8 4.0 1.2 0,2 setosa
5.7 4.4 1.5 0,4 setosa
5.4 3.9 1.3 0,4 setosa
5.1 3.5 1.4 0,3 setosa
5.7 3.8 1.7 0,3 setosa
5.1 3.8 1.5 0,3 setosa
5.4 3.4 1.7 0,2 setosa
5.1 3.7 1.5 0,4 setosa
4.6 3.6 1.0 0,2 setosa
5.1 3.3 1.7 0,5 setosa
4.8 3.4 1.9 0,2 setosa
5,0 3.0 1.6 0,2 setosa
5,0 3.4 1.6 0,4 setosa
5.2 3.5 1.5 0,2 setosa
5.2 3.4 1.4 0,2 setosa
4.7 3.2 1.6 0,2 setosa
4.8 3.1 1.6 0,2 setosa
5.4 3.4 1.5 0,4 setosa
5.2 4.1 1.5 0,1 setosa
5.5 4.2 1.4 0,2 setosa
4.9 3.1 1.5 0,2 setosa
5,0 3.2 1.2 0,2 setosa
5.5 3.5 1.3 0,2 setosa
4.9 3.6 1.4 0,1 setosa
4.4 3.0 1.3 0,2 setosa
5.1 3.4 1.5 0,2 setosa
5,0 3.5 1.3 0,3 setosa
4.5 2.3 1.3 0,3 setosa
4.4 3.2 1.3 0,2 setosa
5,0 3.5 1.6 0,6 setosa
5.1 3.8 1.9 0,4 setosa
4.8 3.0 1.4 0,3 setosa
5.1 3.8 1.6 0,2 setosa
4.6 3.2 1.4 0,2 setosa
5.3 3.7 1.5 0,2 setosa
5,0 3.3 1.4 0,2 setosa
7,0 3.2 4.7 1.4 versicolor
6.4 3.2 4.5 1.5 versicolor
6.9 3.1 4.9 1.5 versicolor
5.5 2.3 4.0 1.3 versicolor
6.5 2.8 4.6 1.5 versicolor
5.7 2.8 4.5 1.3 versicolor
6.3 3.3 4.7 1.6 versicolor
4.9 2.4 3.3 1.0 versicolor
6.6 2.9 4.6 1.3 versicolor
5.2 2.7 3.9 1.4 versicolor
5,0 2.0 3.5 1.0 versicolor
5.9 3.0 4.2 1.5 versicolor
6,0 2.2 4.0 1.0 versicolor
6.1 2.9 4.7 1.4 versicolor
5.6 2.9 3.6 1.3 versicolor
6.7 3.1 4.4 1.4 versicolor
5.6 3.0 4.5 1.5 versicolor
5.8 2.7 4.1 1.0 versicolor
6.2 2.2 4.5 1.5 versicolor
5.6 2.5 3.9 1.1 versicolor
5.9 3.2 4.8 1.8 versicolor
6.1 2.8 4.0 1.3 versicolor
6.3 2.5 4.9 1.5 versicolor
6.1 2.8 4.7 1.2 versicolor
6.4 2.9 4.3 1.3 versicolor
6.6 3.0 4.4 1.4 versicolor
6.8 2.8 4.8 1.4 versicolor
6.7 3.0 5,0 1.7 versicolor
6,0 2.9 4.5 1.5 versicolor
5.7 2.6 3.5 1.0 versicolor
5.5 2.4 3.8 1.1 versicolor
5.5 2.4 3.7 1.0 versicolor
5.8 2.7 3.9 1.2 versicolor
6,0 2.7 5.1 1.6 versicolor
5.4 3.0 4.5 1.5 versicolor
6,0 3.4 4.5 1.6 versicolor
6.7 3.1 4.7 1.5 versicolor
6.3 2.3 4.4 1.3 versicolor
5.6 3.0 4.1 1.3 versicolor
5.5 2.5 4.0 1.3 versicolor
5.5 2.6 4.4 1.2 versicolor
6.1 3.0 4.6 1.4 versicolor
5.8 2.6 4.0 1.2 versicolor
5,0 2.3 3.3 1.0 versicolor
5.6 2.7 4.2 1.3 versicolor
5.7 3.0 4.2 1.2 versicolor
5.7 2.9 4.2 1.3 versicolor
6.2 2.9 4.3 1.3 versicolor
5.1 2.5 3.0 1.1 versicolor
5.7 2.8 4.1 1.3 versicolor
6.3 3.3 6,0 2.5 virginica
5.8 2.7 5.1 1.9 virginica
7.1 3.0 5.9 2.1 virginica
6.3 2.9 5.6 1.8 virginica
6.5 3.0 5.8 2.2 virginica
7.6 3.0 6.6 2.1 virginica
4.9 2.5 4.5 1.7 virginica
7.3 2.9 6.3 1.8 virginica
6.7 2.5 5.8 1.8 virginica
7.2 3.6 6.1 2.5 virginica
6.5 3.2 5.1 2.0 virginica
6.4 2.7 5.3 1.9 virginica
6.8 3.0 5.5 2.1 virginica
5.7 2.5 5,0 2.0 virginica
5.8 2.8 5.1 2.4 virginica
6.4 3.2 5.3 2.3 virginica
6.5 3.0 5.5 1.8 virginica
7.7 3.8 6.7 2.2 virginica
7.7 2.6 6.9 2.3 virginica
6,0 2.2 5,0 1.5 virginica
6.9 3.2 5.7 2.3 virginica
5.6 2.8 4.9 2.0 virginica
7.7 2.8 6.7 2.0 virginica
6.3 2.7 4.9 1.8 virginica
6.7 3.3 5.7 2.1 virginica
7.2 3.2 6,0 1.8 virginica
6.2 2.8 4.8 1.8 virginica
6.1 3.0 4.9 1.8 virginica
6.4 2.8 5.6 2.1 virginica
7.2 3.0 5.8 1.6 virginica
7.4 2.8 6.1 1.9 virginica
7.9 3.8 6.4 2.0 virginica
6.4 2.8 5.6 2.2 virginica
6.3 2.8 5.1 1.5 virginica
6.1 2.6 5.6 1.4 virginica
7.7 3.0 6.1 2.3 virginica
6.3 3.4 5.6 2.4 virginica
6.4 3.1 5.5 1.8 virginica
6,0 3.0 4.8 1.8 virginica
6.9 3.1 5.4 2.1 virginica
6.7 3.1 5.6 2.4 virginica
6.9 3.1 5.1 2.3 virginica
5.8 2.7 5.1 1.9 virginica
6.8 3.2 5.9 2.3 virginica
6.7 3.3 5.7 2.5 virginica
6.7 3.0 5.2 2.3 virginica
6.3 2.5 5,0 1.9 virginica
6.5 3.0 5.2 2.0 virginica
6.2 3.4 5.4 2.3 virginica
5.9 3.0 5.1 1.8 virginica

Noter

  1. Fisher, RA  Brugen af ​​flere målinger i taksonomiske problemer  // Annals of Eugenics : journal. - 1936. - Bd. 7 . - S. 179-188 .
  2. Edgar Anderson. Iriserne på Gaspé-halvøen  (neopr.)  // Bulletin of the American Iris Society. - 1935. - T. 59 . - S. 2-5 .
  3. UCI Machine Learning Repository: Iris-datasæt . Hentet 7. marts 2010. Arkiveret fra originalen 11. december 2015.

Links