Multipel korrelationskoefficient - Karakteriserer stramheden af den lineære korrelation mellem en stokastisk variabel og et sæt af stokastiske variable. Mere præcist, hvis (ξ 1 ,ξ 2 ,...,ξ k ) er en tilfældig vektor fra Rk , så er den multiple korrelationskoefficient mellem ξ 1 og ξ 2 ,...,ξ k numerisk lig med parret lineær korrelationskoefficient mellem værdien ξ 1 og dens bedste lineære tilnærmelse i variable ξ 2 ...,ξ k , som er en lineær regression af ξ 1 på ξ 2 ,...,ξ k .
Den multiple korrelationskoefficient har den egenskab, at under betingelsen
hvornår er en regression af ξ 1 på ξ 2 ,...,ξ k ,
blandt alle lineære kombinationer af variable vil ξ 2 ,...,ξ k variabel ξ 1 have den maksimale korrelationskoefficient med ξ 1 * , der falder sammen med . I denne forstand er den multiple korrelationskoefficient et specialtilfælde af den kanoniske korrelationskoefficient . Ved k = 2 falder den multiple korrelationskoefficient i absolut værdi sammen med den parvise lineære korrelationskoefficient ρ 12 mellem ξ 1 og ξ 2 .
Den multiple korrelationskoefficient beregnes ved hjælp af korrelationsmatrixen ifølge formlen
,
hvor er determinanten for korrelationsmatrixen og er det algebraiske komplement af elementet ρ 11 = 1 ; her . Hvis , så med sandsynlighed 1 falder værdierne af ξ 1 sammen med den lineære kombination ξ 2 ,...,ξ k , derfor ligger fællesfordelingen ξ 1 ,ξ 2 ,...,ξ k på et hyperplan i mellemrummet R k . På den anden side er for alle parkorrelationskoefficienter ρ 12 = ρ 13 = ... = ρ 1k = 0 lig med nul, derfor korrelerer værdierne af ξ 1 ikke med værdierne af ξ 2 , ...,ξ k . Det modsatte er også sandt. Den multiple korrelationskoefficient kan også beregnes ved hjælp af formlen
,
hvor er variansen af ξ 1 og er variansen af ξ 1 i forhold til regression.
Prøveanalogen af den multiple korrelationskoefficient er værdien , hvor og er estimater for og opnået fra en stikprøve af størrelse n . Fordelingen af statistikken bruges til at teste nulhypotesen om ingen sammenhæng . Forudsat at stikprøven er taget fra en multivariat normalfordeling , vil værdien have en betafordeling med parametre hvis . For sagen er distributionstypen kendt, men den bruges praktisk talt ikke på grund af dens besværlighed.