Multipel korrelationskoefficient

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 23. marts 2019; verifikation kræver 1 redigering .

Multipel korrelationskoefficient - Karakteriserer stramheden af ​​den lineære korrelation mellem en stokastisk variabel og et sæt af stokastiske variable. Mere præcist, hvis (ξ 1 ,ξ 2 ,...,ξ k ) er en tilfældig vektor fra Rk , så er den multiple korrelationskoefficient mellem ξ 1 og ξ 2 ,...,ξ k numerisk lig med parret lineær korrelationskoefficient mellem værdien ξ 1 og dens bedste lineære tilnærmelse i variable ξ 2 ...,ξ k , som er en lineær regression af ξ 1 på ξ 2 ,...,ξ k .

Egenskaber

Den multiple korrelationskoefficient har den egenskab, at under betingelsen

hvornår er en regression af ξ 1 på ξ 2 ,...,ξ k ,

blandt alle lineære kombinationer af variable vil ξ 2 ,...,ξ k variabel ξ 1 have den maksimale korrelationskoefficient med ξ 1 * , der falder sammen med . I denne forstand er den multiple korrelationskoefficient et specialtilfælde af den kanoniske korrelationskoefficient . Ved k = 2 falder den multiple korrelationskoefficient i absolut værdi sammen med den parvise lineære korrelationskoefficient ρ 12 mellem ξ 1 og ξ 2 .

Beregning

Den multiple korrelationskoefficient beregnes ved hjælp af korrelationsmatrixen ifølge formlen

,

hvor er determinanten for korrelationsmatrixen og er det algebraiske komplement af elementet ρ 11 = 1 ; her . Hvis , så med sandsynlighed 1 falder værdierne af ξ 1 sammen med den lineære kombination ξ 2 ,...,ξ k , derfor ligger fællesfordelingen ξ 1 ,ξ 2 ,...,ξ k på et hyperplan i mellemrummet R k . På den anden side er for alle parkorrelationskoefficienter ρ 12 = ρ 13 = ... = ρ 1k = 0 lig med nul, derfor korrelerer værdierne af ξ 1 ikke med værdierne af ξ 2 , ...,ξ k . Det modsatte er også sandt. Den multiple korrelationskoefficient kan også beregnes ved hjælp af formlen

,

hvor er variansen af ​​ξ 1 og er variansen af ​​ξ 1 i forhold til regression.

Sample multiple korrelationskoefficient

Prøveanalogen af ​​den multiple korrelationskoefficient er værdien , hvor og er estimater for og opnået fra en stikprøve af størrelse n . Fordelingen af ​​statistikken bruges til at teste nulhypotesen om ingen sammenhæng . Forudsat at stikprøven er taget fra en multivariat normalfordeling , vil værdien have en betafordeling med parametre hvis . For sagen er distributionstypen kendt, men den bruges praktisk talt ikke på grund af dens besværlighed.

Se også

Litteratur