Multipel korrelationskoefficient

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 23. marts 2019; verifikation kræver 1 redigering .

Multipel korrelationskoefficient - Karakteriserer stramheden af den lineære korrelation mellem en stokastisk variabel og et sæt af stokastiske variable. Mere præcist, hvis (ξ 1 ,ξ 2 ,...,ξ k ) er en tilfældig vektor fra Rk , så er den multiple korrelationskoefficient mellem ξ 1 og ξ 2 ,...,ξ k numerisk lig med parret lineær korrelationskoefficient mellem værdien ξ 1 og dens bedste lineære tilnærmelse i variable ξ 2 ...,ξ k , som er en lineær regression af ξ 1 på ξ 2 ,...,ξ k . $\rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k))$ $M(\xi _{1}|\xi _{2},\ldots ,\xi _{k})$

Egenskaber

Den multiple korrelationskoefficient har den egenskab, at under betingelsen

$M\xi _{1}=M\xi _{2}=\ldots =M\xi _{k}=0$ hvornår er en regression af ξ 1 på ξ 2 ,...,ξ k , $\xi _{1}^{*}=\beta _{2}\xi _{2}+\beta _{3}\xi _{3}+\cdots +\beta _{k}\ xi _{k}$

blandt alle lineære kombinationer af variable vil ξ 2 ,...,ξ k variabel ξ 1 have den maksimale korrelationskoefficient med ξ 1 * , der falder sammen med . I denne forstand er den multiple korrelationskoefficient et specialtilfælde af den kanoniske korrelationskoefficient . Ved k = 2 falder den multiple korrelationskoefficient i absolut værdi sammen med den parvise lineære korrelationskoefficient ρ 12 mellem ξ 1 og ξ 2 . $\rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k))$

Beregning

Den multiple korrelationskoefficient beregnes ved hjælp af korrelationsmatrixen ifølge formlen $\mathbf {R} =\left\{\rho _{i,j}\right\},i,j=1,\ldots ,k$

$\rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k))^{2}=1-{\frac {\left\vert R\right \vert }{R_{11}}}$ ,

hvor er determinanten for korrelationsmatrixen og er det algebraiske komplement af elementet ρ 11 = 1 ; her . Hvis , så med sandsynlighed 1 falder værdierne af ξ 1 sammen med den lineære kombination ξ 2 ,...,ξ k , derfor ligger fællesfordelingen ξ 1 ,ξ 2 ,...,ξ k på et hyperplan i mellemrummet R k . På den anden side er for alle parkorrelationskoefficienter ρ 12 = ρ 13 = ... = ρ 1k = 0 lig med nul, derfor korrelerer værdierne af ξ 1 ikke med værdierne af ξ 2 , ...,ξ k . Det modsatte er også sandt. Den multiple korrelationskoefficient kan også beregnes ved hjælp af formlen $\left\vert R\right\vert$ $R_{11}$ $0\leqslant \rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k))\leqslant 1$ $\rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k))=1$ $\rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k))=0$

$\rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k))^{2}=1-{\frac {\sigma _{\xi _ {1}\bullet \xi _{2},\ldots ,\xi _{k}}^{2}}{\sigma _{1}^{2}}}$ ,

hvor er variansen af ξ 1 og er variansen af ξ 1 i forhold til regression. $\sigma _{1}^{2}$ $\sigma _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k))^{2}=M(\xi _{1}-(\beta _ {2}\xi _{2}+\beta _{3}\xi _{3}+\cdots +\beta _{k}\xi _{k}))^{2}$

Sample multiple korrelationskoefficient

Prøveanalogen af den multiple korrelationskoefficient er værdien , hvor og er estimater for og opnået fra en stikprøve af størrelse n . Fordelingen af statistikken bruges til at teste nulhypotesen om ingen sammenhæng . Forudsat at stikprøven er taget fra en multivariat normalfordeling , vil værdien have en betafordeling med parametre hvis . For sagen er distributionstypen kendt, men den bruges praktisk talt ikke på grund af dens besværlighed. $r_{1\bullet 2,\ldots ,k}={\sqrt {1-{\frac {s_{1\bullet 2,\ldots ,k}^{2}}{s_{1}^{ 2}}}}}$ ${\displaystyle s_{1\bullet 2,\ldots ,k}^{2))$ ${\displaystyle s_{1}^{2))$ $\sigma _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k}}^{2}$ $\sigma _{1}^{2}$ ${\displaystyle r_{1\bullet 2,\ldots ,k))$ ${\displaystyle r_{1\bullet 2,\ldots ,k}^{2))$ ${\frac {k-1}{2)),{\frac {nk}{2))$ $\rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k))=0$ $\rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k))\neq 0$ ${\displaystyle r_{1\bullet 2,\ldots ,k}^{2))$

Se også

Bestemmelseskoefficient

Litteratur

Kramer G. Matematiske metoder til statistik, trans. fra engelsk, 2. udg., M., 1975;
Kendall M., Steward A. , Statistical Inference and Relationships, trans. fra engelsk, M., 1973.