Deming regression

I statistik er Deming-regression , opkaldt efter W.C. Deming , en type regression med variable fejl forsøger at finde den bedste udjævningslinje for et todimensionelt datasæt. Regression adskiller sig fra simpel lineær regression ved, at den tager højde for fejl i observationen i både x -aksen og y -aksen . Regression er et specialtilfælde af metoden med mindst fulde kvadrater , som tager højde for et vilkårligt antal indikatorer og har en mere kompleks fejlstruktur.

Deming-regression svarer til estimering af maksimal sandsynlighed på en model med fejl i variable , hvor fejlene i to variable antages at være uafhængige og har en normalfordeling , og forholdet mellem deres varians, δ , er kendt [1 ] . I praksis kan dette forhold estimeres ud fra de oprindelige data. Regressionsproceduren tager dog ikke højde for mulige fejl ved estimering af varianskvoterne.

Deming-regression er kun lidt mere kompliceret end simpel lineær regression . De fleste statistiske pakker, der bruges i klinisk kemi, giver Deming-regression.

Modellen blev oprindeligt foreslået af Adcock [2] , som betragtede tilfældet δ  = 1, og derefter overvejet mere generelt af Kummell [3] med vilkårlig δ . Imidlertid forblev deres ideer stort set ubemærket i mere end 50 år, indtil de blev genoplivet af Koopmans [4] og senere udbredt af Deming [5] . Sidstnævntes bog er blevet så populær inden for klinisk kemi og beslægtede områder, at metoden på disse områder er blevet kaldt Demings regression [6] .

Specifikation

Antag, at dataene ( y i , x i ) er værdier opnået fra målinger af "sande" værdier ( y i * , x i * ), der ligger på regressionslinjen:

hvor fejlene ε og η er uafhængige, og forholdet mellem deres varians er kendt:

I praksis er varianserne af parametrene og ofte ukendte, hvilket komplicerer estimeringen af ​​. Bemærk, at når målemetoden er den samme, er disse afvigelser sandsynligvis ens, så i dette tilfælde .

Vi forsøger at finde den "bedste udjævning" linje

sådan at den vægtede sum af kvadrerede rester er minimal [7]

Løsning

Løsningen kan udtrykkes i anden ordens momenter. Det vil sige, at vi først beregner følgende mængder (alle summer overtages i = 1 : n ):

Endelig vil parametrene for mindste kvadraters estimering være [8] :

Ortogonal regression

Hvis fejlafvigelserne er ens, dvs. i tilfælde , bliver Deming-regression en ortogonal regression — den minimerer summen af ​​de kvadrerede afstande fra stikprøvepunkterne til regressionslinjen . I dette tilfælde skal du angive hvert prøvepunkt z j i det komplekse plan (dvs. prøvepunktet ( x j , y j ) er skrevet som z j = x j + iy j , hvor i er den imaginære enhed ). Angiv med Z summen af ​​de kvadrerede forskelle fra prøveudtagningspunkterne til tyngdepunktet (også repræsenteret i komplekse koordinater). Tyngdepunktet er gennemsnittet af prøvepunkterne. Så [9] :

En trigonometrisk fortolkning af linjen for bedste ortogonale udjævning blev givet af Coolidge i 1913 [10] .

Ansøgninger

I tilfælde af tre ikke- kollineære punkter i planet har trekanten dannet af disse punkter en enkelt indskrevet Steiner-ellipse , der rører siderne af trekanten ved midtpunkterne. Hovedaksen for denne ellipse vil være en ortogonal regression af disse tre hjørner [11] .

Noter

  1. Linnet, 1993 .
  2. Adcock, 1878 .
  3. Kummell, 1879 .
  4. Koopmans, 1937 .
  5. Deming, 1943 .
  6. Cornbleet og Gochman 1979 , s. 432-438.
  7. Fuller, 1987 , s. kap.1.3.3.
  8. Glaister, 2001 , s. 104-107.
  9. Minda, Phelps, 2008 , s. 679–689, Sætning 2.3.
  10. Coolidge, 1913 , s. 187-190.
  11. Minda, Phelps, 2008 , s. 679–689, konsekvens 2.4.

Litteratur