I statistik er Deming-regression , opkaldt efter W.C. Deming , en type regression med variable fejl forsøger at finde den bedste udjævningslinje for et todimensionelt datasæt. Regression adskiller sig fra simpel lineær regression ved, at den tager højde for fejl i observationen i både x -aksen og y -aksen . Regression er et specialtilfælde af metoden med mindst fulde kvadrater , som tager højde for et vilkårligt antal indikatorer og har en mere kompleks fejlstruktur.
Deming-regression svarer til estimering af maksimal sandsynlighed på en model med fejl i variable , hvor fejlene i to variable antages at være uafhængige og har en normalfordeling , og forholdet mellem deres varians, δ , er kendt [1 ] . I praksis kan dette forhold estimeres ud fra de oprindelige data. Regressionsproceduren tager dog ikke højde for mulige fejl ved estimering af varianskvoterne.
Deming-regression er kun lidt mere kompliceret end simpel lineær regression . De fleste statistiske pakker, der bruges i klinisk kemi, giver Deming-regression.
Modellen blev oprindeligt foreslået af Adcock [2] , som betragtede tilfældet δ = 1, og derefter overvejet mere generelt af Kummell [3] med vilkårlig δ . Imidlertid forblev deres ideer stort set ubemærket i mere end 50 år, indtil de blev genoplivet af Koopmans [4] og senere udbredt af Deming [5] . Sidstnævntes bog er blevet så populær inden for klinisk kemi og beslægtede områder, at metoden på disse områder er blevet kaldt Demings regression [6] .
Antag, at dataene ( y i , x i ) er værdier opnået fra målinger af "sande" værdier ( y i * , x i * ), der ligger på regressionslinjen:
hvor fejlene ε og η er uafhængige, og forholdet mellem deres varians er kendt:
I praksis er varianserne af parametrene og ofte ukendte, hvilket komplicerer estimeringen af . Bemærk, at når målemetoden er den samme, er disse afvigelser sandsynligvis ens, så i dette tilfælde .
Vi forsøger at finde den "bedste udjævning" linje
sådan at den vægtede sum af kvadrerede rester er minimal [7]
Løsningen kan udtrykkes i anden ordens momenter. Det vil sige, at vi først beregner følgende mængder (alle summer overtages i = 1 : n ):
Endelig vil parametrene for mindste kvadraters estimering være [8] :
Hvis fejlafvigelserne er ens, dvs. i tilfælde , bliver Deming-regression en ortogonal regression — den minimerer summen af de kvadrerede afstande fra stikprøvepunkterne til regressionslinjen . I dette tilfælde skal du angive hvert prøvepunkt z j i det komplekse plan (dvs. prøvepunktet ( x j , y j ) er skrevet som z j = x j + iy j , hvor i er den imaginære enhed ). Angiv med Z summen af de kvadrerede forskelle fra prøveudtagningspunkterne til tyngdepunktet (også repræsenteret i komplekse koordinater). Tyngdepunktet er gennemsnittet af prøvepunkterne. Så [9] :
En trigonometrisk fortolkning af linjen for bedste ortogonale udjævning blev givet af Coolidge i 1913 [10] .
I tilfælde af tre ikke- kollineære punkter i planet har trekanten dannet af disse punkter en enkelt indskrevet Steiner-ellipse , der rører siderne af trekanten ved midtpunkterne. Hovedaksen for denne ellipse vil være en ortogonal regression af disse tre hjørner [11] .