Hessiske funktioner

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 24. december 2021; checks kræver 2 redigeringer .

En funktions hessian  er en symmetrisk kvadratisk form [1] , der beskriver opførselen af ​​en funktion i anden orden.

For en funktion, der er dobbelt differentierbar på et punkt

eller

hvor (eller ) og funktionen er defineret på -dimensionelt reelt rum (eller komplekst rum ) med koordinater (eller ). I begge tilfælde er hessian en kvadratisk form givet på tangentrummet , som ikke ændres under lineære transformationer af variablerne. Hessian kaldes også ofte for determinanten for en matrix, se nedenfor.

Hessisk matrix

Matrixen af ​​denne kvadratiske form er dannet af de anden partielle afledninger af funktionen. Hvis alle derivater eksisterer, så

Determinanten af ​​denne matrix kaldes den hessiske determinant , eller blot den hessiske .

Hessiske matricer bruges i optimeringsproblemer ved Newtons metode . Den komplette beregning af den hessiske matrix kan være vanskelig, så der er udviklet kvasi-newtonske algoritmer baseret på omtrentlige udtryk for den hessiske matrix. Den mest berømte af dem er Broyden-Fletcher-Goldfarb-Shanno-algoritmen .

Symmetri af den hessiske matrix

De blandede afledte af funktionen f  er de elementer i den hessiske matrix, der ikke er på hoveddiagonalen . Hvis de er kontinuerlige, er rækkefølgen af ​​differentiering ikke vigtig:

Dette kan også skrives som

I dette tilfælde er den hessiske matrix symmetrisk .

Kritiske punkter for en funktion

Hvis gradienten (dens vektorafledte ) er nul på et tidspunkt , kaldes dette punkt kritisk . En tilstrækkelig betingelse for eksistensen af ​​et ekstremum på dette tidspunkt er fortegnsbestemtheden af ​​det hessiske f (forstået i dette tilfælde som en kvadratisk form), nemlig:

Variationer og generaliseringer

Vektor-funktioner

Hvis  er en vektorfunktion , dvs.

så danner dens anden partielle afledte ikke en matrix, men en tensor af rang 3, som kan betragtes som en matrix af hessiske matricer:

Ved degenererer denne tensor til den sædvanlige hessiske matrix.

Banded Hessian

Når man løser problemet med at finde et betinget ekstremum af en funktion med restriktioner

hvor , , for at kontrollere tilstrækkelige betingelser for et ekstremum, kan man bruge den såkaldte afgrænsede Hessian of the Lagrange-funktion , som vil have formen [2]

Verifikationen af ​​tilstrækkelige ekstremumbetingelser består i at beregne tegnene på determinanterne for et bestemt sæt submatricer af den afgrænsede Hessian. Nemlig hvis der findes sådan at og

for så har funktionen et strengt betinget minimum på punktet . Hvis

for , så har funktionen på det punkt et strengt betinget maksimum [3] .

Historie

Begrebet blev introduceret af Ludwig Otto Hesse ( 1844 ), som brugte et andet navn. Udtrykket "hessisk" blev opfundet af James Joseph Sylvester .

Se også

Noter

  1. Hessisk . Hentet 2. april 2016. Arkiveret fra originalen 15. april 2016.
  2. Hallam, Arne Econ 500: Quantitative Methods in Economic Analysis I. Iowa State (7. oktober 2004). Hentet 14. april 2021. Arkiveret fra originalen 19. april 2021.
  3. Neudecker, Heinz. Matrix-differentialregning med anvendelser i statistik og økonometri / Heinz Neudecker, Jan R. Magnus. - New York: John Wiley & Sons , 1988. - S. 136. - ISBN 978-0-471-91516-4 .

Links