Proksimal gradientmetode

Den proksimale gradientmetode [1]  er en generalisering af projektion, der bruges til at løse ikke-differentierbare konvekse programmeringsproblemer .

Mange interessante problemer kan formuleres som konvekse programmeringsproblemer af formen

hvor  er konvekse funktioner , defineret som afbildninger , hvor nogle af funktionerne er ikke-differentierbare, hvilket udelukker de sædvanlige glatte optimeringsteknikker, såsom den stejleste nedstigningsmetode eller den konjugerede gradientmetode osv., kan proksimale gradientmetoder bruges i stedet. Disse metoder fungerer ved at opdele, så funktionerne bruges individuelt, hvilket muliggør udvikling af lettere implementerede algoritmer. De kaldes proksimale ( eng. proximal , nærmeste), da hver ikke -glat funktion blandt er involveret i processen gennem nærhedsoperatøren. Iterativ blød tærskelfiltreringsalgoritme [2] , Landweber projektion , gradient projektion , alternerende projektioner , metoden til alternerende retninger af multiplikatorer , metoden til alternerende opdelinger af Bragman er specielle tilfælde af proksimale algoritmer [3] . For en diskussion af proksimale gradientmetoder ud fra perspektivet af statistisk læringsteori og anvendelser til denne teori, se Proksimale gradientmetoder til maskinlæring .

Notation og terminologi

Lad , -dimensionelle euklidiske rum , være funktionens domæne . Antag, at det er en ikke-tom konveks delmængde af sættet . Så er sættets indikatorfunktion defineret som

-norm defineres som

Afstanden fra til er defineret som

Hvis er lukket og konveks, er projektionen til sættet det eneste punkt, således at .

Subdifferentialet for en funktion i et punkt er givet af udtrykket

Projektion til konvekse sæt

En meget brugt konveks optimeringsalgoritme er projektion til konvekse sæt . Denne algoritme bruges til at detektere/syntetisere et signal, der opfylder flere konvekse begrænsninger samtidigt. Lad være en indikatorfunktion på et ikke-tomt lukket konveks sæt, der modellerer en begrænsning. Dette reducerer problemet til problemet med konveks gennemførlighed (reachability), hvor man skal finde en løsning indeholdt i skæringspunktet mellem alle konvekse sæt . I metoden til projektion til konvekse sæt er hvert sæt forbundet med dets projektor . Således genberegnes ved hver iteration efter formlen

Ud over sådanne opgaver er projektorer dog ikke egnede, og der kræves operatører af en mere generel form. Blandt de forskellige eksisterende generaliseringer af begrebet en konveks projektor er nærhedsoperatører bedst egnede til sådanne formål.

Definition

Nærhedsoperatoren for en konveks funktioni et punkter defineret som den eneste løsning

og er betegnet som .

Bemærk, at i tilfælde af hvornår er indikatorfunktionen for nogle konvekse sæt

hvilket viser, at nærhedsoperatøren faktisk er en generalisering af projektoren.

Funktionen nærhedsoperatør er beskrevet ved inklusion

Hvis der kan differentieres, reduceres ligningen ovenfor til

Eksempler

Særlige tilfælde af proksimale gradientmetoder er

Se også

Noter

  1. Engelsk.  Proksimalt = tættest på
  2. Daubechies, Defrise, De Mol, 2004 , s. 1413-1457
  3.  Proksimale metoder diskuteres i detaljer

Litteratur

Links