Den proksimale gradientmetode [1] er en generalisering af projektion, der bruges til at løse ikke-differentierbare konvekse programmeringsproblemer .
Mange interessante problemer kan formuleres som konvekse programmeringsproblemer af formen
hvor er konvekse funktioner , defineret som afbildninger , hvor nogle af funktionerne er ikke-differentierbare, hvilket udelukker de sædvanlige glatte optimeringsteknikker, såsom den stejleste nedstigningsmetode eller den konjugerede gradientmetode osv., kan proksimale gradientmetoder bruges i stedet. Disse metoder fungerer ved at opdele, så funktionerne bruges individuelt, hvilket muliggør udvikling af lettere implementerede algoritmer. De kaldes proksimale ( eng. proximal , nærmeste), da hver ikke -glat funktion blandt er involveret i processen gennem nærhedsoperatøren. Iterativ blød tærskelfiltreringsalgoritme [2] , Landweber projektion , gradient projektion , alternerende projektioner , metoden til alternerende retninger af multiplikatorer , metoden til alternerende opdelinger af Bragman er specielle tilfælde af proksimale algoritmer [3] . For en diskussion af proksimale gradientmetoder ud fra perspektivet af statistisk læringsteori og anvendelser til denne teori, se Proksimale gradientmetoder til maskinlæring .
Lad , -dimensionelle euklidiske rum , være funktionens domæne . Antag, at det er en ikke-tom konveks delmængde af sættet . Så er sættets indikatorfunktion defineret som
-norm defineres somAfstanden fra til er defineret som
Hvis er lukket og konveks, er projektionen til sættet det eneste punkt, således at .
Subdifferentialet for en funktion i et punkt er givet af udtrykket
En meget brugt konveks optimeringsalgoritme er projektion til konvekse sæt . Denne algoritme bruges til at detektere/syntetisere et signal, der opfylder flere konvekse begrænsninger samtidigt. Lad være en indikatorfunktion på et ikke-tomt lukket konveks sæt, der modellerer en begrænsning. Dette reducerer problemet til problemet med konveks gennemførlighed (reachability), hvor man skal finde en løsning indeholdt i skæringspunktet mellem alle konvekse sæt . I metoden til projektion til konvekse sæt er hvert sæt forbundet med dets projektor . Således genberegnes ved hver iteration efter formlen
Ud over sådanne opgaver er projektorer dog ikke egnede, og der kræves operatører af en mere generel form. Blandt de forskellige eksisterende generaliseringer af begrebet en konveks projektor er nærhedsoperatører bedst egnede til sådanne formål.
Nærhedsoperatoren for en konveks funktioni et punkter defineret som den eneste løsning
og er betegnet som .
Bemærk, at i tilfælde af hvornår er indikatorfunktionen for nogle konvekse sæt
hvilket viser, at nærhedsoperatøren faktisk er en generalisering af projektoren.
Funktionen nærhedsoperatør er beskrevet ved inklusion
Hvis der kan differentieres, reduceres ligningen ovenfor til
Særlige tilfælde af proksimale gradientmetoder er