f -divergens ( f -diskrepans ) er en klasse af funktionaler, der generelt definerer et asymmetrisk mål for divergens mellem to sandsynlighedsfordelinger og. Almindelig anvendt i informationsteori og sandsynlighedsteori . Funktionen er entydigt bestemt (genereret) af en funktion, der opfylder visse betingelser.
Denne klasse af divergenser blev introduceret og undersøgt uafhængigt af Csiszár (1963 ), Morimoto (1963 ) og Ali & Silvey (1966 ). Derfor kan du nogle gange finde navnene f -Chisara divergens , Chisara-Morimoto divergens eller Ali-Silvi distance.
Lad og være sandsynlighedsfordelinger givet på sættet sådan, at er absolut kontinuerlig med hensyn til . Lad funktionen være konveks for og . Så definerer funktionen f -divergensen med hensyn til følgende måde:
Hvis er et mål på , og begge distributioner og er kontinuerlige med hensyn til , dvs. der er funktioner og , så kan f -divergensen skrives som
I tilfælde af Lebesgue-målet har fordelingerne tætheder , og f - divergensen tager derefter formen
For diskrete distributioner og , hvor ,
Det skal bemærkes, at funktionen er defineret op til udtrykket , hvor er en vilkårlig konstant. Formen for f -divergensen afhænger nemlig ikke af valget af , da funktionsleddet yder et nulbidrag til værdien af integralet. Derudover kan funktionen indeholde en positiv multiplikationskonstant , som angiver måleenheden for divergensen. I denne forbindelse angiver nogle forfattere (for eksempel Basseville (2010 )) yderligere begrænsninger for funktionen :
Den første af disse begrænsninger fikserer konstanten , den anden fikserer konstanten . Betingelsen kan være nyttig ved, at i dette tilfælde med et minimum på et punkt (se Liese & Vajda (2006 )), er udtrykket for f -divergensen intuitivt lettere at forstå. Denne måde at konkretisere en funktion på er dog ikke altid praktisk: for eksempel kan eksistensen af en kontinuert version af f -entropien forbundet med en given f -divergens kræve en anden værdi af konstanten .
f -divergens kan udvides i en Taylor-serie og skrives som en vægtet sum af χ - type afstande (se Nielsen & Nock (2013 )).
Mange velkendte divergenser, såsom Kullback-Leibler divergens , Hellinger distance squared , chi-squared distance og en række andre, er specielle tilfælde af f -divergens, som svarer til et bestemt valg af funktion . Den følgende tabel oplister nogle almindelige typer af divergenser mellem sandsynlighedsfordelinger og deres tilsvarende funktion (se Liese & Vajda (2006 )).
Divergens | Generativ funktion |
---|---|
Kullback-Leibler divergens | |
Omvendt Kullback-Leibler divergens | |
Hellinger afstand i kvadrat | |
Fuld variation afstand | |
Pearson afstand | |
Neumann afstand | |
Alfa divergens | |
Alfa divergens (andre notationer) |
Under hensyntagen til den sidste egenskab kunne klassen af f -divergenser defineres tilsvarende som . En lignende definition findes for eksempel i Zhang (2004 ). Den fortolkning af fordelingen som sand, som følger af definitionen af f -divergens, er således ikke dens grundlæggende egenskab, men er kun en konsekvens af enigheden om rækkefølgen af argumenterne i definitionen. Med andre ord, argumenterne og er konceptuelt lige.
Det er også værd at bemærke, at f -divergensen er en dimensionsløs størrelse , uanset størrelsen af mængden .
Ud over f -divergens definerede I. Chisar det relaterede begreb f -entropi ( Csiszár (1972 )).