Asymmetriske talsystemer

Asymmetriske talsystemer ( ANS , fra "asymmetriske talsystemer") er en familie af entropikodningsmetoder opfundet af Yaroslav (Jarek) Duda i 2006 baseret på konceptet om asymmetriske talsystemer, han introducerede. Siden 2014 har den været brugt til datakomprimering i en række programmer, da disse metoder, hvad angår komprimeringsgraden, giver nogenlunde samme gode nøjagtige tilnærmelse til den optimale entropikodning som aritmetisk kodning , men de har højere ydeevne, ikke ringere i dekompressionshastighed end Huffmans kodningsalgoritmer ; desuden er det væsentligt, at disse metoder ikke er beskyttet af patenter og er gratis at bruge, da oprettelsen og distributionen af ​​et gratis alternativ til aritmetisk kodning var forfatterens mål.

Konceptet med asymmetriske talsystemer

Asymmetriske talsystemer er en generalisering af positionstalsystemer, hvor forskellige tegn kan indkodes med et forskelligt antal cifre, afhængigt af de foregående cifre (tegn).

I databehandling er det sædvanligt at repræsentere information som en strøm af bit, og tilføjelsen af ​​ny information - et symbol - sker ved at tildele tallet i slutningen de cifre, der svarer til symbolets kode - nye lavordenscifre. Når man nærmer sig med konventionelle positionsnummersystemer, svarer ethvert tegn til det samme antal cifre. Dette er velegnet i tilfælde, hvor sandsynligheden for at møde forskellige symboler er den samme.

Når sandsynligheden for at støde på forskellige tegn er forskellige, bruges entropikodning til mere kompakt at registrere information. Så i Huffman-kodning kan forskellige tegn skrives i forskellige antal bits. Men i dette tilfælde er tegn kodet af et helt antal bits - hvilket især betyder, at uanset hvor ofte et tegn forekommer, kræves der mindst en bit for at kode det.

I asymmetriske talsystemer afhænger kodningen af ​​et tegn ikke kun af, hvilken slags karakter det er, men også af den tidligere kontekst, der afspejles af staten. Antallet af nødvendige cifre forbliver et heltal, men det varierer og kan endda være nul.

Litteratur