Bevægelseskompensation

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 11. marts 2018; checks kræver 13 redigeringer .

Bevægelseskompensation er en af de vigtigste algoritmer , der bruges til at behandle og komprimere videodata . Algoritmen bruger ligheden mellem tilstødende frames i videosekvensen og finder bevægelsesvektorerne for individuelle dele af billedet (normalt blokke på 16x16 og 8x8). Brugen af kompensation gør det muligt gentagne gange at øge kompressionsforholdet under kompression på grund af fjernelse af redundans i form af matchende dele af rammer. Bruges ikke kun til komprimering, men også til videofiltrering , ændring af billedhastigheden osv.

Ideen med algoritmen

Løsning af problemet med komprimering har været en afgørende bekymring siden fremkomsten af digital video. Til evaluering, lad os tage en videosekvens med følgende parametre:

Billedstørrelse: 720×576 (standardstørrelse for europæisk tv ( PAL ), 414.720 pixels)
Billedhastighed: 25 fps (også standard for PAL)
Farverepræsentation: YV12 ( YUV 4:2:0) (16 bits pr. 4 pixels + 8 bits hver = 12 bits pr. pixel)

Som et resultat vil det tage 14,8 megabyte at optage eller transmittere et sekund af sådan video uden komprimering, eksklusive lyd og serviceoplysninger. For at gemme halvanden times film vil der allerede være brug for 79.920 megabyte (78 gigabyte ).

I næsten enhver video er tilstødende rammer ens, har fælles objekter, som som regel bevæger sig parallelt. Og det er helt naturligt at ønske at kode video på en sådan måde, at objekter ikke bliver kodet mange gange, men nogle af deres forskydninger er ganske enkelt beskrevet.[ neutralitet? ]

Selv i dette eksempel, hvis vi tager og pakker den 0. ramme og alle billeder af interframe-forskellen med arkiveren, får vi en mærkbar[ hvor meget? ] kompressionsforstærkning. Men denne gevinst kan øges markant.

Et eksempel på, hvordan algoritmen fungerer

På grund af den høje beregningsmæssige kompleksitet af mønstergenkendelsesalgoritmer og den utilstrækkelige nøjagtighed af deres arbejde, bruges forskellige metoder til hurtigt at finde bevægelsesvektorer (naturligvis ikke uden tab).

1. Den aktuelle ramme er indlæst.
2. Rammen er opdelt i blokke (f.eks. 16×16).

3. Blokke omgås (hver blok behandles separat i dette tilfælde).
4. Når man tæller en blok, omgås et bestemt kvarter af blokken i søgen efter den maksimale overensstemmelse med billedet af blokken på den forrige ramme inden for dette kvarter.

5. Efter at søgningen er afsluttet, får vi således et sæt vektorer, der angiver "bevægelsen" af billedblokke mellem rammer. Disse vektorer kan naturligvis bruges til at skabe et billede af en kompenseret ramme, der bedre tilnærmer den ramme, for hvilken bevægelseskompensation blev udført.

Implementeringsproblemer

Når du skriver en algoritme, kan spørgsmålet opstå - "Hvordan evalueres "ligheden" af billedfragmenter?". Nogle af mulighederne:

Beregning af SSD (summen af kvadrerede afvigelser ). For et par blokke giver det gode resultater i kvalitet (især med benchmarks, da PSNR- metrikken (beregnet ud fra standardafvigelsen) er den mest almindelige), men kræver betydelige ressourcer (multiplikation er en langsom operation, selv tabellen over kvadrater fremskynder ikke processen ret meget) og er meget følsom over for ændringer i lysstyrken. Jo mindre SSD'en er, jo mere ens blokkene.
Sammenligning efter karakteristiske punkter. Kan være meget hurtig (ved kun at krydse et lille antal punkter), men kan korrelere meget dårligt med bedre metrikker.
Beregning af SAD (summen af absolutte forskelle). Kører i rimelig tid og giver acceptable resultater med hensyn til kvalitet (men har dårlig støjtolerance). Det er faktisk brugt og har god hastighedsydelse på grund af brugen af SIMD- udvidelser (som giver dig mulighed for at udføre mange subtraktioner samtidigt uden at bruge "intelligente" processorværktøjer til parallelisering af beregninger).

Den mest anvendte beregning er SAD. Det næste spørgsmål er: "Hvordan søger man efter den ønskede blok?"

Fuld opregning (fuld søgning). I nogle områder omkring den behandlede blok søges koordinaterne for den nødvendige blok. Hvis vi har en blok på 16×16 og et søgeområde på ±32 × ±32, så skal vi beregne SAD 4096 gange for hver behandlet blok. Dette er langsomt, men det giver et garanteret bedste resultat for en given metrik.
Mønstersøgning. Kører hurtigt og giver ikke de bedste resultater.
Spiralsøgning. Tæller,[ af hvem? ] at jo tættere blokken er på den nuværende, jo mere sandsynligt er det, at det er den, du leder efter. Og dens nøjagtighed falder fra midten til kanterne af søgeområdet. Har en ekstra fordel. På billedet (i denne artikel) med bevægelsesvektorer er lange vektorer synlige på himlen, da en komplet opregning blev brugt fra det øverste venstre hjørne af søgeområdet, selvom det er indlysende, at der praktisk talt ikke er nogen forskel med nulvektorer , men lange vektorer forværrer komprimerbarheden af vektorfeltet, og nulvektorer - nej. I en spiralsøgning er der altid nul vektorer på de uændrede sektioner.

Implementeringseksempel

Implementering af brute force-metoden i C++

void ME ( BYTE * CurrentFrame , BYTE * PreviousFrame , int Width , int Height , MV * MotionVectors ) { int BlocksPerHeight = ( Højde + 15 ) >> 4 ; //Antal blokke vertikalt int BlocksPerWidth = ( Width + 15 ) >> 4 ; //Antal blokke vandret int VerticalOffset , HorisontalOffset , TempOffset ; // Offsets int OffsetPerLine = Width + Border * 2 ; //Offset med én linje int StartOffset = OffsetPerLine * Border + Border ; //Start offset BYTE * CurrPtr , * PrevPtr ; //Pegere til forrige og næste MV -rammer ProbMV ; //Trial vektor lang MinError , Error ; //Fejlværdier for ( int i = 0 ; i < BlocksPerHeight ; i ++ ) { for ( int j = 0 ; j < BlocksPerWidth ; j ++ ) { // Beregn offsets VerticalOffset = ( i << 4 ) * OffsetPerLine + StartOffset ; HorizontalOffset = ( j << 4 ); //Sæt offsets for den aktuelle blok CurrPtr = CurrentFrame + VerticalOffset + HorizontalOffset ; PrevPtr = PreviousFrame + VerticalOffset + HorizontalOffset ; MinError = MAXLONG ; //Vi anser fejlen for at være meget stor for ( int y = - MaxMotion ; y < MaxMotion ; y ++ ) { TempOffset = y * OffsetPerLine ; //Gem på multiplikationer for ( int x = - MaxMotion ; x < MaxMotion ; x ++ ) { //GetError - bloksammenligningsfunktion, fx SAD Error = GetError ( CurrPtr , PrevPtr + TempOffset + x , OffsetPerLine ); //Ny kandidat :) if ( Error < MinError ) { probMV . x = x ; probMV . y = y _ MinError = Fejl ; } } } //Skriv den resulterende vektor :) MotionVectors [ i * BlocksPerWidth + j ] = ProbMV ; } } }

I det nye[ hvornår? ] MPEG -4 AVC/H.264-standarden introducerede også ikke-kvadratiske (rektangulære) blokke, hvis størrelse kan opdeles op til 4×4 pixels . Det er således muligt at bruge ligheden mellem naborammer meget effektivt, og på grund af blokkenes mere komplekse form øges nøjagtigheden af bevægelseskompensation ved grænserne af bevægelige objekter. Ud over bevægelseskompensation bruges interframe-informationskomprimering og uafhængig blokkomprimering til yderligere billedforfining (eller for nyligt opståede områder, der ikke var i tidligere frames).

Ud over kompression bruges bevægelseskompensation aktivt[ af hvem? ] i videofiltrering, især i filtermuligheder af høj kvalitet: deinterlacing ( interlacing til progressiv ), støjreduktion , billedhastighedsændringer og andre.

Se også

global

Links

Temporal Rate Conversion (engelsk) - En artikel om bevægelseskompensation på Microsofts websted.

Kompressionsmetoder _

Teori

Information	Egen Gensidig Entropi Betinget entropi Kompleksitet Redundans
Enheder	Bit Nat Nappe Hartley Hartley formel

Tabsfri

Entropi kompression	Asymmetriske talsystemer Huffman algoritme Adaptiv Huffman-algoritme Shannon-Fano algoritme Shannons algoritme Aritmetisk kodning ( interval ) Golomb koder Delta Universel kode Elias fibonacci
Ordbogsmetoder	RLE Tøm luften ud LZ ( LZ77/LZ78 LZSS LZW LZWL LZO LZMA LZX LZRW LZJB LZT LZ4 Brotli zstandard )
Andet	RLE CTW BWT MTF PPM DMC

Lyd

Teori	Konvolution PCM Aliasing Prøveudtagning Kotelnikovs teorem
Metoder	LPC LAR LSP WLPC CELP ACELP En lov μ-lov ADPCM MDCT Fourier transformation Psykoakustisk model
Andet	Audio kompressor Talekompression Båndkodning

Billeder

Vilkår	farverum Pixel Mætningsundersampling Kompressionsartefakter
Metoder	RLE DPCM fraktal wavelet EZW SPIHT LP Forbered PCL
Andet	Bitrate Standard testbillede PSNR Kvantisering

Video

Vilkår	Video egenskaber Ramme Rammetyper Videokvalitet
Metoder	Bevægelseskompensation Forbered Kvantisering wavelet
Andet	Video codec Teori om prisforvrængning CBR ABR VBR