Hammerafstand

Hamming distance (kodeafstand) - antallet af positioner, hvor de tilsvarende tegn i to ord af samme længde er forskellige [1] . Mere generelt anvendes Hamming-afstand til strenge af samme længde som et hvilket som helst q - ary alfabet og fungerer som en differensmetrik (en funktion, der bestemmer afstanden i et metrisk rum ) for objekter af samme dimension.

Metrikken blev oprindeligt formuleret af Richard Hamming under hans tid hos Bell Labs for at definere et mål for forskellen mellem kodeord (binære vektorer ) i et vektorrum af kodeord: i dette tilfælde Hamming-afstanden mellem to binære sekvenser (vektorer) og længden er antallet af stillinger, hvor de er forskellige. I denne formulering blev Hamming-afstanden inkluderet i NIST Dictionary of Algorithms and Data Structures . Hamming-afstanden er et specialtilfælde af Minkowski-metrikken (med en passende definition af subtraktion):  

.

To ord med en Hamming-afstand på 1 kaldes naboer.

I nogle talsystemer, såsom Gray-koden , har kodede heltal, der adskiller sig med 1, en Hamming-afstand på 1. Sådanne tal siges at være "tilstødende".

Nabokodning er vigtig i logisk enhedsdesign, hvor logiske racer skal undgås .

Eksempler

Egenskaber

Et sæt ord af lige længde danner et metrisk rum , hvor der for hvert par rumelementer er defineret et tal - Hamming-afstanden , der opfylder metrikkens aksiomer:

  1. ( identitetsaksiom ).
  2. ( symmetriaksiom ).
  3. ( trekantaksiom eller trekantsulighed ).
så følger symmetriaksiomet af identitetsaksiomet og trekantens ulighed.

Hammerafstand er altid:

hvor  er længden af ​​ord i tegn.

Hamming distance i bioinformatik og genomik

For nukleinsyrer ( DNA og RNA ) afhænger muligheden for hybridisering af to polynukleotidkæder med dannelsen af ​​en sekundær struktur - en dobbelthelix  - af graden af ​​komplementaritet af nukleotidsekvenserne i begge kæder. Efterhånden som Hamming-afstanden stiger, falder antallet af hydrogenbindinger dannet af komplementære basepar, og følgelig falder stabiliteten af ​​dobbeltkæden. Startende fra en eller anden grænse Hamming-afstand, bliver hybridisering umulig.

I den evolutionære divergens af homologe DNA-sekvenser er Hamming-afstanden et mål, hvormed man kan bedømme den tid, der er gået siden divergensen af ​​homologer, for eksempel længden af ​​det evolutionære segment, der adskiller homologe gener og et precursor-gen.

Se også

Noter

  1. Hamming distance: Antallet af cifferpositioner, hvor de tilsvarende cifre i to binære ord af samme længde er forskellige ( Federal Standard 1037C Arkiveret 2. marts 2009 på Wayback Machine ).

Litteratur