Måleenheder for mediekapacitet og informationsmængde

Informationsenheder bruges til at måle forskellige karakteristika forbundet med information .

Oftest vedrører måling af information måling af kapaciteten af ​​computerhukommelse ( lagerenheder ) og måling af mængden af ​​data, der transmitteres via digitale kommunikationskanaler . Mindre almindeligt målt er mængden af ​​information .

Informationsenheder

En stor mængde data kan indeholde meget lidt information. Det vil sige, at mængden af ​​data og mængden af ​​information er forskellige karakteristika, der bruges i forskellige områder relateret til information, men historisk blev navnet " informationsmængde " brugt i betydningen " mængden af ​​data " og navnene " informationsentropi " og "værdi af information" blev brugt til at måle mængden af ​​information. ".

Enheder til lagerkapacitet og datavolumen

De bruges til at måle kapaciteten af ​​lagringsmedie - lagringsenheder og til at måle datamængder .

Enheder til måling af mængden af ​​information

De bruges til at måle mængden af ​​information i en datamængde . Information entropi

Primær enhed

Det primære kendetegn ved mængden af ​​data er antallet af mulige tilstande .

Den primære enhed for datavolumenmåling er 1 mulig tilstand (værdi, kode).

Sekundære enheder

Den sekundære karakteristik af datamængden er bit .

Kapaciteten (volumen) af et ciffer kan være forskellig og afhænger af det anvendte kodningssystem.

Kapaciteter på et ciffer i binære, ternære og decimale kodningssystemer:

Et binært ciffer ( bit ) har 2 gensidigt udelukkende mulige tilstande (værdier, koder).

Et ternært ciffer ( trit ) har 3 gensidigt udelukkende mulige tilstande (værdier, koder).

En decimal (decite) har 10 gensidigt udelukkende mulige tilstande (værdier, koder).

Tertiære enheder

De tertiære karakteristika for mængden af ​​data er forskellige sæt bits .

Kapaciteten af ​​sættet af bit er lig med antallet af mulige tilstande af dette sæt bits , som bestemmes i kombinatorik , er lig med antallet af placeringer med gentagelser og beregnes af formlen:

mulige tilstande (koder, værdier)

hvor

 - antallet af mulige tilstande af en bit (grundlaget for det valgte kodningssystem),  er antallet af cifre i sættet af cifre .

Det vil sige, at kapaciteten af ​​sættet af bit er en eksponentiel funktion af antallet af bit med en base lig med antallet af mulige tilstande af en bit .

Eksempel:

1 byte består af 8 ( ) binære cifre ( ) og kan tage:

mulige tilstande (værdier, koder).

Logaritmiske enheder

Når nogle mængder, herunder mængden af ​​data, er eksponentielle funktioner , så er det i mange tilfælde mere bekvemt at bruge ikke selve mængderne, men logaritmerne af disse mængder.

Mængden af ​​data kan også repræsenteres logaritmisk, som logaritmen af ​​antallet af mulige tilstande [1] .

Informationsmængde ( datamængde ) - kan måles logaritmisk. [2] Det betyder, at når flere objekter behandles som én, ganges antallet af mulige tilstande , og mængden af ​​information tilføjes . Det er lige meget, om vi taler om tilfældige variable i matematik, digitale hukommelsesregistre i teknologi eller kvantesystemer i fysik.

For binære datamængder er det mere bekvemt at bruge binære logaritmer.

mulige tilstande , binært ciffer = 1 bit mulige tilstande , bit = 1 byte ( oktet ) mulige tilstande , bit = 1 KiloByte (KiloOctet) mulige tilstande , bit = 1 megabyte (MegaOctet) mulige tilstande , bit = 1 Gigabyte (GigaOctet) mulige tilstande , bit = 1 TeraByte (TeraOctet)

Det mindste heltal, hvis binære logaritme er et positivt heltal, er 2. Dets tilsvarende enhed, bit  , er grundlaget for beregning af information i digital teknologi.

For ternære datamængder er det mere bekvemt at bruge ternære logaritmer.

mulige tilstande , ternært ciffer ( trit ) mulige tilstande , ternære cifre ( trit s ) = 1 egenskab .

Enheden svarende til tallet 3, trit er lig med log 2 3≈1.585 bit.

En sådan enhed som nat (nat), svarende til den naturlige logaritme , bruges i ingeniørmæssige og videnskabelige beregninger. I computerteknologi bruges det praktisk talt ikke, da bunden af ​​naturlige logaritmer ikke er et heltal.

For mængder af decimaldata er det mere praktisk at bruge decimallogaritmer.

mulige tilstande , decimal = 1 dec mulige tilstande , decimaler = 1 kilodecite . mulige tilstande , decimaler = 1 megadecite . mulige tilstande , decimaler = 1 gigadecite .

Enheden svarende til tallet 10, decit er lig med log 2 10≈3,322 bit.

Inden for kablet kommunikationsteknologi (telegraf og telefon) og radio fik en informationsenhed historisk set for første gang betegnelsen baud .

Bit-afledte enheder

I heltal af binære cifre (bits) er antallet af mulige tilstande lig med to potenser.

Tetrad, nippe, nippe

Fire binære cifre (4 bit) har et særligt navn - tetrad , half byte , nibble , som indeholder mængden af ​​information indeholdt i et hexadecimalt ciffer.

Byte

Målinger i bytes
GOST 8.417-2002 SI- præfikser IEC -præfikser
Navn Betegnelse Grad Navn Grad Navn Betegnelse Grad
byte B 10 0 10 0 byte B B 20 _
kilobyte KB 10 3 kilo- 10 3 kibibyte KiB KiB 2 10
megabyte MB 10 6 mega- 10 6 mebibyte MiB MiB 2 20
gigabyte GB 10 9 giga- 10 9 gibibyte GiB GiB 2 30
terabyte TB 10 12 tera- 10 12 tebibyte TiB Tib 2 40
petabyte pb 10 15 peta- 10 15 pebibyte PiB P&B 2 50
exabyte Ebyte 10 18 eksa- 10 18 exbibyte EiB EIB 2 60
zettabyte Zbyte 10 21 zetta- 10 21 zebibyte ZiB ZiB 2 70
yottabyte Ibyte 10 24 yotta- 10 24 yobibyte YiB Y&B 2 80

Den næste populære informationsenhed i rækkefølge er 8 bits eller bytes (de terminologiske finesser er beskrevet nedenfor ). Det er til en byte (og ikke til en smule), at alle store mængder information beregnet i computerteknologi er direkte givet.

Værdier som et maskinord osv., der udgør flere bytes, bruges næsten aldrig som måleenheder .

Kilobyte

For at måle store kapaciteter af lagerenheder og store mængder information, der har et stort antal bytes, bruges enhederne "kilobyte" = [1000] bytes og "Kbytes" [3] ( kibibyte , kibibyte) = 1024 bytes (ca. forveksling af decimale og binære enheder og termer se nedenfor ). Denne størrelsesorden er for eksempel:

Mængden af ​​information opnået ved at læse en "3.5" højdensitetsdiskette er 1440 KB (præcis) ; andre formater beregnes også i hele antal KB.

Megabyte

Enhederne "megabyte" = 1000 kilobytes = [1.000.000] bytes og "mebibyte" [3] (mebibyte) = 1024 kbytes = 1.048.576 bytes bruges til at måle mængden af ​​lagermedier.

Adresserummet for Intel 8086-processoren var 1 MB.

RAM- og CD-ROM- kapacitet måles i binære enheder (mebibyte, selvom de normalt ikke kaldes det), men for harddiskkapacitet var decimalmegabyte mere populære.

Moderne harddiske har volumener udtrykt i disse enheder som mindst sekscifrede tal, så der bruges gigabyte til dem.

Gigabyte

Enhederne "gigabyte" = 1000 megabyte = [1.000.000] kilobytes = [1.000.000.000] bytes og "GB" [3] ( gibibyte , gibibyte) = 1024 MB = 230 bytes måler størrelsen af ​​store lagermedier, såsom harddiske . Forskellen mellem binære og decimalenheder er allerede over 7%.

Størrelsen af ​​et 32-bit adresserum er 4 GB ≈ 4,295 MB. Den samme størrelsesorden har størrelsen på DVD-ROM og moderne medier på flash-hukommelse . Harddiskstørrelser når allerede hundreder og tusinder af gigabyte.

For at beregne endnu større mængder information er der enheder af terabyte og tebibyte (henholdsvis 10 12 og 2 40 byte), petabyte og pebibyte (henholdsvis 10 15 og 2 50 byte) osv.

Hvad er "byte"?

I princippet defineres en byte for en bestemt computer som det mindste hukommelsesadressetrin , hvilket på ældre maskiner ikke nødvendigvis var lig med 8 bits (og hukommelsen består ikke nødvendigvis af bits - se f.eks.: ternær computer ). I moderne tradition betragtes en byte ofte som lig med otte bits .

I sådanne betegnelser som byte (russisk) eller B (engelsk) betyder byte (B) præcis 8 bits, selvom selve udtrykket "byte" ikke er helt korrekt set fra et teoretisk synspunkt.

fransk bruges symbolerne o , Ko , Mo osv. (fra ordet oktet) for at understrege, at vi taler om 8 bit.

Hvad er "kilo"?

I lang tid blev forskellen mellem faktorer på 1000 og 1024 forsøgt ikke at tillægge stor betydning. For at undgå misforståelser skelnes der mellem:

disse enheder er pr. definition henholdsvis 10 3 , 10 6 , 10 9 bytes og så videre.

IEC foreslår "kibibyte", "mebibyte", "gibibyte" osv. som udtryk for "KB", "MB", "GB" osv., men disse termer bliver kritiseret for at være uudtalelige og findes ikke i talesproget tale.

Inden for forskellige områder af datalogi er præferencer i brugen af ​​decimale og binære enheder også forskellige. Desuden, selv om der er gået flere år siden standardiseringen af ​​terminologi og betegnelser, søger de langt fra overalt at præcisere den nøjagtige betydning af de anvendte enheder.

engelsk, for "kibi" \u003d 1024 \u003d 2 10 , bruges et stort bogstav undertiden K , for at understrege forskellen fra præfikset angivet med det lille bogstav SI kilo . En sådan betegnelse er imidlertid ikke baseret på en autoritativ standard, i modsætning til den russiske GOST vedrørende "Kbytes".

Variationer

Noter

  1. "logaritme" på answers.com Arkiveret 22. september 2008 på Wayback Machine 
  2. ↑ Fra et fysiks synspunkt er mængden af ​​information (såvel som entropi tæt på den i betydning ) dimensionsløs . I praksis, som ved måling af dimensionsløse vinkler , bruges forskellige praktisk praktiske enheder.
  3. 1 2 3 GOST 8.417-2002 "Mængdeenheder" . Hentet 11. juni 2008. Arkiveret fra originalen 2. februar 2012.

Se også