Informationsenheder bruges til at måle forskellige karakteristika forbundet med information .
Oftest vedrører måling af information måling af kapaciteten af computerhukommelse ( lagerenheder ) og måling af mængden af data, der transmitteres via digitale kommunikationskanaler . Mindre almindeligt målt er mængden af information .
En stor mængde data kan indeholde meget lidt information. Det vil sige, at mængden af data og mængden af information er forskellige karakteristika, der bruges i forskellige områder relateret til information, men historisk blev navnet " informationsmængde " brugt i betydningen " mængden af data " og navnene " informationsentropi " og "værdi af information" blev brugt til at måle mængden af information. ".
De bruges til at måle kapaciteten af lagringsmedie - lagringsenheder og til at måle datamængder .
De bruges til at måle mængden af information i en datamængde . Information entropi
Det primære kendetegn ved mængden af data er antallet af mulige tilstande .
Den primære enhed for datavolumenmåling er 1 mulig tilstand (værdi, kode).
Den sekundære karakteristik af datamængden er bit .
Kapaciteten (volumen) af et ciffer kan være forskellig og afhænger af det anvendte kodningssystem.
Kapaciteter på et ciffer i binære, ternære og decimale kodningssystemer:
Et binært ciffer ( bit ) har 2 gensidigt udelukkende mulige tilstande (værdier, koder).
Et ternært ciffer ( trit ) har 3 gensidigt udelukkende mulige tilstande (værdier, koder).
…
En decimal (decite) har 10 gensidigt udelukkende mulige tilstande (værdier, koder).
…
De tertiære karakteristika for mængden af data er forskellige sæt bits .
Kapaciteten af sættet af bit er lig med antallet af mulige tilstande af dette sæt bits , som bestemmes i kombinatorik , er lig med antallet af placeringer med gentagelser og beregnes af formlen:
mulige tilstande (koder, værdier)hvor
- antallet af mulige tilstande af en bit (grundlaget for det valgte kodningssystem), er antallet af cifre i sættet af cifre .Det vil sige, at kapaciteten af sættet af bit er en eksponentiel funktion af antallet af bit med en base lig med antallet af mulige tilstande af en bit .
Eksempel:
1 byte består af 8 ( ) binære cifre ( ) og kan tage:
mulige tilstande (værdier, koder).
Når nogle mængder, herunder mængden af data, er eksponentielle funktioner , så er det i mange tilfælde mere bekvemt at bruge ikke selve mængderne, men logaritmerne af disse mængder.
Mængden af data kan også repræsenteres logaritmisk, som logaritmen af antallet af mulige tilstande [1] .
Informationsmængde ( datamængde ) - kan måles logaritmisk. [2] Det betyder, at når flere objekter behandles som én, ganges antallet af mulige tilstande , og mængden af information tilføjes . Det er lige meget, om vi taler om tilfældige variable i matematik, digitale hukommelsesregistre i teknologi eller kvantesystemer i fysik.
For binære datamængder er det mere bekvemt at bruge binære logaritmer.
mulige tilstande , binært ciffer = 1 bit mulige tilstande , bit = 1 byte ( oktet ) mulige tilstande , bit = 1 KiloByte (KiloOctet) mulige tilstande , bit = 1 megabyte (MegaOctet) mulige tilstande , bit = 1 Gigabyte (GigaOctet) mulige tilstande , bit = 1 TeraByte (TeraOctet)Det mindste heltal, hvis binære logaritme er et positivt heltal, er 2. Dets tilsvarende enhed, bit , er grundlaget for beregning af information i digital teknologi.
For ternære datamængder er det mere bekvemt at bruge ternære logaritmer.
mulige tilstande , ternært ciffer ( trit ) mulige tilstande , ternære cifre ( trit s ) = 1 egenskab .Enheden svarende til tallet 3, trit er lig med log 2 3≈1.585 bit.
En sådan enhed som nat (nat), svarende til den naturlige logaritme , bruges i ingeniørmæssige og videnskabelige beregninger. I computerteknologi bruges det praktisk talt ikke, da bunden af naturlige logaritmer ikke er et heltal.
For mængder af decimaldata er det mere praktisk at bruge decimallogaritmer.
mulige tilstande , decimal = 1 dec mulige tilstande , decimaler = 1 kilodecite . mulige tilstande , decimaler = 1 megadecite . mulige tilstande , decimaler = 1 gigadecite .Enheden svarende til tallet 10, decit er lig med log 2 10≈3,322 bit.
Inden for kablet kommunikationsteknologi (telegraf og telefon) og radio fik en informationsenhed historisk set for første gang betegnelsen baud .
I heltal af binære cifre (bits) er antallet af mulige tilstande lig med to potenser.
Fire binære cifre (4 bit) har et særligt navn - tetrad , half byte , nibble , som indeholder mængden af information indeholdt i et hexadecimalt ciffer.
Målinger i bytes | ||||||||
---|---|---|---|---|---|---|---|---|
GOST 8.417-2002 | SI- præfikser | IEC -præfikser | ||||||
Navn | Betegnelse | Grad | Navn | Grad | Navn | Betegnelse | Grad | |
byte | B | 10 0 | — | 10 0 | byte | B | B | 20 _ |
kilobyte | KB | 10 3 | kilo- | 10 3 | kibibyte | KiB | KiB | 2 10 |
megabyte | MB | 10 6 | mega- | 10 6 | mebibyte | MiB | MiB | 2 20 |
gigabyte | GB | 10 9 | giga- | 10 9 | gibibyte | GiB | GiB | 2 30 |
terabyte | TB | 10 12 | tera- | 10 12 | tebibyte | TiB | Tib | 2 40 |
petabyte | pb | 10 15 | peta- | 10 15 | pebibyte | PiB | P&B | 2 50 |
exabyte | Ebyte | 10 18 | eksa- | 10 18 | exbibyte | EiB | EIB | 2 60 |
zettabyte | Zbyte | 10 21 | zetta- | 10 21 | zebibyte | ZiB | ZiB | 2 70 |
yottabyte | Ibyte | 10 24 | yotta- | 10 24 | yobibyte | YiB | Y&B | 2 80 |
Den næste populære informationsenhed i rækkefølge er 8 bits eller bytes (de terminologiske finesser er beskrevet nedenfor ). Det er til en byte (og ikke til en smule), at alle store mængder information beregnet i computerteknologi er direkte givet.
Værdier som et maskinord osv., der udgør flere bytes, bruges næsten aldrig som måleenheder .
For at måle store kapaciteter af lagerenheder og store mængder information, der har et stort antal bytes, bruges enhederne "kilobyte" = [1000] bytes og "Kbytes" [3] ( kibibyte , kibibyte) = 1024 bytes (ca. forveksling af decimale og binære enheder og termer se nedenfor ). Denne størrelsesorden er for eksempel:
Mængden af information opnået ved at læse en "3.5" højdensitetsdiskette er 1440 KB (præcis) ; andre formater beregnes også i hele antal KB.
Enhederne "megabyte" = 1000 kilobytes = [1.000.000] bytes og "mebibyte" [3] (mebibyte) = 1024 kbytes = 1.048.576 bytes bruges til at måle mængden af lagermedier.
Adresserummet for Intel 8086-processoren var 1 MB.
RAM- og CD-ROM- kapacitet måles i binære enheder (mebibyte, selvom de normalt ikke kaldes det), men for harddiskkapacitet var decimalmegabyte mere populære.
Moderne harddiske har volumener udtrykt i disse enheder som mindst sekscifrede tal, så der bruges gigabyte til dem.
Enhederne "gigabyte" = 1000 megabyte = [1.000.000] kilobytes = [1.000.000.000] bytes og "GB" [3] ( gibibyte , gibibyte) = 1024 MB = 230 bytes måler størrelsen af store lagermedier, såsom harddiske . Forskellen mellem binære og decimalenheder er allerede over 7%.
Størrelsen af et 32-bit adresserum er 4 GB ≈ 4,295 MB. Den samme størrelsesorden har størrelsen på DVD-ROM og moderne medier på flash-hukommelse . Harddiskstørrelser når allerede hundreder og tusinder af gigabyte.
For at beregne endnu større mængder information er der enheder af terabyte og tebibyte (henholdsvis 10 12 og 2 40 byte), petabyte og pebibyte (henholdsvis 10 15 og 2 50 byte) osv.
I princippet defineres en byte for en bestemt computer som det mindste hukommelsesadressetrin , hvilket på ældre maskiner ikke nødvendigvis var lig med 8 bits (og hukommelsen består ikke nødvendigvis af bits - se f.eks.: ternær computer ). I moderne tradition betragtes en byte ofte som lig med otte bits .
I sådanne betegnelser som byte (russisk) eller B (engelsk) betyder byte (B) præcis 8 bits, selvom selve udtrykket "byte" ikke er helt korrekt set fra et teoretisk synspunkt.
På fransk bruges symbolerne o , Ko , Mo osv. (fra ordet oktet) for at understrege, at vi taler om 8 bit.
I lang tid blev forskellen mellem faktorer på 1000 og 1024 forsøgt ikke at tillægge stor betydning. For at undgå misforståelser skelnes der mellem:
disse enheder er pr. definition henholdsvis 10 3 , 10 6 , 10 9 bytes og så videre.
IEC foreslår "kibibyte", "mebibyte", "gibibyte" osv. som udtryk for "KB", "MB", "GB" osv., men disse termer bliver kritiseret for at være uudtalelige og findes ikke i talesproget tale.
Inden for forskellige områder af datalogi er præferencer i brugen af decimale og binære enheder også forskellige. Desuden, selv om der er gået flere år siden standardiseringen af terminologi og betegnelser, søger de langt fra overalt at præcisere den nøjagtige betydning af de anvendte enheder.
På engelsk, for "kibi" \u003d 1024 \u003d 2 10 , bruges et stort bogstav undertiden K , for at understrege forskellen fra præfikset angivet med det lille bogstav SI kilo . En sådan betegnelse er imidlertid ikke baseret på en autoritativ standard, i modsætning til den russiske GOST vedrørende "Kbytes".
Informationsenheder | |
---|---|
Basisenheder | |
Relaterede enheder | |
Traditionelle bit-enheder | |
Traditionelle byte-enheder | |
IEC bit-enheder |
|
IEC byte enheder |