Code page ( engelsk kodetabel ) - en tabel, der matcher hver byteværdi med et bestemt tegn (eller dets fravær). Typisk er en tegnkode 8 bit i størrelse , så en tegntabel kan maksimalt indeholde 256 tegn, hvilket betyder, at enhver 8-bit tegntabel er alvorligt utilstrækkelig til at repræsentere flersprogede tekster. Derudover bruges nogle tegn som kontroltegn , hvorfor antallet af trykte tegn sjældent overstiger 223 [1] .
Historisk set blev udtrykket kodetabel introduceret af IBM Corporation ; udskiftelige kodesider blev brugt til at understøtte forskellige sprog (med alfabetiske skrivesystemer). For nylig har der været forvirring mellem udtrykket "kodetabel" og det mere generelle begreb om et tegnsæt (kodning).
I øjeblikket anvendes hovedsageligt to typer kodninger: ASCII- kompatibel og EBCDIC- kompatibel [2] , hvor førstnævnte overvejende dominerer. I ASCII-kompatible kodninger er koder for 95 printbare tegn og 33 kontroltegn faste, og de resterende 128 kodepunkter bruges til forskellige ikke-ASCII-tegn.
Til kodning af tekster på russisk (det vil sige kyrilliske bogstaver ) er følgende kodesider mest brugt:
Brug af forskellige tegntabeller skaber en masse besvær for både brugere og programmører. Når du forsøger at læse en tekstfil ved hjælp af en tegntabel, der er inkompatibel med den, hvori den blev oprettet, er der fejl . I de senere år er Unicode blevet udbredt som et alternativ til traditionelle kodesider.
På Microsoft Windows-systemer er tegntavler en vigtig komponent i lokalisering , der er angivet i registreringsdatabasenøglerne HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage\ [ 3] .
Historisk set (i Windows 3.x- og Windows 9x-systemer ) var der to typer tegntabeller. ANSI tegntabel [4] (eng. ANSI kodetabel , i registreringsdatabasen: ACP ), også kaldet Windows [5] er oprindelige Windows kodetabel. De indeholder en masse typografiske tegn , men næsten ingen pseudografik på grund af det faktum, at de er beregnet til brug i et grafisk miljø. Microsoft erkendte efterfølgende, at brugen af ANSI- navnet skyldtes en misforståelse. [6] "ANSI"/Windows-kodninger omfatter især Windows-1252 og det førnævnte Windows-1251 . Microsoft omtaler også tegntabeller som kodetabeller, hvoraf nogle positioner kræver en anden (terminal)byte for at danne et tegn, det vil sige dem, der tillader en to-byte repræsentation af nogle tegn [7] , selvom de strengt taget er allerede tegnkodninger med variabel længde.
OEM-kodningerne (eng. OEM-kodeside , i registreringsdatabasen: OEMCP ) er baseret på CP437 og indeholder VGA - kompatibel pseudografik . Ovenstående alternative kodning er kendt som CP866 på Windows .
Startende med Windows NT dukkede en tredje klasse tegntabel op: Macintosh-kodninger (engelsk Macintosh-kodetabel , i registreringsdatabasen: MACCP ), kompatibel med MacOS .
Tegnkodninger | |
---|---|
Historiske indkodninger | yderligere komp. semafor (Makarov) morse Bodo MTK-2 komp. 6-bit SCP RADIX-50 EBCDIC KOI-7 ISO 646 |
moderne 8-bit repræsentation | symboler ASCII ikke-ASCII 8-bit kodesider Kyrillisk KOI-8 Grundlæggende kodning Mackyrillisk ISO 8859 1 (lat.) 2 3 fire 5 (kir.) 6 7 otte 9 ti elleve 12 13 fjorten 15 (€) 16 Windows 1250 1251 (Kir.) 1252 1253 1254 1255 1256 1257 1258 WGL4 IBM og DOS 437 850 852 855 866 "alternativ" MIC |
Multibyte | traditionel DBCS GB2312 HTML unicode UTF-32 UTF-16 UTF-8 tegnliste Kyrillisk |
brugergrænseflade tastatur layout lokalitet linje oversættelse skrifttype translitteration brugerdefinerede skrifttyper forsyningsselskaber ikonv optage |
Typestøberi og typedesign | |||||||||
---|---|---|---|---|---|---|---|---|---|
Begreber | |||||||||
Skrifttypestruktur |
| ||||||||
Skrifttype egenskaber | |||||||||
Klassificering af alfabetskrifttyper |
| ||||||||
Skrifttypestile | |||||||||
Enheder | |||||||||
computer typografi | |||||||||
se også Forlag trykkeri Typografi Kit Layout Trykning |