KOI-8 ( kode til udveksling og information , 8 bit), KOI8 er en otte-bit ASCII - kompatibel kodetabel . Designet til at kode bogstaver i kyrilliske alfabeter . Det blev meget brugt som den vigtigste russiske kodning i Unix - kompatible operativsystemer og i e-mail , men tættere på 2010 , med udbredelsen af Unicode , er den gradvist ved at gå ud af brug.
Der er også en syv-bit version af kodningen, der ikke er fuldt ud kompatibel med ASCII - KOI-7 . KOI-7 og KOI-8 er beskrevet i den nu hedengangne GOST 19768-74.
Udviklerne af KOI-8 placerede tegnene i det russiske alfabet i den øverste del af kodetabellen på en sådan måde, at positionerne af de kyrilliske tegn svarer til deres fonetiske modstykker i det engelske alfabet fra bunden af tabellen. Dette betyder, at hvis der i teksten skrevet i KOI-8, for hvert tegn, en bit fjernes fra venstre, så vil en relativt læsbar tekst, svarende til translitteration , blive opnået . For eksempel vil ordene "russisk tekst" blive til "rUSSKIJ tEKST". På grund af dette er de kyrilliske tegn ikke i alfabetisk rækkefølge.
Der er flere varianter af KOI-8-kodning for forskellige kyrilliske alfabeter, der udvider visse koder (det samlede område på 192-255 med 32 russiske bogstaver i to tilfælde forbliver uændret i alle varianter). Det russiske alfabet er beskrevet i KOI8-R- kodning , ukrainsk - i KOI8-U , Tadsjikisk - i KOI8-T.
I 1990'erne blev KOI8-R de facto standarden for kodning af russisk kyrillisk på UNIX - lignende operativsystemer og e- mail . Forfatteren til denne kodning ( RFC 1489 ) Andrey Chernov arbejdede i Demos -virksomheden ( Relcom -netværket ) i begyndelsen af 1990'erne og var direkte involveret i lanceringen og justeringen af den første internetkanal mellem Rusland og vestlige lande . KOI-8 blev den første russiske standardiserede kodning på internettet.
IETF har godkendt flere RFC'er på KOI-8-kodningsmuligheder:
IANA har registreret kodninger på sin liste.
RFC 1489 - standarden påbyder tilstedeværelsen af "boks"-grafiske tegn ( pseudographics ), men dette krav er sjældent opfyldt.
På Microsoft Windows er KOI8-R tildelt sidekode 20866, KOI8-U er 21866.
Begyndelsen af kodningstabellen ( latin ) svarer fuldt ud til ASCII - kodningen .
I tabellerne nedenfor angiver tallene under bogstaverne Unicode -hexadecimalkoden for bogstavet .
.0 | .en | .2 | .3 | .fire | .5 | .6 | .7 | .otte | .9 | .EN | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
otte. |
─ 2500 |
│ 2502 |
┌250C _ |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251C |
┤ 2524 |
┬ 252C |
┴ 2534 |
┼ 253C |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌258C _ |
▐ 2590 |
9. |
░ 2591 |
▒ 2592 |
▓ 2593 |
⌠ 2320 |
■ 25A0 |
∙ 2219 |
√ 221A |
≈ 2248 |
≤ 2264 |
≥ 2265 |
A0 |
⌡ 2321 |
° B0 |
²B2 _ |
B7 _ |
÷ F7 |
EN. |
═ 2550 |
║ 2551 |
╒ 2552 |
år 451 |
╓ 2553 |
╔ 2554 |
╕ 2555 |
╖ 2556 |
╗ 2557 |
# 2558 |
╙ 2559 |
╚ 255A |
╛255B _ |
╜255C _ |
nr. 255D |
nr. 255E |
b. |
╟255F _ |
╠ 2560 |
╡ 2561 |
Yo 401 |
╢ 2562 |
╣ 2563 |
╤ 2564 |
╥ 2565 |
╦ 2566 |
nr. 2567 |
╨ 2568 |
╩ 2569 |
nr. 256A |
nr. 256B |
╬ 256C |
© A9 |
C. |
yu 44E |
en 430 |
b 431 |
c 446 |
d 434 |
e 435 |
f 444 |
g 433 |
x 445 |
og 438 |
439 _ |
til 43A |
l 43B |
m 43C |
n 43D |
omkring 43E |
D. |
n 43F |
i 44F |
s 440 |
fra 441 |
t 442 |
på 443 |
f 436 |
i 432 |
b 44C |
s 44B |
s 437 |
sh 448 |
e 44D |
w 449 |
h 447 |
b 44A |
E. |
Yu 42E |
A 410 |
B 411 |
C 426 |
D 414 |
E 415 |
F 424 |
G 413 |
X 425 |
og 418 |
Y 419 |
K 41A |
L 41B |
M 41C |
H 41D |
Omkring 41E |
F. |
P 41F |
Jeg er 42F |
420 kr |
C 421 |
T 422 |
423 _ |
F 416 |
B 412 |
b 42c |
S 42B |
W 417 |
SH 428 |
E 42D |
Shch 429 |
Ch 427 |
b 42A |
Kun ikke-matchende tabelrækker vises, da alt andet matcher.
.0 | .en | .2 | .3 | .fire | .5 | .6 | .7 | .otte | .9 | .EN | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
EN. |
═ 2550 |
║ 2551 |
╒ 2552 |
år 451 |
$ 454 |
╔ 2554 |
i 456 |
457 _ |
╗ 2557 |
# 2558 |
╙ 2559 |
╚ 255A |
╛255B _ |
491 _ |
nr. 255D |
nr. 255E |
b. |
╟255F _ |
╠ 2560 |
╡ 2561 |
Yo 401 |
Є 404 |
╣ 2563 |
I 406 |
407 kr |
╦ 2566 |
nr. 2567 |
╨ 2568 |
╩ 2569 |
nr. 256A |
Ґ 490 |
╬ 256C |
© A9 |
.0 | .en | .2 | .3 | .fire | .5 | .6 | .7 | .otte | .9 | .EN | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
EN. |
═ 2550 |
║ 2551 |
╒ 2552 |
år 451 |
$ 454 |
╔ 2554 |
i 456 |
457 _ |
╗ 2557 |
# 2558 |
╙ 2559 |
╚ 255A |
╛255B _ |
491 _ |
¢ 45E |
nr. 255E |
b. |
╟255F _ |
╠ 2560 |
╡ 2561 |
Yo 401 |
Є 404 |
╣ 2563 |
I 406 |
407 kr |
╦ 2566 |
nr. 2567 |
╨ 2568 |
╩ 2569 |
nr. 256A |
Ґ 490 |
Î 40E |
© A9 |
.0 | .en | .2 | .3 | .fire | .5 | .6 | .7 | .otte | .9 | .EN | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
otte. | - 493 |
497 _ |
49B _ |
49D _ |
n 4A3 |
- 4AF |
- 4B1 |
h 4B3 |
ҷ 4B7 |
nr. 4B9 |
h 4BB |
▀ 2580 |
4D9 _ |
ӣ 4E3 |
4E9 _ |
ӯ 4Eo |
9. | 492 _ |
496 _ |
K 49A |
49C _ |
Ң 4A2 |
- 4AE |
Ұ 4B0 |
- 4B2 |
- 4B6 |
- 4B8 |
4BA _ |
⌡ 2321 |
4D8 _ |
Ӣ 4E2 |
Ө 4E8 |
4EE _ |
EN. | A0 |
$ 452 |
-453 _ |
år 451 |
$ 454 |
* 455 |
i 456 |
457 _ |
$ 458 |
459 _ |
њ 45A |
ћ 45B |
ќ 45C |
491 _ |
¢ 45E |
џ 45F |
b. | nr. 2116 |
€ 402 |
Ѓ 403 |
Yo 401 |
Є 404 |
S 405 |
I 406 |
407 kr |
408 kr |
409 kr |
Њ40A _ |
£ 40 mia |
40C _ |
Ґ 490 |
Î 40E |
Џ 40F |
.0 | .en | .2 | .3 | .fire | .5 | .6 | .7 | .otte | .9 | .EN | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
203A}} | nr. 045A |
ќ 045C |
ћ 045B |
џ 045F | ||||||||||||
Î 040E |
© 00A9 |
.0 | .en | .2 | .3 | .fire | .5 | .6 | .7 | .otte | .9 | .EN | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
EN. |
00A0 |
$ 0452 |
- 0453 |
e 0451 |
є 0454 |
* 0455 |
i 0456 |
ї 0457 |
$ 0458 |
kr 0459 |
nr. 045A |
ћ 045B |
ќ 045C |
00 e.Kr |
¢ 045E |
џ 045F |
b. |
nr. 2116 |
€ 0402 |
Ѓ 0403 |
Yo 0401 |
Є 0404 |
S 0405 |
I 0406 |
0407 kr |
0408 kr |
Љ 0409 |
Њ 040A |
040 milliarder pund |
nr. 040C |
¤ 00A4 |
Î 040E |
P 040F |
KOI8-Unified (KOI8-F)-kodningen blev foreslået af Fingertip Software [1] .
.0 | .en | .2 | .3 | .fire | .5 | .6 | .7 | .otte | .9 | .EN | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
otte. |
─ 2500 |
│ 2502 |
┌250C _ |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251C |
┤ 2524 |
┬ 252C |
┴ 2534 |
┼ 253C |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌258C _ |
▐ 2590 |
9. |
░ 2591 |
' 2018 |
' 2019 |
" 201C |
" 201D |
• 2022 |
– 2013 |
– 2014 |
© 00A9 |
™ 2122 |
00A0 |
» 00BB |
® 00AE |
« 00AB |
00B7 _ |
¤ 00A4 |
EN. |
00A0 |
$ 0452 |
- 0453 |
e 0451 |
є 0454 |
* 0455 |
i 0456 |
ї 0457 |
$ 0458 |
kr 0459 |
nr. 045A |
ћ 045B |
ќ 045C |
ґ 0491 |
¢ 045E |
џ 045F |
b. |
nr. 2116 |
€ 0402 |
Ѓ 0403 |
Yo 0401 |
Є 0404 |
S 0405 |
I 0406 |
0407 kr |
0408 kr |
Љ 0409 |
Њ 040A |
040 milliarder pund |
nr. 040C |
Ґ 0490 |
Î 040E |
P 040F |
I nogle CMEA-lande blev der lavet ændringer af KOI-8 til nationale varianter af det latinske alfabet . Grundtanken var den samme - når man "klipper af" den ottende bit, skulle teksten forblive mere eller mindre klar.
Tegnkodninger | |
---|---|
Historiske indkodninger | yderligere komp. semafor (Makarov) morse Bodo MTK-2 komp. 6-bit SCP RADIX-50 EBCDIC KOI-7 ISO 646 |
moderne 8-bit repræsentation | symboler ASCII ikke-ASCII 8-bit kodesider Kyrillisk KOI-8 Grundlæggende kodning Mackyrillisk ISO 8859 1 (lat.) 2 3 fire 5 (kir.) 6 7 otte 9 ti elleve 12 13 fjorten 15 (€) 16 Windows 1250 1251 (Kir.) 1252 1253 1254 1255 1256 1257 1258 WGL4 IBM og DOS 437 850 852 855 866 "alternativ" MIC |
Multibyte | traditionel DBCS GB2312 HTML unicode UTF-32 UTF-16 UTF-8 tegnliste Kyrillisk |
brugergrænseflade tastatur layout lokalitet linje oversættelse skrifttype translitteration brugerdefinerede skrifttyper forsyningsselskaber ikonv optage |