ISO 8859

ISO 8859  er en familie af ASCII - kompatible tegntabeller , udviklet i fællesskab af ISO og IEC . Fra 2006 bestod denne familie af 15 kodesider.

Generel information

Da ISO 8859-kodninger blev designet som et kommunikationsmiddel og ikke som et middel til at levere typografi af høj kvalitet , inkluderer de ikke tegn såsom dobbelte anførselstegn , tankestreger af forskellig længde, ligaturer osv. (selvom der stadig er sådanne tegn , som et ikke-brydende mellemrum og blød bindestreg). Men ret meget plads (region 0x80-0x9F) er reserveret til "øvre kontroltegn ", designet til at styre terminaler .

Da de forskellige ISO 8859-sider er blevet udviklet i fællesskab, har de en vis gensidig kompatibilitet. For eksempel er alle syv udvidede latinske tegn, der bruges på tysk , på samme position på alle tegntabeller, der indeholder disse tegn. Siderne Latin-1-Latin-4 har en endnu større grad af kompatibilitet: hvert tegn, der er til stede på nogen af ​​disse sider, vises i samme position på dem.

Ansøgning

ISO 8859-seriens kodninger bruges hovedsageligt på Unix -lignende systemer og også til kodning af websider (fordi de fleste webservere bruger UNIX).

Microsoft Windows - systemer bruger Windows-kodninger, hvoraf nogle er kompatible med ISO 8859, men inkluderer flere grafiske tegn ved brug af 0x80-0x9F-regionen.

Dele af ISO 8859

ISO 8859-1 (Latin-1) Udvidet latin , inklusive tegn fra de fleste vesteuropæiske sprog ( engelsk , dansk , irsk , islandsk , spansk , italiensk , tysk , norsk , portugisisk , romansk , færøsk , svensk , skotsk (gælisk) og dele af hollandsk , finsk , fransk ) samt nogle østeuropæiske ( albansk ) og afrikanske sprog ( afrikaans , swahili ). Latin-1 mangler eurotegnet og det store bogstav Ÿ . Denne tegntabel betragtes som standardkodningen for HTML - dokumenter og e-mail-meddelelser . Også de første 256 Unicode -tegn svarer til denne tegntabel . ISO 8859-2 (Latin-2) Udvidet latin til at omfatte tegn fra centraleuropæiske og østeuropæiske sprog ( bosnisk , ungarsk , polsk , slovakisk , slovensk , kroatisk , tjekkisk ). Latin-2 mangler ligesom Latin-1 eurotegnet. ISO 8859-3 (Latin-3) Udvidet latin til at omfatte tegn fra sydeuropæiske sprog ( maltesisk , tyrkisk og esperanto ). ISO 8859-4 (Latin-4) Udvidet latin til at omfatte tegn fra nordeuropæiske sprog ( grønlandsk , estisk , lettisk , litauisk og samisk ). ISO 8859-5 (latinsk/kyrillisk) Kyrillisk , der indeholder tegn fra slaviske sprog ( hviderussisk , bulgarsk , makedonsk , russisk , serbisk og delvist ukrainsk ). ISO 8859-6 (latinsk/arabisk) Symboler brugt på arabisk . Tegn fra andre arabisk -baserede sprog understøttes ikke. Korrekt visning af ISO 8859-6-tekst kræver understøttelse af tovejsskrivning og kontekstfølsomme tegnformer. ISO 8859-7 (latinsk/græsk) Symboler for moderne græsk . Det kan også bruges til at skrive oldgræske tekster i monoton ortografi. ISO 8859-8 (latin/hebraisk) Moderne hebraiske symboler . Anvendes i to versioner: med logisk tegnrækkefølge (kræver tovejsunderstøttelse) og med visuel tegnrækkefølge. ISO 8859-9 (Latin-5) En latinsk-1-variant, der erstatter sjældent brugte islandske tegn med tyrkiske. Bruges til tyrkisk og kurdisk . ISO 8859-10 (Latin-6) En latin-4-variant, der er mere bekvem for skandinaviske sprog . ISO 8859-11 (latinsk/thailandsk) Thai sprog symboler . ISO 8859-12 (latinsk/devanagari) Devanagari script symboler . I 1997 blev arbejdet med ISO 8859-12 officielt indstillet, og denne kodning blev aldrig accepteret som en standard. ISO 8859-13 (Latin-7) En latin-4-variant, der er mere bekvem for de baltiske sprog . ISO 8859-14 (Latin-8) Udvidet latin til at omfatte tegn fra keltiske sprog , såsom skotsk (gælisk) og bretonsk . ISO 8859-15 (Latin-9) En Latin-1-variant, der erstatter sjældent brugte tegn med dem, der er nødvendige for fuldt ud at understøtte finsk , fransk og estisk . Desuden blev eurotegnet tilføjet Latin-9. ISO 8859-16 (Latin-10) Udvidet latin til at omfatte tegn fra syd- og østeuropæiske ( albansk , ungarsk , italiensk , polsk , rumænsk , slovensk , kroatisk ) samt nogle vesteuropæiske sprog ( irsk i den nye ortografi, tysk , finsk , fransk ). Ligesom Latin-9 blev eurotegnet tilføjet til Latin-10.