Fly (Unicode)

I Unicode -standarden er et fly  et sammenhængende område på 65.536 ( 216 ) kodepunkter. Der er 17 planer, nummereret fra 0 til 16, svarende til de mulige værdier 00-10 16 af de første to hexadecimale cifre i det sekscifrede kodepositionsnummerformat (U+ hh hhhh ). Det sidste Unicode-kodepunkt er det sidste kodepunkt i plan 16, U+10FFFF. Plan 0 kaldes Basic Multilingual Plane ( BMP ) og indeholder de mest almindeligt anvendte tegn .  De resterende fly (1-16) kaldes "yderligere" [1]. Unicode version 14.0 bruger kodepunkter til syv fly, hvoraf to er til privat brug.

Begrænsningen på 17 fly skyldes UTF-16- kodningen, hvor 220 ( 1048576 ) kodepositioner (16 planer) og BMP [2] kunne kodes . UTF-8-kodningen blev designet med en meget større grænse på 2 31 ( 2 147 483 648 ) kodepunkter ( 32 768 fly) og kunne bruge 2 21 ( 2 097 152 ) kodepunkter (32 fly) selv med en grænse på 4 bytes [3] .

Unicode fly:

Grundlæggende flersproget plan

Plane 0 ( Basic Multilingual Plane , BMP ) er reserveret til tegnene i de fleste moderne scripts og et stort antal specialtegn .  Det meste af bordet er optaget af KJK-ideogrammer og koreanske stavelser .

I Unicode 14.0 er følgende blokke repræsenteret i dette plan:

  • OCR (2440-245F)
  • Indrammede bogstaver og tal (2460-24FF)
  • Pseudografik (2500-257F)
  • Blokelementer (2580-259F)
  • Geometriske former (25A0—25FF)
  • Forskellige tegn (2600-26FF)
  • Dingbats (2700–27BF)
  • Diverse matematiske symboler - A (27C0-27EF)
  • Yderligere hænder - A (27F0-27FF)
  • Braille (2800-28FF)
  • Yderligere hænder - B (2900-297F)
  • Diverse matematiske symboler - B (2980-29FF)
  • Yderligere matematikoperatører (2A00-2AFF)
  • Diverse symboler og pile (2B00—2BFF)
  • Glagolit (2C00-2C5F)
  • Latin Extended - C (2C60-2C7F)
  • Koptisk skrift (2C80—2CFF)
  • Tillæg til det georgiske brev (2D00—2D2F)
  • Gammelt libysk skrift (2D30—2D7F)
  • Etiopisk udvidet (2D80-2DDF)
  • Udvidet kyrillisk - A (2DE0—2DFF)
  • Yderligere tegnsætning (2E00-2E7F)
  • Supplement til nøglerne til KKJ (2E80-2EFF)
  • Keys of Kangxi (2F00—2FDF)
  • Ideografiske forklarende tegn (2FF0-2FFF)
  • Symboler og tegnsætning CJK (3000-303F)
  • Hiragana (3040-309F)
  • Katakana (30A0—30FF)
  • Zhuyin fuhao (3100-312F)
  • Kompatible Hangul-artikler (3130-318F)
  • Kambun (3190-319F)
  • Udvidet zhuyin fuhao (31A0—31BF)
  • Funktioner af KKJ (31C0—31EF)
  • Katakana fonetiske udvidelser (31F0-31FF)
  • Indrammede bogstaver og måneder KJK (3200-32FF)
  • Kompatible elementer CJK (3300-33FF)
  • CJK Unified Ideograms - Udvidelse A (3400-4DBF)
  • Hexagrammer af Forandringernes Bog (4DC0—4DFF)
  • Forenede ideogrammer af CJK (4E00-9FFF)
  • Pensum og (A000-A48F)
  • Bogstavtaster og (A490—A4CF)
  • Lisu (A4D0—A4FF)
  • Vai (A500—A63F)
  • Udvidet kyrillisk - B (A640—A69F)
  • Bamum (A6A0—A6FF)
  • Toneskiftsymboler (A700—A71F)
  • Latin Extended - D (A720-A7FF)
  • Sylhet Nagari (A800—A82F)
  • Almindelige indiske talformularer (A830-A83F)
  • Mongolsk firkantet skrift (A840—A87F)
  • Saurashtra (A880—A8DF)
  • Devanagari Extended (A8E0—A8FF)
  • Kaya-li (A900—A92F)
  • Rejang (A930—A95F)
  • Extended Hangul Elements - A (A960—A97F)
  • Javanesisk (A980—A9DF)
  • Burmesisk udvidet - B (A9E0-A9FF)
  • Cham script (AA00-AA5F)
  • Burmesisk udvidet - A (AA60-AA7F)
  • Thai Viet (AA80—AADF)
  • Manipuri Extensions (AAE0-AAFF)
  • Ethiopian Extended - A (AB00-AB2F)
  • Latin Extended - E (AB30-AB6F)
  • Cherokee Supplement (AB70—ABBF)
  • Manipuri (ABC0—ABFF)
  • Hangul -pensum (AC00—D7AF)
  • Udvidede Hangul-elementer - B (D7B0—D7BF)
  • Øvre del af surrogatpar (D800-DB7F)
  • Top surrogatpar til privat brug (DB80-DBFF)
  • Nedre del af surrogatpar (DC00-DFFF)
  • Privat brugsområde (E000-F8FF)
  • Kompatible CJK-ideogrammer (F900-FAFF)
  • Alfabetiske præsentationsformularer (FB00-FB4F)
  • Arabiske formularer - A (FB50-FDCF, FDF0-FDFF)
  • Variantvælgere ( FE00 -FE0F)
  • Lodrette former (FE10—FE1F)
  • Kombinerede halvtegn (FE20-FE2F)
  • Kompatible CJC-formularer (FE30-FE4F)
  • Små variantformer (FE50-FE6F)
  • Arabiske former - B (FE70-FEFF)
  • Formularer med halv bredde og fuld bredde (FF00-FFEF)
  • Specialtegn (FFF0-FFFF)

Yderligere flersproget plan

Plan 1 (Supplementary Multilingual Plane, eng.  Supplementary Multilingual Plane , SMP ) er primært forbeholdt historisk skrivning, men omfatter også konventionelle symboler såsom musikalske og matematiske symboler.

I Unicode 14.0 er følgende tegnsæt repræsenteret i dette plan:

  • Lineære B-stavelser (10000-1007F)
  • Lineære B-ideogrammer (10080-100FF)
  • Ægæiske tal (10100-1013F)
  • Gamle græske tal (10140-1018F)
  • Gamle symboler (10190-101CF)
  • Phaistos Disc (101D0—101FF)
  • Lykisk skrift (10280-1029F)
  • Carian (102A0—102DF)
  • Koptiske epact-tal (102E0-102FF)
  • Gammel kursiv ( 10300-1032F )
  • Gotisk skrift (10330-1034F)
  • Gammelt perm-skrift (10350-1037F)
  • Ugaritisk skrift (10380-1039F)
  • Gammel persisk skrift (103A0-103DF)
  • Deseret Letter (10400-1044F)
  • Shaw Alphabet (10450-1047F)
  • Somalisk skrift (10480-104AF)
  • Osage (104B0—104FF)
  • Elbasan-skrift (10500-1052F)
  • Agvan script (10530-1056F)
  • Vitkut brev (10570-105BF)
  • Lineær A (10600-1077F)
  • Latin Extended - F (10780-107BF)
  • Cypriotisk skrift (10800-1083F)
  • Kejserligt aramæisk (10840-1085F)
  • Palmyrenbrev ( 10860-1087F )
  • Nabatæisk brev (10880-108AF)
  • Hatran (108E0—108FF)
  • Fønicisk skrift (10900-1091F)
  • Lydiansk skrift (10920-1093F)
  • Meroitiske hieroglyffer (10980-1099F)
  • Meroitisk kursiv (109A0-109FF)
  • Kharosthi (10A00—10A5F)
  • Gammelt sydarabisk skrift (10A60—10A7F)
  • Gamle nordarabiske skrift (10A80-109FF)
  • Manikæisk skrift (10AC0—10AFF)
  • Avestisk skrift (10B00—10B3F)
  • Parthisk epigrafisk skrift (10B40-10B5F)
  • Pahlavi epigrafisk skrift (10B60-10B7F)
  • Pahlavi Psalter ( 10B80—10BAF )
  • Gammel tyrkisk runeskrift (10C00—10C4F)
  • Ungarske runer (10C00—10C4F)
  • Hanifi (10D00—10D3F)
  • Rumi-numre (10E60—10E7F)
  • Yezidi-manuskript (10E80—10EBF)
  • Gammelt sogdisk skrift (10F00—10F2F)
  • Sogdisk skrift (10F30—10F6F)
  • Gammelt uighurisk skrift (10F70—10FAF)
  • Khwarezmian script (10FB0—10FBF)
  • Elimaisk bogstav (10FE0—10FFF)
  • Brahmi (11000-1107F)
  • Kaithi (11080-110CF)
  • Sorang sompeng (110D0—110FF)
  • Chakma (11100-1114F)
  • Mahajani (11150-1117F)
  • Charade (11180-111DF)
  • Singalesiske arkaiske tal (111E0-111FF)
  • Hojiki (11200-1124F)
  • Multani (11280-112AF)
  • Khudabadi (112B0—112FF)
  • Grantha (11300-1137F)
  • Neva (11400-1147F)
  • Tirhuta (11480-114DF)
  • Siddhamatrika (11580-115FF)
  • Modi (11600-1165F)
  • Supplement til det gamle mongolske skrift (11660-1167F)
  • Takri (11680-116CF)
  • Ahom (11700-1174F)
  • Dogra (11800-1184F)
  • Varang-kshiti (118A0-118FF)
  • Dives akuru (11900-1195F)
  • Nandinagari (119A0-119FF)
  • Zanabazar Square Script (11A00—11A4F)
  • Soyombo (11A50—11AAF)
  • Udvidet canadisk pensum - A (11AB0-11ABF)
  • Po Chin Ho (11AC0—11AFF)
  • Bhaikshukas (11C00-11C6F)
  • Marchen (11C70—11CBF)
  • Gondi Masarama (11D00—11D5F)
  • Gunjal Gondi (11D60—11DAF)
  • Makassar script (11EE0—11EFF)
  • Fox Supplement (11FB0—11FBF)
  • Tamilstillæg (11FC0-11FFF)
  • Kileskrift (12000-123FF)
  • Kileskrifttal og tegnsætning (12400-1247F)
  • Tidlig dynastisk kileskrift (12480-1254F)
  • Cypro-minoisk skrift (12F90-12FFF)
  • Egyptiske hieroglyffer (13000-1342F)
  • Ægyptiske hieroglyfformateringskontroltegn (13430-1343F)
  • Anatolske hieroglyffer (14400-1467F)
  • Bamum-tilsætning (16800-16A3F)
  • Mro (16A40—16A6F)
  • Tangsa (16A70—16ACF)
  • Bas (16AD0—16AFF)
  • Pahau (16B00—16B8F)
  • Medefidrin (16E40-16E9F)
  • Miao (16FE0—16FFF)
  • Ideografiske tegn og tegnsætning (16F00-16F9F)
  • Tangut script (17000-187FF)
  • Elementer af Tangut-skrift (18800-18AFF)
  • Lille Khitan-skrift (18B00—18CFF)
  • Supplement til Tangut-scriptet (18D00-18D8F)
  • Udvidet kana - B (1AFF0—1AFFF)
  • Kana- tillæg (1B000—180FF)
  • Udvidet kana - A (1B100—1B12F)
  • Mindre kana-udvidelse (1B130—1B16F)
  • Nu Shu (Unicode-blok) (1B170—1B2FF)
  • Duploier stenografi (1BC00-18C9F)
  • Stenografiske formateringstegn (1BCA0-1BCAF)
  • Znamenny musikalsk notation (1CF00—1CFCF)
  • Byzantinske musikalske symboler (1D000—1D0FF)
  • Musiksymboler (1D100—1D1FF)
  • Oldgræsk notation (1D200—1D24F)
  • Maya-tal (1D2E0—1D2FF)
  • Symboler på "den store hemmeligheds kanon" (1D300-1D35F)
  • Antal tællestave (1D360—1D37F)
  • Matematiske bogstaver og tal (1D400-1D7FF)
  • SignWriting (1D800-1DAAF)
  • Latin Extended - G (1DF00-1DFFF)
  • Glagolitic Supplement (1E000—1E02F)
  • Nyekeng Puecim Hmong (1E100—1E14F)
  • Toto (1E290—1E2BF)
  • Wancho (1E2C0—1E2FF)
  • Ethiopian Extended - B (1E7E0—1E7FF)
  • Kikakui (1E800—1E8DF)
  • Adam ( 1E900—1E95F )
  • Siyak indiske tal (1EC70—1ECBF)
  • Osmanniske siyak-tal (1ED00–1ED4F)
  • Arabiske matematiske alfabetsymboler (1EE00-1EEFF)
  • Mahjong-terninger (1F000—1F02F)
  • Domino knogler (1F030—1F09F)
  • Spillekort (1F0A0—1F0FF)
  • Tillæg til indrammede bogstaver og tal (1F100-1F1FF)
  • Indrammet ideografisk karaktertillæg ( 1F200–1F2FF )
  • Diverse symboler og piktogrammer (1F300-1F5FF)
  • Humørikoner (1F600—1F64F)
  • Dekorative tegn (1F650-1F67F)
  • Transport- og søkortsymboler (1F680-1F6FF)
  • Alkymistiske symboler (1F700-1F77F)
  • Udvidede geometriske former (1F780-1F7FF)
  • Yderligere hænder - C (1F800-1F8FF)
  • Yderligere symboler og piktogrammer (1F900-1F9FF)
  • Skaksymboler (1FA00-1FA6F)
  • Udvidede symboler og piktogrammer - A (1FA70-1FAFF)
  • Symboler for legacy computing (1FB00-1FBFF)

Yderligere ideografisk plan

Plane 2 (Supplementary Ideographic Plane, eng.  Supplementary Ideographic Plane , SIP ) er reserveret til sjældent brugte hieroglyffer KKJ .

I Unicode 14.0 er følgende tegnsæt repræsenteret i dette plan:

Tertiært ideografisk plan

Plane 3 ( Tertiary Ideographic Plane , TIP ) indeholder sjældent brugte kinesiske tegn , det formodes også at inkludere historiske former for kinesisk skrift . 

Det tertiære ideografiske plan er opdelt i følgende områder [4] :

I fremtiden forventes det også at inkludere Shang- og Zhou-karakterer ( jinwen , 金文) fundet i rituelle inskriptioner på bronzekar og musikinstrumenter, og sæt af karakterer fra de krigsførende staters periode [4] .

Specialiseret ekstra plan

Plane 14 (Specialized additional plane, eng.  Supplementary Special-purpose Plane , SSP ) reserveret til karakterer, der bruges til et særligt formål.

I Unicode 14.0 er følgende blokke repræsenteret i dette plan:

Områder til privat brug

Nogle Unicode-intervaller er reserveret til privat brug og eksperimentering. Disse omfatter:

Se også

Noter

  1. Unicode-konsortium-ordliste—Supplerende planer . Hentet 30. september 2018. Arkiveret fra originalen 24. september 2018.
  2. Se tabel 3.5 "UTF-16 Bit Distribution" i Unicode Standard https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Arkiveret 31. marts 2019 på Wayback Machine
  3. Se tabel 3.6 "UTF-8 Bit Distribution" i Unicode Standard https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Arkiveret 31. marts 2019 på Wayback Machine
  4. 1 2 3 4 Køreplan til TIP  ( PDF) (12. marts 2020). Hentet 17. marts 2020. Arkiveret fra originalen 29. februar 2020.
  5. Forslag om at kode Small Seal Script i UCS  (engelsk) (PDF) (20. juni 2019). Hentet 17. marts 2020. Arkiveret fra originalen 30. november 2019.
  6. Anmodning om kommentar til kodning af Oracle Bone Script  ( PDF) (21. oktober 2015). Hentet 20. november 2017. Arkiveret fra originalen 14. juni 2019.

Links