Fly (Unicode)
I Unicode -standarden er et fly et sammenhængende område på 65.536 ( 216 ) kodepunkter. Der er 17 planer, nummereret fra 0 til 16, svarende til de mulige værdier 00-10 16 af de første to hexadecimale cifre i det sekscifrede kodepositionsnummerformat (U+ hh hhhh ). Det sidste Unicode-kodepunkt er det sidste kodepunkt i plan 16, U+10FFFF. Plan 0 kaldes Basic Multilingual Plane ( BMP ) og indeholder de mest almindeligt anvendte tegn . De resterende fly (1-16) kaldes "yderligere" [1]. Unicode version 14.0 bruger kodepunkter til syv fly, hvoraf to er til privat brug.
Begrænsningen på 17 fly skyldes UTF-16- kodningen, hvor 220 ( 1048576 ) kodepositioner (16 planer) og BMP [2] kunne kodes . UTF-8-kodningen blev designet med en meget større grænse på 2 31 ( 2 147 483 648 ) kodepunkter ( 32 768 fly) og kunne bruge 2 21 ( 2 097 152 ) kodepunkter (32 fly) selv med en grænse på 4 bytes [3] .
Unicode fly:
- Plan 0 (0000-FFFF): Basic Multilingual Plane ( BMP )
- Plan 1 (10000-1FFFF): Supplerende flersproget plan ( SMP )
- Plan 2 ( 20000-2FFFF): Supplerende ideografisk plan (SIP )
- Plan 3 ( 30000-3FFFF): Tertiært ideologisk plan (TIP )
- Fly 4-13 (40000-DFFFF) ikke brugt
- Plan 14 (E0000—EFFFF): Supplerende specialplan ( SSP )
- Plan 15 ( F0000-FFFFF) Supplerende privat brugsområde-A, SPUA - A
- Plan 16 (100000-10FFFF) Supplerende privat brugsområde-B ( SPUA -B )
Grundlæggende flersproget plan
Plane 0 ( Basic Multilingual Plane , BMP ) er reserveret til tegnene i de fleste moderne scripts og et stort antal specialtegn . Det meste af bordet er optaget af KJK-ideogrammer og koreanske stavelser .
I Unicode 14.0 er følgende blokke repræsenteret i dette plan:
|
- OCR (2440-245F)
- Indrammede bogstaver og tal (2460-24FF)
- Pseudografik (2500-257F)
- Blokelementer (2580-259F)
- Geometriske former (25A0—25FF)
- Forskellige tegn (2600-26FF)
- Dingbats (2700–27BF)
- Diverse matematiske symboler - A (27C0-27EF)
- Yderligere hænder - A (27F0-27FF)
- Braille (2800-28FF)
- Yderligere hænder - B (2900-297F)
- Diverse matematiske symboler - B (2980-29FF)
- Yderligere matematikoperatører (2A00-2AFF)
- Diverse symboler og pile (2B00—2BFF)
- Glagolit (2C00-2C5F)
- Latin Extended - C (2C60-2C7F)
- Koptisk skrift (2C80—2CFF)
- Tillæg til det georgiske brev (2D00—2D2F)
- Gammelt libysk skrift (2D30—2D7F)
- Etiopisk udvidet (2D80-2DDF)
- Udvidet kyrillisk - A (2DE0—2DFF)
- Yderligere tegnsætning (2E00-2E7F)
- Supplement til nøglerne til KKJ (2E80-2EFF)
- Keys of Kangxi (2F00—2FDF)
- Ideografiske forklarende tegn (2FF0-2FFF)
- Symboler og tegnsætning CJK (3000-303F)
- Hiragana (3040-309F)
- Katakana (30A0—30FF)
- Zhuyin fuhao (3100-312F)
- Kompatible Hangul-artikler (3130-318F)
- Kambun (3190-319F)
- Udvidet zhuyin fuhao (31A0—31BF)
- Funktioner af KKJ (31C0—31EF)
- Katakana fonetiske udvidelser (31F0-31FF)
- Indrammede bogstaver og måneder KJK (3200-32FF)
- Kompatible elementer CJK (3300-33FF)
- CJK Unified Ideograms - Udvidelse A (3400-4DBF)
- Hexagrammer af Forandringernes Bog (4DC0—4DFF)
- Forenede ideogrammer af CJK (4E00-9FFF)
- Pensum og (A000-A48F)
- Bogstavtaster og (A490—A4CF)
- Lisu (A4D0—A4FF)
- Vai (A500—A63F)
- Udvidet kyrillisk - B (A640—A69F)
- Bamum (A6A0—A6FF)
- Toneskiftsymboler (A700—A71F)
- Latin Extended - D (A720-A7FF)
- Sylhet Nagari (A800—A82F)
- Almindelige indiske talformularer (A830-A83F)
- Mongolsk firkantet skrift (A840—A87F)
- Saurashtra (A880—A8DF)
- Devanagari Extended (A8E0—A8FF)
- Kaya-li (A900—A92F)
- Rejang (A930—A95F)
- Extended Hangul Elements - A (A960—A97F)
- Javanesisk (A980—A9DF)
- Burmesisk udvidet - B (A9E0-A9FF)
- Cham script (AA00-AA5F)
- Burmesisk udvidet - A (AA60-AA7F)
- Thai Viet (AA80—AADF)
- Manipuri Extensions (AAE0-AAFF)
- Ethiopian Extended - A (AB00-AB2F)
- Latin Extended - E (AB30-AB6F)
- Cherokee Supplement (AB70—ABBF)
- Manipuri (ABC0—ABFF)
- Hangul -pensum (AC00—D7AF)
- Udvidede Hangul-elementer - B (D7B0—D7BF)
- Øvre del af surrogatpar (D800-DB7F)
- Top surrogatpar til privat brug (DB80-DBFF)
- Nedre del af surrogatpar (DC00-DFFF)
- Privat brugsområde (E000-F8FF)
- Kompatible CJK-ideogrammer (F900-FAFF)
- Alfabetiske præsentationsformularer (FB00-FB4F)
- Arabiske formularer - A (FB50-FDCF, FDF0-FDFF)
- Variantvælgere ( FE00 -FE0F)
- Lodrette former (FE10—FE1F)
- Kombinerede halvtegn (FE20-FE2F)
- Kompatible CJC-formularer (FE30-FE4F)
- Små variantformer (FE50-FE6F)
- Arabiske former - B (FE70-FEFF)
- Formularer med halv bredde og fuld bredde (FF00-FFEF)
- Specialtegn (FFF0-FFFF)
|
Yderligere flersproget plan
Plan 1 (Supplementary Multilingual Plane, eng. Supplementary Multilingual Plane , SMP ) er primært forbeholdt historisk skrivning, men omfatter også konventionelle symboler såsom musikalske og matematiske symboler.
I Unicode 14.0 er følgende tegnsæt repræsenteret i dette plan:
Yderligere ideografisk plan
Plane 2 (Supplementary Ideographic Plane, eng. Supplementary Ideographic Plane , SIP ) er reserveret til sjældent brugte hieroglyffer KKJ .
I Unicode 14.0 er følgende tegnsæt repræsenteret i dette plan:
Tertiært ideografisk plan
Plane 3 ( Tertiary Ideographic Plane , TIP ) indeholder sjældent brugte kinesiske tegn , det formodes også at inkludere historiske former for kinesisk skrift
.
Det tertiære ideografiske plan er opdelt i følgende områder [4] :
- Unified CJK ideogrammer - udvidelse G (30000-3134F) - yderligere sjældent brugte kinesiske ideogrammer;
- Zhuanshu (31400-342FF) - hieroglyffer i stil med "lille sæl" (xiaozhuan, 小篆) og "stor sæl" (dazhuan, 大篆) [5] [4] ;
- Jiaguwen (34400-35BFF) er de ældste kinesiske tegn fra Shang-æraen ( jiaguwen , 甲骨文), fundet i spådomsindskrifter på skaller, kranier og dyreknogler [6] [4]
I fremtiden forventes det også at inkludere Shang- og Zhou-karakterer ( jinwen , 金文) fundet i rituelle inskriptioner på bronzekar og musikinstrumenter, og sæt af karakterer fra de krigsførende staters periode [4] .
Specialiseret ekstra plan
Plane 14 (Specialized additional plane, eng. Supplementary Special-purpose Plane , SSP ) reserveret til karakterer, der bruges til et særligt formål.
I Unicode 14.0 er følgende blokke repræsenteret i dette plan:
- Tags (E0000—E007F)
- Variant Selectors Supplement (E0100—E01EF)
Områder til privat brug
Nogle Unicode-intervaller er reserveret til privat brug og eksperimentering. Disse omfatter:
- Privat område i Basic Multilingual Plane (E000-F8FF)
- Yderligere fly 15 (F0000-U+FFFFF) og 16 (100000-10FFFF)
Se også
Noter
- ↑ Unicode-konsortium-ordliste—Supplerende planer . Hentet 30. september 2018. Arkiveret fra originalen 24. september 2018. (ubestemt)
- ↑ Se tabel 3.5 "UTF-16 Bit Distribution" i Unicode Standard https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Arkiveret 31. marts 2019 på Wayback Machine
- ↑ Se tabel 3.6 "UTF-8 Bit Distribution" i Unicode Standard https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Arkiveret 31. marts 2019 på Wayback Machine
- ↑ 1 2 3 4 Køreplan til TIP ( PDF) (12. marts 2020). Hentet 17. marts 2020. Arkiveret fra originalen 29. februar 2020.
- ↑ Forslag om at kode Small Seal Script i UCS (engelsk) (PDF) (20. juni 2019). Hentet 17. marts 2020. Arkiveret fra originalen 30. november 2019.
- ↑ Anmodning om kommentar til kodning af Oracle Bone Script ( PDF) (21. oktober 2015). Hentet 20. november 2017. Arkiveret fra originalen 14. juni 2019.
Links
Unicode- blokke _ _ |
---|
Grundlæggende flersproget plan (plan 0, BMP) [U+0000…U+FFFF] |
---|
|
|
|
Yderligere ideografisk plan (plan 2, SIP) [U+20000…U+2FFFF] |
---|
|
|
Tertiært ideografisk plan (plan 3, TIP) [U+30000…U+3FFFF] |
---|
- CJK Unified Ideograms - Udvidelse G
|
|
Fly 4-13 [U+40000…U+DFFFF] |
---|
Ikke involveret |
|
Specialiseret ekstra plan (plan 14, SSP) [U+E0000…U+EFFFF] |
---|
- Tags
- Supplerende variantvælgere
|
|
Områder til privat brug (fly 15 og 16, PUA) [U+F0000…U+10FFFF] |
---|
|
|