Kombineret symbol

I digital typografi er kombinerbare tegn  tegn designet til at modificere andre tegn. De mest almindelige kombinerbare tegn på latin er kombinerbare diakritiske tegn (inklusive kombinerbare accenter ).

Unicode indeholder også mange prækomponerede tegn, så i mange tilfælde kan både kombinerbare diakritiske tegn og prækomponerede tegn efter brugerens eller applikationens valg bruges. Dette fører til kravet om at udføre Unicode-normalisering, før man sammenligner to Unicode-strenge, og omhyggeligt at designe kodningskonvertere for korrekt at kortlægge alle gyldige Unicode-tegnrepræsentationer til den gamle kodning for at undgå datatab.

I Unicode er hovedblokken for kombinerbare diakritiske tegn i europæiske sprog og det internationale fonetiske alfabet U+0300…U+036F . Kombination af diakritiske tegn forekommer også i mange andre Unicode-blokke. I Unicode placeres diakritiske tegn altid efter grundtegnet (i modsætning til nogle ældre kombinerbare tegnsæt såsom ANSEL ), hvilket gør det muligt at tilføje flere diakritiske tegn til et enkelt tegn, selvom fra 2010 er det få applikationer, der understøtter korrekt visning af sådanne kombinationer.

Zalgo-tekst

De kombinerede tegn bruges også til at skabe det, der er kendt som "Zalgo-tekst"  - tekst, der virker forvansket på grund af overdreven brug af diakritiske tegn. Dette får teksten til at udvide sig lodret og overlappe anden tekst [1] .

Eksempel

P̴̢̧̡̧̨̨̨̡̧̢̢̢̢̡̡̢̨̡̧̢̛̛͈͕̩̱̼̲͚̼̻͉̱̤͔̞̤̝̠̗͍̯̰̹̺̺̘͎̝̦̱̤̩͉̼͕̳̹͕͙̘̘̝̘̦̜͇̞͇̰̙̘͙̞̖̝̰̘̰̫̰͉͉͚̥͉̝̣̥̠̳̘͕̖̹̪̘̦̝̗͖̭̺̪̱͓̝̻͈̟̲̳̞̫̥̞̝̹̜̱̺̹͕̟̖̰̫̟͇̭͇̩͖̘̩̺̱̥̯̮̜̰̘̹̼̲̬̣̞̬̥͖͇͎̤̠̠̜̮̱̱̩͙̥͔̯͕̘͍̳͚̝̼͍̱̳̼͓̱̟̫̭͓̬̘̻̟̜̮̹͍̳̙̟̙̝̦͇̣̤̮̘͉̭͙̩͓̯̥̳̳̠̻̭̭͕̝̮̞̠̺͈̮̦̥̺̩͉̞͔̗̬̣̣̬͔̦̩̬̘̟̹͎͎̤̖̻̱͍͍̝͔̠̼͔̦͚̦͍̤̭̝͖͈̥̱͉͉̟̲̫̻̤͓̮̖̜̱̖͍̦̺̦͍̩̱͔͆̈Y̎͑̉͋͑͂̾̐̿͑̈̎͑̉͋͑͂̾̐̿͑̈͌͗̏̔̓̓̐͗̏̔̓̓̐ogle dejlig͒̅̂̈ẙ̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛̊̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛̈y͒̅̂̈ẙ̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛̊̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛r̷̨̧̡̧̨̡̛̛̛̛̛̰̙͔̯͚͔̠͓͙̭̼̱̫̹̪̪̞̤̪͔̻͓̪̥̣̫̪̬̰̘͙͋̆̏̔͛ỳ̷̨̧̡̧̨̡̛̛̛̛̛̰̙͔̯͚͔̠͓͙̭̼̱̫̹̪̪̞̤̪͔̻͓̪̥̣̫̪̬̰̘͙̀̒̊̆̊̅͌͌̓̊̌̍͊͒͊͆̎̀̅̏̃̆̅͒͒͑͒͗͋̆̏̔͛ỳ̀̒̊̆̊̅͌͌̓̊̌̍͊͒͊͆̎̀̅̏̃̆̅͒͒͑͒͗y̓̒̾̂̀̈y͛̈̌̉͂̉̓̊̓͋̈ỳ̌̍̉̆̈̊͋̀͐͂̀̃̄̒̋͒̈̄̐̈̈y̅̿̌̌̆̆y̅̿̌̌̆̆y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̿İ̎͒̌̓̎̊͋͛ẙ̅̃İ͂̋̐̈͐̆͑̎̂̔͂͊̈͂̋̐̈͐̆͑̎̂̔͂͊̈y̔̑̎̾̽̔y̍͛̿̈y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑̔͋̄̎͑y̿͋̍̈̎̑̿̈y͗̋̎̓̐̆̾̈y̒̿y̾̈̀͛̈̆̊̏͐̈ỳ̃̍͊̈y̓̽̃͒̀̆̀ R

Områder i Unicode

Unicode indeholder følgende blokke specifikt til kombinerbare diakritiske tegn:

Kanonisk kombinerbarhedsklasse

Et af karakteristikaene ved et tegn i Unicode er den kanoniske kombinerbarhedsklasse, som kun accepterer numeriske værdier [2] .

Betyder Fuld engelsk titel Russisk oversættelse Beskrivelse
0 Ikke_ombestillet Ikke bestemt Ikke-kombinerbare og indramningsskilte; også mange tegn for vokaler og konsonanter, selvom de er kombinerbare
en overlejring overlejringsskilt Tegn overlejret på et grundbogstav eller symbol
7 Nukta Nuqta Nukta - et tegn i skrivesystemer afledt af Brahmi
otte Kana_Voicing Stemmede kana-tegn Stemmede tegn i kana - dakuten og handakuten
9 Virama Virama Virama er et tegn i skrivesystemer afledt af Brahmi
10-199 Ccc10—Ccc199 Kanoniske kombinerbarhedsklasser 10-199 Faste stillingsklasser
200 Attached_Below_Left Kontaktskilt nederst til venstre
202 Attached_Below Kontaktskilt nedenfor
204
208
210
212
214 Vedhæftet_ovenfor Kontaktskilt fra oven
216 Vedhæftet_ovenfor_højre Kontaktskilt øverst til højre
218 Under_venstre Skilt til venstre nederst
220 Under tegn nedefra
222 Under_højre Nederste højre skilt
224 Venstre Skilt til venstre
226 Ret Det rigtige tegn
228 Above_Left Øverst venstre skilt
230 Over tegn fra oven
232 Ovenfor_højre Øverst højre skilt
233 Double_Below dobbelttegn nedenfor
234 Dobbelt_Over dobbelt skilt på toppen
240 Iota_Subscript Interlineær jota Kun græsk abonnement iota

Se også

Noter

  1. Hvordan virker Zalgo-tekst? . stak overløb . Hentet 11. april 2019. Arkiveret fra originalen 27. maj 2019.
  2. Unicode Standard Annex #44 - Kanonisk kombination af klasseværdier . Hentet 6. juni 2019. Arkiveret fra originalen 8. juni 2019.

Links