I digital typografi er kombinerbare tegn tegn designet til at modificere andre tegn. De mest almindelige kombinerbare tegn på latin er kombinerbare diakritiske tegn (inklusive kombinerbare accenter ).
Unicode indeholder også mange prækomponerede tegn, så i mange tilfælde kan både kombinerbare diakritiske tegn og prækomponerede tegn efter brugerens eller applikationens valg bruges. Dette fører til kravet om at udføre Unicode-normalisering, før man sammenligner to Unicode-strenge, og omhyggeligt at designe kodningskonvertere for korrekt at kortlægge alle gyldige Unicode-tegnrepræsentationer til den gamle kodning for at undgå datatab.
I Unicode er hovedblokken for kombinerbare diakritiske tegn i europæiske sprog og det internationale fonetiske alfabet U+0300…U+036F . Kombination af diakritiske tegn forekommer også i mange andre Unicode-blokke. I Unicode placeres diakritiske tegn altid efter grundtegnet (i modsætning til nogle ældre kombinerbare tegnsæt såsom ANSEL ), hvilket gør det muligt at tilføje flere diakritiske tegn til et enkelt tegn, selvom fra 2010 er det få applikationer, der understøtter korrekt visning af sådanne kombinationer.
De kombinerede tegn bruges også til at skabe det, der er kendt som "Zalgo-tekst" - tekst, der virker forvansket på grund af overdreven brug af diakritiske tegn. Dette får teksten til at udvide sig lodret og overlappe anden tekst [1] .
EksempelP̴̢̧̡̧̨̨̨̡̧̢̢̢̢̡̡̢̨̡̧̢̛̛͈͕̩̱̼̲͚̼̻͉̱̤͔̞̤̝̠̗͍̯̰̹̺̺̘͎̝̦̱̤̩͉̼͕̳̹͕͙̘̘̝̘̦̜͇̞͇̰̙̘͙̞̖̝̰̘̰̫̰͉͉͚̥͉̝̣̥̠̳̘͕̖̹̪̘̦̝̗͖̭̺̪̱͓̝̻͈̟̲̳̞̫̥̞̝̹̜̱̺̹͕̟̖̰̫̟͇̭͇̩͖̘̩̺̱̥̯̮̜̰̘̹̼̲̬̣̞̬̥͖͇͎̤̠̠̜̮̱̱̩͙̥͔̯͕̘͍̳͚̝̼͍̱̳̼͓̱̟̫̭͓̬̘̻̟̜̮̹͍̳̙̟̙̝̦͇̣̤̮̘͉̭͙̩͓̯̥̳̳̠̻̭̭͕̝̮̞̠̺͈̮̦̥̺̩͉̞͔̗̬̣̣̬͔̦̩̬̘̟̹͎͎̤̖̻̱͍͍̝͔̠̼͔̦͚̦͍̤̭̝͖͈̥̱͉͉̟̲̫̻̤͓̮̖̜̱̖͍̦̺̦͍̩̱͔͆̈Y̎͑̉͋͑͂̾̐̿͑̈̎͑̉͋͑͂̾̐̿͑̈͌͗̏̔̓̓̐͗̏̔̓̓̐ogle dejlig͒̅̂̈ẙ̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛̊̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛̈y͒̅̂̈ẙ̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛̊̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛r̷̨̧̡̧̨̡̛̛̛̛̛̰̙͔̯͚͔̠͓͙̭̼̱̫̹̪̪̞̤̪͔̻͓̪̥̣̫̪̬̰̘͙͋̆̏̔͛ỳ̷̨̧̡̧̨̡̛̛̛̛̛̰̙͔̯͚͔̠͓͙̭̼̱̫̹̪̪̞̤̪͔̻͓̪̥̣̫̪̬̰̘͙̀̒̊̆̊̅͌͌̓̊̌̍͊͒͊͆̎̀̅̏̃̆̅͒͒͑͒͗͋̆̏̔͛ỳ̀̒̊̆̊̅͌͌̓̊̌̍͊͒͊͆̎̀̅̏̃̆̅͒͒͑͒͗y̓̒̾̂̀̈y͛̈̌̉͂̉̓̊̓͋̈ỳ̌̍̉̆̈̊͋̀͐͂̀̃̄̒̋͒̈̄̐̈̈y̅̿̌̌̆̆y̅̿̌̌̆̆y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̿İ̎͒̌̓̎̊͋͛ẙ̅̃İ͂̋̐̈͐̆͑̎̂̔͂͊̈͂̋̐̈͐̆͑̎̂̔͂͊̈y̔̑̎̾̽̔y̍͛̿̈y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑̔͋̄̎͑y̿͋̍̈̎̑̿̈y͗̋̎̓̐̆̾̈y̒̿y̾̈̀͛̈̆̊̏͐̈ỳ̃̍͊̈y̓̽̃͒̀̆̀ R
Unicode indeholder følgende blokke specifikt til kombinerbare diakritiske tegn:
Et af karakteristikaene ved et tegn i Unicode er den kanoniske kombinerbarhedsklasse, som kun accepterer numeriske værdier [2] .
Betyder | Fuld engelsk titel | Russisk oversættelse | Beskrivelse |
---|---|---|---|
0 | Ikke_ombestillet | Ikke bestemt | Ikke-kombinerbare og indramningsskilte; også mange tegn for vokaler og konsonanter, selvom de er kombinerbare |
en | overlejring | overlejringsskilt | Tegn overlejret på et grundbogstav eller symbol |
7 | Nukta | Nuqta | Nukta - et tegn i skrivesystemer afledt af Brahmi |
otte | Kana_Voicing | Stemmede kana-tegn | Stemmede tegn i kana - dakuten og handakuten |
9 | Virama | Virama | Virama er et tegn i skrivesystemer afledt af Brahmi |
10-199 | Ccc10—Ccc199 | Kanoniske kombinerbarhedsklasser 10-199 | Faste stillingsklasser |
200 | Attached_Below_Left | Kontaktskilt nederst til venstre | |
202 | Attached_Below | Kontaktskilt nedenfor | |
204 | — | ||
208 | — | ||
210 | — | ||
212 | — | ||
214 | Vedhæftet_ovenfor | Kontaktskilt fra oven | |
216 | Vedhæftet_ovenfor_højre | Kontaktskilt øverst til højre | |
218 | Under_venstre | Skilt til venstre nederst | |
220 | Under | tegn nedefra | |
222 | Under_højre | Nederste højre skilt | |
224 | Venstre | Skilt til venstre | |
226 | Ret | Det rigtige tegn | |
228 | Above_Left | Øverst venstre skilt | |
230 | Over | tegn fra oven | |
232 | Ovenfor_højre | Øverst højre skilt | |
233 | Double_Below | dobbelttegn nedenfor | |
234 | Dobbelt_Over | dobbelt skilt på toppen | |
240 | Iota_Subscript | Interlineær jota | Kun græsk abonnement iota |