Mnemonics i HTML

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 22. september 2019; kontroller kræver 109 redigeringer .

Et mnemonisk tegn ( eng.  entity " entity ") er en SGML -konstruktion , der refererer til et tegn fra tegnsættet i en tekstfil. HTML har et stort antal specialtegn [1] foruddefineret . For at indsætte et specialtegn (kontrol/formattegn) i opmærkningen, skal du indsætte det mnemoniske tegn, der svarer til dette tegn, i HTML-strukturen.

Formål og syntaks

Udnævnelse

Hvis du har brug for at sætte et tegn i outputteksten, kan du gøre dette på to måder:

Den første metode gælder ikke godt for tegn , der har formatbetydning i HTML, såsom vinkelparenteserne < og > (mindre end og større end tegn). Sådanne breve vil ikke altid blive opfattet som blot tekst. Kompleksiteten af ​​denne metode forværres af det faktum, at metoden til at bestemme, om et givet tegn er et format eller et teksttegn, afhænger af den specifikke browser, da hver af dem forsøger at rette HTML-syntaksfejl på sin egen måde og ved hjælp af formattegn til formateringsformål er netop en fejl. Denne metode kan også være ubelejlig, når du skal indtaste et tegn, der ikke er på tastaturet. For eksempel er der ingen anførselstegn på standard Windows-tastaturet.

Når du redigerer HTML-kildekoden direkte ved hjælp af et tekstredigeringsprogram, vises filen, der redigeres, i en skrifttype med fast bredde ( font med konstant bredde), hvor nogle tegn kan se vanskelige ud at skelne: især mellemrum med forskellig bredde og betydning ( f.eks. vil "brydende" og "ikke-brydende") alle se ens ud, forskellige vandrette linjer vil se ens ud, ens eller næsten ens (bindestreg-minus, minus , bindestreg , ikke- brydende bindestreg , blød bindestreg , en tankestreg og em bindestreg osv.), hvilket gør det upraktisk at arbejde med dem. I mange skrifttyper med samme bredde fungerer pålæggelsen af ​​"modificerende" bogstaver, såsom akut (russisk accent, U + 0301), ikke godt, på grund af hvilken en sådan modifikator kan overlappe ikke det forrige, men det næste tegn, hvilket skaber yderligere forvirring. Og endelig er denne metode fuldstændig uanvendelig for tegn, der ikke er i kodningen af ​​HTML-filen.

Derfor er det i alle disse tilfælde bedre (hvis ikke det eneste mulige) at anvende metode nummer 2 - brug en speciel syntaks. Man skal huske på, at tegn, der er specificeret på en særlig måde, mister deres formatbetydning, for eksempel holder vinkelparenteser op med at fremhæve tags , og et mellemrum ophører med at adskille deres attributter, hvilket gør det muligt at bruge formattegn som blot teksttegn, sætte dem på en særlig måde.

Syntaks

Angivelse af et tegn ved dets navn

Et tegn kan repræsenteres i HTML-kildekoden som "& charname ;", hvor charname  er dets navn. Citater er ikke en del af syntaksen. Bogstaver er væsentlig. Det sidste semikolontegn kan ofte udelades: hvis der i kildeteksten efter sådan et tegn er et mellemrum, et HTML-direktiv eller andet, som ikke kan være en fortsættelse af tegnnavnet, så forstår browseren alt korrekt. Desuden, hvis fornavnet ikke er et præfiks for et andet, er traileren valgfri. På den anden side, for at undgå misforståelser, er det bedre at sætte finalizer altid [2] .

Eksempel: "&" ( og- tegn ( engelsk  og ), navn - "amp") - "&", sig, "John & Mary" - "John & Mary."

Angivelse af et tegn ved dets unicode-nummer

Som navnet på et hvilket som helst tegn kan du bruge dets unicode- nummer foran tegnet "#", hvis tallet er decimal, eller af kombinationen "#x" (tegnet "#" og det latinske bogstav "x"), hvis tallet er hexadecimalt . Det vil sige, at for et tegn med unicode nummer dddd 10 , 0≤ddddd≤1114111 10 kan du bruge navnet #ddddd, og for unicode nummer hhhh 16 , 0≤hhhh≤10FFFF 16  - #xhhhhh eller #Xh. Antallet af cifre er ubegrænset, førende (ikke-signifikante) nuller betyder ikke noget, tilfældet med bogstavet "x" og hexadecimale cifre ABCDEF er ikke signifikant [2] .

Eksempel: "&" og-tegnet, U+0026, (38 10 ); navnet kan være "#38" eller "#038" eller "#0038", "#x26" eller "#x026" eller "#X0026" osv.; "John & Mary" - "John & Mary."

"Gamle" bogstaver

Tegn, der har en formatværdi i HTML, kan, når de placeres direkte i kildeteksten uden substitution, forårsage syntaktiske problemer. Det er bedre at indstille dem på en speciel måde.

  • Mindre-end-tegn, U+003C (<);
  • Større-end-tegn, U+003E (>);
  • og-tegnet (Ampersand symbol), U+0026 (&);
  • dobbelt anførselstegn (citatsymbol), U+0022 (").

Hvert af disse tegn i HTML har to navne, et med små bogstaver og et med store bogstaver. Begge disse navne for et tegn er nøjagtigt de samme bortset fra tilfælde af bogstaver. Dette er af kompatibilitetsårsager, da den gamle HTML-standard var ufølsom for store og små bogstaver for sådanne navne, så ældre HTML-dokumenter kan bruge alle bogstaver.

I øjeblikket foretrækkes små bogstaver, mens store bogstaver frarådes, fordi det kan give problemer. Varianter af store bogstaver blev introduceret af browsere for at give reel kompatibilitet med ældre dokumenter mod HTML-standarden, og det var først i version 5.0, at de officielt blev introduceret i standarden.

Der er tre andre tegn med samme store/små bogstaver, men uden nogen speciel formatværdi i HTML - copyright (©), registreret varemærke (®) og varemærke (™);

Disse tegn var også til stede i HTML-standarden på det tidspunkt, hvor den blev ændret fra versal-ufølsomme til store og små bogstaver, så reglerne for dem er de samme som for formattegn.

Navnene på alle "gamle" (formaterede og uformaterede) bogstaver:

  • < —ltellerLT(er mindre end operator, U+003C, Basic Latin (ASCII));
  • > —gtellerGT(er større end operator, U+003E, Basic Latin (ASCII));
  • &-ampellerAMP(ampersand, U+0026, grundlæggende latin (ASCII));
  • "—quotellerCITAT(citat, U+0022, grundlæggende latin (ASCII));
  • © —kopiellerKOPI(Copyright-tegn, U+00A9, Latin-1 Supplement);
  • ® -regellerREG(Registreret varemærke, U+00AE, Latin-1 Supplement);
  • ™ —handleellerHANDLE(Varemærkeskilt, U+2122, bogstavlignende symboler);
Kompatibilitet

Udover HTML bruges de tilsvarende konventioner i andre systemer, såsom XML , Wikipedia-motoren , FB2 osv. Disse systemer følger dog ikke HTML-standarden helt.

For eksempel, i XML, blandt tegnnavne, er kun tegnnavne i små bogstaver (inklusive apostrof ), det vil sige lt, gt, amp, quot og apos, tilladt, når du angiver tegn med et hexadecimalt Unicode-nummer, det latinske bogstav "x " skal være med små bogstaver og terminate semikolon er påkrævet. Wikipedia-motoren bruger HTML-versionsnavne før 4.0 og kræver obligatorisk slutning med semikolon. FB2 tillader, at tegn kun angives af Unicode-tal, mens nogle FB2-handlere desuden begrænser disse tal til kun decimaltal.

Den mest kompatible måde at specificere på er således med decimaltal med en obligatorisk trailer. Hvis der bruges hexadecimale navne, er det bedre at beholde det latinske bogstav "x" med små bogstaver og de hexadecimale cifre ABCDEF med store bogstaver. Af navnene er lt, gt, amp og quot de mest standard (i XML er apos også standard). Ellers bør du blive guidet af HTML 4.0-standarden, da det er mindst pålideligt at bruge version 5.0-navne.

Tabeller med mnemoniske referencer

Kontroltegn C0 og grundlæggende latin

U+0000—U+007F

Denne Unicode-serie er fuldt ud kompatibel med ASCII-standarden, med undtagelse af konventionen om overlappende tegn via backspace. [3]

Symbol Formål Mnemonics HTML Koden
U+0000-U+001F - C0 kontroltegn
tabulering - HT (ANSI), GT (GOST) 5,0 U+0009
linjefeed - LF (ANSI), PS (GOST) &ny linje; 5,0 U+000A
U+0032—U+007E — Grundlæggende latin
plads U+0020
! Udråbstegn ! 5,0 U+0021 !
" dobbelt anførselstegn [4] " 5,0 U+0022 "
" 2.0
# taltegn ("hash" eller "skarp") # 5,0 U+0023 #
$ dollartegn $ 5,0 U+0024 $
% procent tegn % 5,0 U+0025 %
& og-tegn & 5,0 U+0026 &
& 1,0/2,0
' enkelt citat (optager positionen som en apostrof) [5] ' 5,0 U+0027 '
( venstre parentes ( 5,0 U+0028 (
) højre parentes ) 5,0 U+0029 )
* stjerne (kan være både høj og medium) [6] [7] * 5,0 U+002A *
*
+ plustegn + 5,0 U+002B +
, komma [8] &komma; 5,0 U+002C ,
- streg-minus (anbefales ikke til brug) [9] [10] U+002D -
. prik [11] &periode; 5,0 U+002E .
/ skråstreg (solidus) [12] [13] / 5,0 U+002F /
U+0030-U+0039 - tal 0-9 [14]
: kolon &kolon; 5,0 U+003A :
; semikolon ; 5,0 U+003B ;
< mindre tegn < 5,0 U+003C <
< 1,0/2,0
= lighedstegn &lige med; 5,0 U+003D =
> større tegn > 5,0 U+003E >
> 1,0/2,0
? spørgsmålstegn &søgen; 5,0 U+003F ?
@ kommerciel "på" &kommat; 5,0 U+0040 @
U+0041—U+005A — latinske store bogstaver A—Z [15]
[ venstre firkantet beslag [ 5,0 U+005B [
&lbrak;
\ omvendt skråstreg [16] \ 5,0 U+005C \
] højre firkantet beslag ] 5,0 U+005D ]
]
^ vogne - (kan være både høje og mellemstore) [17] [18] ^ 5,0 U+005E ^
_ positionel understregning (skal stables vandret) [19] _ 5,0 U+005F _
&underbar;
` positionsindtagende omvendt apostrof (grav) [20] &grav; 5,0 U+0060 `
`
U+0061—U+007A — små latinske bogstaver a—z [21]
{ venstre krøllet bøjle { 5,0 U+007B {
{
| lodret streg [22] | 5,0 U+007C |
|
|
} højre krøllet bøjle } 5,0 U+007D }
}
~ positionel tilde (kan være høj eller medium, anbefales ikke) [23] [24] U+007E ~
U+007F - C0 kontroltegn

C1-kontroltegn og Latin-1-komplement

U+0080—U+00FF

Historisk set har U+00A0-U+00FF ("Latin-1-komplement")-området haft tegn fra de tilsvarende Latin-1 ( ISO 8859-1 ) positioner, indtil Latin-1-standarden blev erklæret fuldt inkorporeret i Unicode - som ASCII ( U+0000-U+007F) og dette interval (U+0080-U+00FF), med undtagelse af konventionen om overlappende tegn gennem backspace.

Symbol Formål Mnemonics HTML Koden
U+0080-U+009F - C1 kontroltegn
U+00A0—U+00FF er en tilføjelse fra Latin-1
  ikke-brudsrum   5,0 U+00A0  
  3.2
¡ omvendt udråbstegn &dvs. ekskl; 3.2 U+00A1 ¡
¢ cent symbol ¢ 3.2 U+00A2 ¢
£ pund symbol &pund; 3.2 U+00A3 £
¤ valuta tegn &nuværende; 3.2 U+00A4 ¤
¥ yen og yuan symbol ¥ 3.2 U+00A5 ¥
¦ brudt lodret stang &brkbar; ikke standard U+00A6 ¦
¦ 3.2
§ paragraf tegn &sekt; 3.2 U+00A7 §
¨ diaeresis, trema
umlaut
(alle tager stilling)
&dø; 5,0 U+00A8 ¨
&Prik; 5,0
¨ 5,0
&um; 3.2
© copyright tegn &KOPI; 5,0 U+00A9 ©
&kopi; 3.2
ª ordensindikator (feminin) ª 3.2 U+00AA ª
" venstre-pegende dobbelt vinkel citat « 3.2 U+00AB «
¬ negativt fortegn _ &ikke; 3.2 U+00AC ¬
­ blød bindestreg (angiver stedet for en mulig orddeling: hvis der ikke er nogen bindestreg, er den usynlig, hvis der er, er den synlig som en bindestreg før et linjeskift). I eksemplet er den usynlig på grund af fraværet af en overførsel. &genert; 3.2 U+00AD ­
® varemærke juridisk beskyttelsestegn ® 5,0 U+00AE ®
® 5,0
® 3.2
¯ siddende makron .hibar. ikke standard U+00AF ¯
¯on; ikke standard
¯ 5,0
¯ 3.2
° positionsgradstegn _ &grad; ikke standard U+00B0 °
° 3.2
± plus eller minus &om eftermiddagen; 5,0 U+00B1 ±
± 5,0
± 3.2
² hævet "2" ² 3.2 U+00B2 ²
³ overskrift "3" ³ 3.2 U+00B3 ³
´ siddende akut ´ 5,0 U+00B4 ´
&spids; 3.2
µ præfiks mikro
mikron - forældet betegnelse for mikrometer
µ 3.2 U+00B5 µ
afsnitsmærke 3.2 U+00B6 ¶
· interpunct · 5,0 U+00B7 ·
· 5,0
· 3.2
¸ cedilla _ ¸ 5,0 U+00B8 ¸
¸ 3.2
¹ hævet "1" ¹ 3.2 U+00B9 ¹
º ordensindikator (maskulin) º 3.2 U+00BA º
» højre-pegende dobbelt vinkel citat " 3.2 U+00BB »
¼ simpel brøk "en fjerdedel" ¼ 3.2 U+00BC ¼
½ simpel brøk "halvdel" .alfa. 5,0 U+00BD ½
½ 3.2
¾ simpel brøk "tre fjerdedele" ¾ 3.2 U+00BE ¾
¿ op og ned på spørgsmålstegn ? 3.2 U+00BF ¿
EN latinsk stort A med grav ("stump accent") À 2.0 U+00C0 À
EN Latinsk stort A med akut accent &Spids; 2.0 U+00C1 Á
EN latinsk stort A med circumflex  2.0 U+00C2 Â
EN latinsk stort A med tilde à 2.0 U+00C3 Ã
EN latinsk stort A med trema Ä 2.0 U+00C4 Ä
EN latinsk stort A med en cirkel over &en ring; 2.0 U+00C5 Å
Æ latinsk ligatur AE Æ 2.0 U+00C6 Æ
Z latinsk stort C med cedille Ç 2.0 U+00C7 Ç
È latinsk stort E med grav è 2.0 U+00C8 È
É latinsk stort E med akut É 2.0 U+00C9 É
Ê latinsk stort E med circumflex Ê 2.0 U+00CA Ê
Ë latinsk stort E med trema Ë 2.0 U+00CB Ë
JEG latinsk hovedstad I med grav &grav; 2.0 U+00CC Ì
JEG latinsk kapital I med akut Í 2.0 U+00CD Í
О latinsk versal I med circumflex Î 2.0 U+00CE Î
П latinsk hovedstad I med treme Ï 2.0 U+00CF Ï
R latinsk stort bogstav "eth" Ð 2.0 U+00D0 Ð
Ñ latinsk stort N med tilde Ñ 2.0 U+00D1 Ñ
Ò latinsk stort O med grav ò 2.0 U+00D2 Ò
o latinsk stort O med akut ó 2.0 U+00D3 Ó
Ô latinsk stort O med circumflex Ô 2.0 U+00D4 Ô
Õ latinsk stort O med tilde Õ 2.0 U+00D5 Õ
Ö latinsk stort O med treme Ö 2.0 U+00D6 Ö
× multiplikationstegn . gange. 3.2 U+00D7 ×
Ø latinsk versal O diagonalt krydset Ø 2.0 U+00D8 Ø
Ù latinsk stort U med grav Ù 2.0 U+00D9 Ù
U latinsk stort U med akut Ú 2.0 U+00DA Ú
Û latinsk stort U med circumflex Û 2.0 U+00DB Û
Ü latinsk stort U med treme Ü 2.0 U+00DC Ü
E latinsk stort Y med akut Ý 2.0 U+00DD Ý
Þ latinsk stort bogstav Thorn (TORN) &TORN; 2.0 U+00DE Þ
ß latin lille escet ß 2.0 U+00DF ß
-en latin lille bogstav "a" med grav à 2.0 U+00E0 à
-en Latinsk lille "a" med et akut á 2.0 U+00E1 á
-en Latinsk lille "a" med circumflex â 2.0 U+00E2 â
en Latinsk lille "a" med tilde ã 2.0 U+00E3 ã
-en latin lille "a" med treme ä 2.0 U+00E4 ä
e Latinsk lille "a" med en cirkel på toppen &en ring; 2.0 U+00E5 å
æ latin lille ligatur "ae" æ 2.0 U+00E6 æ
ç Latinsk lille "c" med cedille ç 2.0 U+00E7 ç
e latin lille bogstav "e" med grav è 2.0 U+00E8 è
e latin lille "e" med akut é 2.0 U+00E9 é
ê latin lille "e" med circumflex ê 2.0 U+00EA ê
l latin lille "e" med trema ë 2.0 U+00EB ë
м Latinsk lille "i" med grav ì 2.0 U+00EC ì
jeg Latinsk lille "i" med akut í 2.0 U+00ED í
jeg Latinsk lille "i" med circumflex î 2.0 U+00EE î
jeg latin lille "i" med trema ï 2.0 U+00EF ï
ð Latinsk lille "eth" .eth; 2.0 U+00F0 ð
ñ Latinsk lille "n" med tilde ñ 2.0 U+00F1 ñ
o latin lille bogstav "o" med grav ò 2.0 U+00F2 ò
o latin lille "o" med akut ó 2.0 U+00F3 ó
o Latinsk lille "o" med circumflex ô 2.0 U+00F4 ô
õ latin lille "o" med tilde õ 2.0 U+00F5 õ
o latin lille "o" med treme ö 2.0 U+00F6 ö
÷ divisionstegn ÷ 5,0(?) U+00F7 ÷
&dele; 3.2
ø latinsk lille bogstav "o" skråtstillet ø 2.0 U+00F8 ø
u Latinsk lille "u" med grav ù 2.0 U+00F9 ù
u Latinsk lille "u" med akut ? 2.0 U+00FA ú
û Latinsk lille "u" med circumflex û 2.0 U+00FB û
u latin lille "u" med trema ü 2.0 U+00FC ü
ý latin lille "y" med akut ý 2.0 U+00FD ý
þ latin "torn" med små bogstaver (torn) &torn; 2.0 U+00FE þ
ÿ latin lille "y" med treme &yum; 2.0 U+00FF ÿ

Latin udvidelse - A

U+0100—U+017F

Symbol Formål Mnemonics HTML Koden
EN latinsk stort "A" med makron Ā 5,0 U+0100 Ā
en Latinsk lille "a" med makron ā 5,0 U+0101 ā
EN latinsk stort "A" med breve ă 5,0 U+0102 Ă
en latin lille "a" med breve ă 5,0 U+0103 ă
EN latinsk stort "A" med ogonek Ą 5,0 U+0104 Ą
en Latinsk lille "a" med ogonek ą 5,0 U+0105 ą
jeg latinsk stort "C" med akut ć 5,0 U+0106 Ć
c Latinsk lille "c" med et akut ć 5,0 U+0107 ć
Ĉ latinsk stort "C" med circumflex Ĉ 5,0 U+0108 Ĉ
e Latinsk lille "c" med circumflex ĉ 5,0 U+0109 ĉ
Ċ latinsk stort "C" med prik over Ċ 5,0 U+010A Ċ
ċ Latinsk lille "c" med prik over ċ 5,0 U+010B ċ
Č latinsk stort "C" med en fugl Č 5,0 U+010C Č
c Latinsk lille "c" med en fugl č 5,0 U+010D č
Ď latinsk stort "D" med en fugl Ď 5,0 U+010E Ď
ď Latinsk lille "d" med en fugl (i skrifttyper foretrækkes apostrof) ď 5,0 U+010F ď
© latinsk stort "D" med vandret streg. Ser muligvis ikke anderledes ud end Eth (Ð, U+00D0, Ð) Đ 5,0 U+0110 Đ
đ Latinsk lille "d" med vandret streg. Kan se det samme ud som eth (ð, U+00F0, ð) đ 5,0 U+0111 đ
Ē latinsk stort "E" med makron Ē 5,0 U+0112 Ē
ē Latinsk lille "e" med makron ē 5,0 U+0113 ē
Ĕ latinsk stort "E" med breve U+0114 Ĕ
ĕ Latinsk lille "e" med breve U+0115 ĕ
Ė latinsk stort "E" med prik over Ė 5,0 U+0116 Ė
e Latinsk lille "e" med prik over ė 5,0 U+0117 ė
Ę latinsk stort "E" med ogonek Ę 5,0 U+0118 Ę
e Latinsk lille "e" med ogonek ę 5,0 U+0119 ę
Ě latinsk stort "E" med en fugl Ě 5,0 U+011A Ě
e latin lille bogstav "e" med en fugl ě 5,0 U+011B ě
Ĝ latinsk stort "G" med circumflex Ĝ 5,0 U+011C Ĝ
e Latinsk lille "g" med circumflex ĝ 5,0 U+011D ĝ
Ğ latinsk stort "G" med breve Ğ 5,0 U+011E Ğ
ğ Latinsk lille "g" med breve ğ 5,0 U+011F ğ
-en latinsk stort "G" med prik over Ġ 5,0 U+0120 Ġ
e Latinsk lille "g" med prik over ġ 5,0 U+0121 ġ
Ģ latinsk stort "G" med si Ģ 5,0 U+0122 Ģ
ģ Latinsk lille "g" med si U+0123 ģ
Ĥ latinsk stort "H" med circumflex Ĥ 5,0 U+0124 Ĥ
e Latinsk lille "h" med circumflex ĥ 5,0 U+0125 ĥ
Ħ latinsk stort "H" med et vandret streg Ħ 5,0 U+0126 Ħ
ħ Latinsk lille "h" med vandret streg ħ 5,0 U+0127 ħ
JEG latinsk stort "jeg" med tilde Ĩ 5,0 U+0128 Ĩ
jeg Latinsk lille "i" med tilde ĩ 5,0 U+0129 ĩ
e latinsk stort "jeg" med makron Ī 5,0 U+012A Ī
jeg Latinsk lille "i" med makron ī 5,0 U+012B ī
JEG latinsk stort "jeg" med breve U+012C Ĭ
jeg Latinsk lille "i" med breve U+012D ĭ
JEG latinsk stort "jeg" med ogonek į 5,0 U+012E Į
jeg Latinsk lille "i" med ogonek į 5,0 U+012F į
JEG latinsk stort "jeg" med prik over İ 5,0 U+0130 İ
jeg Latinsk lille "i" uden prik over &imathan; 5,0 U+0131 ı
ı
IJ Latinske versal ligatur "IJ" IJ 5,0 U+0132 IJ
ij latin lille ligatur "ij" ij 5,0 U+0133 ij
Ĵ latinsk stort "J" med circumflex Ĵ 5,0 U+0134 Ĵ
ĵ Latinsk lille "j" med circumflex ĵ 5,0 U+0135 ĵ
Ķ latinsk stort "K" med si Ķ 5,0 U+0136 Ķ
jeg Latinsk lille "k" med si ķ 5,0 U+0137 ķ
ĸ Latinsk lille "kra" (grønlandsk "k") ĸ 5,0 U+0138 ĸ
Ĺ latinsk stort "L" med akut Ĺ 5,0 U+0139 Ĺ
ĺ latin lille bogstav "l" med akut ? 5,0 U+013A ĺ
Ļ latinsk stort "L" med si ļ 5,0 U+013B Ļ
ļ latin lille "l" med si ļ 5,0 U+013C ļ
jeg latinsk stort "L" med en fugl (i skrifttyper foretrækkes apostrof) ľ 5,0 U+013D Ľ
ľ latinsk lille bogstav "l" med en fugl (i skrifttyper foretrækkes apostrof) ľ 5,0 U+013E ľ
Ŀ latinsk stort "L" med en prik i midten Ŀ 5,0 U+013F Ŀ
ŀ Latinsk lille "l" med en prik i midten ŀ 5,0 U+0140 ŀ
l latinsk stort "L" med vandret streg Ł 5,0 U+0141 Ł
ł Latinsk lille bogstav "l" med vandret streg ł 5,0 U+0142 ł
Ń latinsk stort "N" med akut Ń 5,0 U+0143 Ń
ń latin lille "n" med akut ń 5,0 U+0144 ń
Ņ latinsk stort "N" med si Ņ 5,0 U+0145 Ņ
ņ latin lille "n" med si ņ 5,0 U+0146 ņ
Z latinsk stort "N" med en fugl Ň 5,0 U+0147 Ň
ň latinsk lille bogstav "n" med en fugl ň 5,0 U+0148 ň
an Latinsk lille "n" efterfulgt af en apostrof ʼn 5,0 U+0149 ʼn
Ŋ latinsk hovedstad "ENG" Ŋ 5,0 U+014A Ŋ
ŋ latin lille "eng" ŋ 5,0 U+014B ŋ
Ō latinsk stort "O" med makron Ō 5,0 U+014C Ō
ō Latinsk lille "o" med makron ō 5,0 U+014D ō
Ŏ latinsk stort "O" med breve U+014E Ŏ
ŏ Latinsk lille "o" med breve U+014F ŏ
Ő latinsk stort "O" med dobbelt akut Ő 5,0 U+0150 Ő
ő Latinsk lille "o" med dobbelt akut ő 5,0 U+0151 ő
Œ Latinske versal ligatur "OE" Œ 4.0 U+0152 Œ
- latin lille ligatur "oe" œ 4.0 U+0153 œ
Ŕ latinsk stort "R" med akut &Sats; 5,0 U+0154 Ŕ
ŕ Latinsk lille "r" med et akut ŕ 5,0 U+0155 ŕ
Ŗ latinsk stort "R" med si Ŗ 5,0 U+0156 Ŗ
ŗ latin lille "r" med si ŗ 5,0 U+0157 ŗ
Ř latinsk stort "R" med en fugl Ř 5,0 U+0158 Ř
r latin lille bogstav "r" med en fugl ř 5,0 U+0159 ř
S latinsk stort "S" med akut Ś 5,0 U+015A Ś
S Latinske små "s" med et akut ś 5,0 U+015B ś
Ŝ latinsk stort "S" med circumflex Ŝ 5,0 U+015C Ŝ
ŝ Latinske små "s" med circumflex ŝ 5,0 U+015D ŝ
Ş latinsk stort "S" med si Ş 5,0 U+015E Ş
s Latinske små "s" med si ş 5,0 U+015F ş
S latinsk stort "S" med en fugl & Scaron; 4.0 U+0160 Š
s latinske små bogstaver "s" med en fugl š 4.0 U+0161 š
Ţ latinsk stort "T" med si Ţ 5,0 U+0162 Ţ
ţ Latinsk lille "t" med si ţ 5,0 U+0163 ţ
Ť latinsk stort "T" med en fugl Ť 5,0 U+0164 Ť
ť Latinsk lille "t" med en fugl (i skrifttyper foretrækkes apostrof) ť 5,0 U+0165 ť
Ŧ latinsk stort "T" med vandret streg Ŧ 5,0 U+0166 Ŧ
ŧ Latinsk lille "t" med vandret streg ŧ 5,0 U+0167 ŧ
Ũ latinsk stort "U" med tilde Ũ 5,0 U+0168 Ũ
ũ Latinsk lille "u" med tilde ũ 5,0 U+0169 ũ
Ū latinsk stort "U" med makron Ū 5,0 U+016A Ū
ū Latinsk lille "u" med makron ū 5,0 U+016B ū
Ŭ latinsk stort "U" med breve Ŭ 5,0 U+016C Ŭ
ŭ Latinsk lille "u" med breve ŭ 5,0 U+016D ŭ
Ů latinsk stort "U" med en ring på toppen Ů 5,0 U+016E Ů
ů Latinsk lille "u" med en ring på toppen ů 5,0 U+016F ů
Ű latinsk stort "U" med dobbelt akut Ű 5,0 U+0170 Ű
ű Latinsk lille "u" med dobbelt akut ű 5,0 U+0171 ű
Ų latinsk stort "U" med ogonek Ų 5,0 U+0172 Ų
ų Latinsk lille "u" med ogonek ų 5,0 U+0173 ų
Ŵ latinsk stort "W" med circumflex Ŵ 5,0 U+0174 Ŵ
ŵ Latinsk lille "w" med circumflex ŵ 5,0 U+0175 ŵ
z latinsk stort "Y" med circumflex Ŷ 5,0 U+0176 Ŷ
ŷ Latinsk lille "y" med circumflex ŷ 5,0 U+0177 ŷ
Ÿ latinsk stort "Y" med trema Ÿ 4.0 U+0178 Ÿ
Ź latinsk stort "Z" med akut Ź 5,0 U+0179 Ź
ź latin lille bogstav "z" med akut ź 5,0 U+017A ź
Z latinsk stort "Z" med prik over Ż 5,0 U+017B Ż
z Latinsk lille "z" med en prik over ż 5,0 U+017C ż
Z latinsk stort "Z" med en fugl Ž 5,0 U+017D Ž
z latinsk lille bogstav "z" med en fugl ž 5,0 U+017E ž
ſ Latinske små "lange s" U+017F ſ

Latin udvidelse - B

U+0180—U+024F

Symbol Formål Mnemonics HTML Koden
ƒ • Latinsk lille f-bogstav med en hale forneden (nogle gange kaldet håndskrevet f, faktisk opretstående eller kursiv)
• Florintegn
• Funktionssymbol
• Dette er ikke et almindeligt kursivt latinsk f (𝑓, U+1D453), selvom det afhængigt af skrifttypen kan ligne meget
ƒ 4.0 U+0192 ƒ
Ƶ latinsk stort "Z" med vandret streg &hindret; 5,0 U+01B5 Ƶ
ǵ Latinsk lille "g" med et akut &gacut; 5,0 U+01F5 ǵ
ȷ Latinsk lille "j" uden prik over ȷ 5,0 U+0237 ȷ

Positionsbesættende bogstavmodifikatorer

U+02B0—U+02FF

Symbol Formål Mnemonics HTML Koden
ˆ omvendt fugl/cirkumfleks accent ˆ 4.0 U+02C6 ˆ
ˇ positionel accent birdie (hachek) ˇ 5,0 U+02C7 ˇ
ˇ
˘ breve ˘ 5,0 U+02D8 ˘
˘
˙ holdepunkt ovenfor ˙ 5,0 U+02D9 ˙
˙
˚ siddende kreds på toppen ˚ 5,0 U+02DA ˚
˛ ogonek ˛ 5,0 U+02DB ˛
˜ stillingsoptager lille tilde ˜ 5,0 U+02DC ˜
˜ 4.0
˝ beboer i den dobbelte akutte stilling ˝ 5,0 U+02DD ˝
˝

Kombinerbare diakritiske tegn

U+0300—U+036F

Symbol Formål Mnemonics HTML Koden
 - kombineret accentmærke (akut - placeret umiddelbart efter bogstavet, som det skal vises over) U+0301 ́
 ̑ kombineret omvendt breve (placeret umiddelbart efter bogstavet, som det skal vises over) &DownBrave; 5,0 U+0311 ̑

Græske og koptiske symboler

U+0370-U+03FF

Indeholder græsk alfabet .

Symbol Formål Mnemonics HTML Koden
Α græsk hovedstad alfa .alfa. 4.0 U+0391 Α
Β græsk hovedstad beta .beta. 4.0 U+0392 Β
Γ græsk kapitalskala γ 4.0 U+0393 Γ
Δ græsk hovedstad delta . 4.0 U+0394 Δ
Ε græsk hovedstad epsilon ε 4.0 U+0395 Ε
Z græsk hovedstad zeta Ζ 4.0 U+0396 Ζ
Η græsk hovedstad eta .Eta. 4.0 U+0397 Η
Θ græsk hovedstad theta .theta. 4.0 U+0398 Θ
jeg græsk hovedstad iota ι 4.0 U+0399 Ι
K græsk hovedstad kappa Κ 4.0 U+039A Κ
Λ græsk hovedstad lambda Λ 4.0 U+039B Λ
M græsk hovedstad mu μ 4.0 U+039C Μ
N græsk hovedstad nøgen Ν 4.0 U+039D Ν
Ξ græsk hovedstad xi Ξ 4.0 U+039E Ξ
Ο græsk hovedstad omicron Ο 4.0 U+039F Ο
Π græsk hovedstad pi Π 4.0 U+03A0 Π
P græsk hovedstad ro Ρ 4.0 U+03A1 Ρ
Σ Græsk hovedstad sigma Σ 4.0 U+03A3 Σ
Τ græsk hovedstad tau .tau. 4.0 U+03A4 Τ
Υ græsk hovedstad upsilon υ 4.0 U+03A5 Υ
Φ græsk hovedstad fi .phi. 4.0 U+03A6 Φ
x græsk hovedstad chi Χ 4.0 U+03A7 Χ
Ψ græsk hovedstad psi Ψ 4.0 U+03A8 Ψ
Ω • Græsk stort omega
•  Ohm (enhed for elektrisk modstand) - anbefales i stedet for det tidligere introducerede specialtegn "Ohm" U+2126 (Ω, Ω)
Ω 5,0 U+03A9 Ω
Ω 4.0
α Græsk alfa med små bogstaver α 4.0 U+03B1 α
β Græsk lille beta .beta. 4.0 U+03B2 β
γ Græsk i lille skala .gamma. 4.0 U+03B3 γ
δ Græsk lille delta . 4.0 U+03B4 δ
ε græsk lille epsilon ε 5,0 U+03B5 ε
ε 4.0
ζ Græsk lille zeta .zeta. 4.0 U+03B6 ζ
η Græsk små bogstaver eta .eta. 4.0 U+03B7 η
θ Græsk lille theta .theta. 4.0 U+03B8 θ
v Græsk lille iota ι 4.0 U+03B9 ι
κ Græsk kappa med små bogstaver κ 4.0 U+03BA κ
λ Græsk lambda med små bogstaver λ 4.0 U+03BB λ
μ Græsk små bogstaver mu μ 4.0 U+03BC μ
v græsk nøgen med små bogstaver ν 4.0 U+03BD ν
ξ græsk lille xi ξ 4.0 U+03BE ξ
ο græsk lille omicron &omikron; 4.0 U+03BF ο
π Græsk lille pi π 4.0 U+03C0 π
s græsk lille ro ρ 4.0 U+03C1 ρ
ς Græsk små bogstaver sigma final ς 5,0 U+03C2 ς
ς 5,0
ς 4.0
σ Græsk sigma med små bogstaver σ 4.0 U+03C3 σ
τ græsk lille tau .tau. 4.0 U+03C4 τ
υ græsk lille bogstav Upsilon υ 5,0 U+03C5 υ
υ 4.0
φ græsk lille fi .phi. 4.0 U+03C6 φ
χ Græsk lille chi χ 4.0 U+03C7 χ
ψ græsk lille psi ψ 4.0 U+03C8 ψ
ω græsk lille omega ω 4.0 U+03C9 ω
ϑ Græsk symbolsk theta .theta. 5,0 U+03D1 ϑ
ϑ 5,0
.thetasym. 4.0
ϒ Græsk upsilon med hestehale υ 5,0 U+03D2 ϒ
ϒ 4.0
ϕ græsk symbol phi ϕ 5,0 U+03D5 ϕ
ϕ 5,0
.phi. 5,0
ϖ græsk tegn pi ϖ 5,0 U+03D6 ϖ
ϖ 4.0
Ϝ græsk hovedstad digamma Ϝ 5,0 U+03DC Ϝ
ϝ Græsk digamma med små bogstaver γ 5,0 U+03DD ϝ
ϝ 5,0
ϰ græsk karakter kappa ϰ 5,0 U+03F0 ϰ
ϰ 5,0
ϱ græsk karakter ro ϱ 5,0 U+03F1 ϱ
ϱ 5,0
ϵ Græsk symbolsk epsilon (direkte epsilon, måne-epsilon) ϵ 5,0 U+03F5 ϵ
ϵ 5,0
ϵ 5,0
϶ Græsk omvendt epsilon (omvendt måne-epsilon) ϶ 5,0 U+03F6 ϶
? 5,0

Generel tegnsætning

Symbol Formål Mnemonics Koden
et mellemrum med længden N (et langt mellemrum, omtrent på størrelse med en em bindestreg)
et mellemrum med længden M (et meget langt mellemrum, omtrent på størrelse med en em bindestreg)
snævert mellemrum
ikke-sammenføjningsfri - forbud mod limning ( ligatur ) af tilstødende tegn
‍‍ Zero width joiner - en anmodning om limning ( ligatur ) tilstødende tegn
venstre-til-højre-mærke - et tegn på begyndelsen af ​​teksten, læst fra venstre mod højre
højre-til-venstre-mærke - et tegn på begyndelsen af ​​tekst læst fra højre mod venstre &lm;
- bindestreg uden brud (ikke-adskillelig) bindestreg  
- en tankestreg (streg af længde N)
em tankestreg (streg af længde M)
' enkelt citat som "øvre omvendt ni"
' enkelt citat som "upper nine"
enkelt citat som "lower nine"
enkelt citat som "upper reversed nine"
dobbelt citat som "øvre omvendt ni"
dobbelt citat som "øvre ni"
dobbelt citat som "lavere ni"
' dobbelt citat som "upper reversed nine"
typografisk kryds &dolk;
dobbelt typografisk kryds &Dolk;
listemarkør (punkttegn) x
vandret ellipse &helli;
ppm
" luge
dobbelt slag
venstre-pegende enkelt vinkel citat (foreslået, men endnu ikke standardiseret af ISO, næsten overalt)
højrepegende enkeltvinkelcitat ( foreslået, men endnu ikke standardiseret af ISO, næsten overalt)
positionel overline
 ⁄  kombinerbart brøk-streg tegn (1⁄2→ ½,3⁄4→ ¾,12⁄23→ 12⁄23, hvis nødvendigt, er cifresekvensen begrænset til et mellemrum på nul længde (​) eller et non-breaking nul-længde mellemrum (⁠):12​34⁄56→ 12​34⁄56,2⁠99⁄100→ 2⁠99⁄100)

Valutasymboler

Symbol Formål Mnemonics Koden
Euro
rubel

Bogstavlignende tegn

Symbol Formål Mnemonics Koden
Gotisk stort I (almindelig latinsk gotisk bogstav) = imaginær del &billede;
Ingen. Nummertegn &nummer; (HTML 5.0)
elliptisk Weierstrass-funktion eller sættet af alle delmængder. Et enkelt tegn, >ikke håndskrevet stort P (𝒫, 풫)
Gotisk stort R (regelmæssigt latinsk gotisk bogstav) = reel del &ægte;
varemærke &HANDLE; — ikke overalt
matematisk bogstav Aleph = uendelig kardinal - i modsætning til det hebraiske bogstav Aleph (‎א‎, א) læses fra venstre mod højre

Nummerformularer

Symbol Formål Mnemonics Koden
simpel brøk "en tredjedel" ⅓ (HTML 5.0)

Pile

Symbol Formål Mnemonics Koden
til venstre
op
ret
langt nede
venstre højre
nedadvinklet til højre = vognretur
dobbelt venstre pil
dobbelt op
dobbelt højre
dobbelt ned
dobbelt venstre-højre
til venstre
op
ret
langt nede

Matematiske operationer

Symbol Formål Mnemonics Koden
universel kvantifier (til alle...) &for alle;
partiel afledt &en del;
eksistentiel kvantifier (eksisterer...) &eksisterer;
tomt sæt (diameter) &tom;
nabla &nab;
hører til &er i;
hører ikke til &ikke i;
indeholder
multiplikation
sum over sæt
minus - ikke en tankestreg-minus fra ASCII, har samme dimensioner og samme placering af det vandrette streg som "+"
division (ikke ASCII skråstreg)
sæt forskel (ikke ASCII-omvendt skråstreg) ∖ (HTML 5.0)
∖ (HTML 5.0)
∖ (HTML 5.0)
∖ (HTML 5.0)
∖ (HTML 5.0)
stjerne (garanteret ikke forhøjet over strengen)
kvadratrod = radikalt tegn
i forhold til &rekvisit;
uendelighed
hjørne
konjunktion (logisk OG) = kile &og;
disjunktion (logisk ELLER) = vee &eller;
kryds = cap &kasket;
forening = kop &kop;
integral
derfor, derved = derfor &der4;
svarende til (for infinitesimal/stor) = svarer til
kongruent = er omtrent lig (kongruent) med
omtrent lig med = er næsten lig (asymptotisk) med
= er ikke lig med
identisk lig, logisk ækvivalent = er ækvivalent med
mindre end eller lig med = er mindre eller lig med
større end eller lig med = er større eller lig med
delmængde = er delmængde af
omfatter = er supersæt af
er ikke en delmængde af
delmængde af eller svarende til ?
omfatter eller ækvivalent = er supersæt af eller svarer til
plus i cirkel = direkte sum
multiplikation med et [skrå] kryds i en cirkel = tensorprodukt &nogle gange;
up tack = ortogonal til = vinkelret
prikmultiplikation = prikprodukt

Tekniske symboler

Symbol Formål Mnemonics Koden
rund op venstre beslag = apl upstile
afrund højre beslag
rund ned venstre beslag = apl downstile &lgulv;
afrunding nedad i højre beslag &rgulv;
vinkelbeslag venstre = lampet
retvinklet beslag = ket

Geometriske former

Symbol Formål Mnemonics Koden
rombe

Diverse tegn

Symbol Formål Mnemonics Koden
spar (kortfarve)
køller (kortfarve) &klubber;
hjerter (kortfarve) &hjerter;
diamanter (kortfarve)

Noter

  1. HTML5. Navngivne karakterreferencer .
  2. 1 2 HTML-dokumentrepræsentation .
  3. Backspace-overlay bruges i ASCII til at gengive kombinerede tegn (u␈` → ù) og fed varianter (u␈u → u ). Alle sekvenser af ASCII-standarden, der afbilder kombinerede tegn, såvel som fede versioner af alfanumeriske tegn, har Unicode-modstykker, men ikke ved at oversætte "bogstav-til-bogstav", men ved at erstatte sekvensen af ​​ASCII-tegn med ét Unicode-tegn. Fed varianter af andre ASCII-tegn har ingen korrespondance og skal repræsenteres med midler uden for Unicode-standarden. Da mange skrifttyper ikke indeholder fed bogstavvarianter, er deres billede meget afhængigt af funktionerne i tekstvisningssystemet (bogstav- og skrifttypeerstatning), så det er at foretrække at indstille fed stilarter ved hjælp af ikke-Unicode-værktøjer.
  4. overlejring af et dobbelt anførselstegn gennem backspace i ASCII (␈") i Unicode er repræsenteret af det kombinerbare "dobbelt-akut" tegn "̋"U+030B(̋) eller "dobbelt lodret streg over" "̎"U+030E(̏)
  5. apostrofoverlejring ved at gå tilbage i ASCII (␈') i Unicode er repræsenteret af det kombinerede "acut"-tegn " ́"U+0301(́)
  6. for at få præcis den midterste stjerne, skal du bruge den matematiske operation "∗"U+2217 ∗(∗)
  7. Overlapning af en stjerne ved at gå tilbage i ASCII (␈*) i Unicode er repræsenteret af det kombinerbare "stjerne over"-tegn "⃰"U+20F0(⃰)
  8. Overlejring af et komma ved at gå tilbage i ASCII (␈,) i Unicode er repræsenteret af det kombinerbare "komma under" symbol "̦"U+0326(̦)
  9. bindestreg "-" skal bruges som bindestregU+2010(‐), bindestreg "-"U+2011(‑) og blød indpakning ""U+00AD &genert;(­); som streg - kort streg "-"U+2013 –(–), em bindestreg "—"U+2014 —(—), bindestreg "‒" med samme bredde ("digital")U+2012(‒) og andre; som et minus - det matematiske tegn "-"U+2212 −(−)
  10. overlejring af en tankestreg-minus ved at gå tilbage i ASCII (␈-) i Unicode er repræsenteret af det kombinerede "korte vandrette streg"-symbol "̵"U+0335(̵), eller, hvis du mener kontinuerlig gennemstregning (med sammenføjning til venstre og højre), - "lang vandret streg" "̶"U+0336(̶)
  11. overlejring af en prik via et skridt tilbage i ASCII (␈.) i Unicode er repræsenteret af det kombinerbare prik-under-symbol "̣"U+0323(̣)
  12. for division ( a+b ∕ c+d med eksplicit (uden for Unicode) kontrol af hævet og sænket skrift) anbefales operationen " ∕ "U+2215(∕); for rene numeriske brøker med implicit (unicode) kontrol af hævet og sænket placering (12⁄34) — kombinerbart brøklinjetegnU+2044 ⁄(⁄)
  13. Overlapning af en omvendt skråstreg i ASCII (␈/) i Unicode er repræsenteret af det kombinerbare korte skråstreg "̷"U+0337(̷) eller "lang skråstreg" "̸"U+0338(̸)
  14. Fed stilarter ved at overlejre et ciffer på sig selv ved at gå tilbage i ASCII (0␈0 → 0 ) i Unicode gengives med tegn i intervallet "𝟎"U+1D7CE(ퟎ)—"𝟗"U+1D7D7(ퟗ)
  15. Fed stilarter ved at overlejre et bogstav på sig selv ved at gå tilbage i ASCII (A␈A → A ) i Unicode er repræsenteret af tegn i intervallet "𝐀"U+1D400(퐀)—"𝐙"U+1D419(퐙)
  16. skråstreg overskridning i ASCII (␈\) i Unicode er repræsenteret af det kombinerbare "backslash"-tegn "⃥"U+20E5(⃥)
  17. som en garanteret hævet skrift, brug sekvensen "non-breaking space, combinable circumflex" " ̂"U+00A0 U+0302( ̂) eller positionscirkumfleksen "ˆ"U+02C6 ˆ(ˆ)
  18. Vognoverlapning via et stepback i ASCII (␈^) i Unicode er repræsenteret af det kombinerede circumflex-tegn "̂"U+0302(̂)
  19. overlejring af en understregning via et skridt tilbage i ASCII (␈_) i Unicode er repræsenteret af et kombinerbart "makron under"-tegn (ingen horisontal sammenføjning) "̱"U+0331(̱) eller "understreget" (med vandret docking) "̲"U+0332(̲)
  20. overlejring af en grav ved at træde tilbage i ASCII (␈`) i Unicode er repræsenteret af det kombinerede "grave"-tegn "̀"U+0300(̀)
  21. Fed stilarter ved at overlejre et bogstav på sig selv ved at gå tilbage i ASCII (a␈a → a ) i Unicode er repræsenteret af tegn i intervallet "𝐚"U+1D41A(퐚)—"𝐳"U+1D433(퐳)
  22. ASCII backspace (␈|) overlejring i Unicode er repræsenteret af det kombinerede rørtegn "⃒"U+20D2(⃒) eller "kort lodret streg" "⃓"U+20D3(⃓)
  23. som hævet skrift, brug sekvensen "non-breaking space, kombinerbar tilde" "̃"U+00A0 U+0303( ̃) eller lille tilde ˜U+02DC(˜), som en midterlinje - den matematiske operation "∼"U+223C ∼(∼)
  24. Overlapning af en tilde via et skridt tilbage i ASCII (␈~) i Unicode er repræsenteret af det kombinerbare tilde-tegn "̃"U+0303(̃)

Links