^ UTF-8 (Unikodo) |
Kiam UTF-8-igante vian TTT-paĝon, nepre metu ene de <head></head> la jenon (HTML): <meta http-equiv="Content-type" content="text/html; charset=UTF-8"> sed en XHTML: <meta http-equiv="Content-type" content="text/html; charset=UTF-8"/>
Tiam, uzu la UTF-8-an paron por la E-supersignitaj literoj - temas ne pri &xxx;&yyy; sed rekte entajpu la kodon (PC-e, ALT-0xxxALT-0yyy) (kiu surcele donus Ĉ (do Cx)):
Estas iuj cimoj en TTT-legiloj (versiaj 4) rilate al UTF-8, tamen UTF-8 estas uzinda. UTF-8 estas la normo en XML, WAP-telefonoj, kaj multaj aliaj.
| Kodo (dekume) | Kodo (deksesume) | Donas literon | |
|---|---|---|---|
| 196 136 | C4 88 | Ĉ | = C kun cirkumflekso Ĉ |
| 196 137 | C4 89 | ĉ | = c kun cirkumflekso ĉ |
| 196 156 | C4 9C | Ĝ | = G kun cirkumflekso Ĝ |
| 196 157 | C4 9D | ĝ | = g kun cirkumflekso ĝ |
| 196 164 | C4 A4 | Ĥ | = H kun cirkumflekso Ĥ |
| 196 165 | C4 A5 | ĥ | = h kun cirkumflekso ĥ |
| 196 180 | C4 B4 | Ĵ | = J kun cirkumflekso Ĵ |
| 196 181 | C4 B5 | ĵ | = j kun cirkumflekso ĵ |
| 197 156 | C5 9C | Ŝ | = S kun cirkumflekso Ŝ |
| 197 157 | C5 9D | ŝ | = s kun cirkumflekso ŝ |
| 197 172 | C5 AC | Ŭ | = U kun bireto Ŭ |
| 197 173 | C5 AD | ŭ | = u kun bireto ŭ |
Kiel 196 136 el 264 ?
264 dekume =
0108 deksesume =
00000001 00001000 duume =
001 00001000 duume =
00100 001000 duume =>
11000100 10001000 UTF-8 duume =
C4 88 UTF-8 deksesume =
196 136 UTF-8 deksese
ASCII-e, uzu 0bbbbbbb; sed Latin-1-e kaj Latin-A-e (kie estas E-o) 110bbbbb10bbbbbb.
^ UTF-7 (Unikodo) |
Se temas pri UTF-7-igante vian TTT-paĝon, nepre metu ene de <head></head> la jenon: <meta http-equiv="Content-type" content="text/html; charset=x-unicode-2-0-utf-7"> kaj simple uzu la 7-bitan &#unikodo; (memoru ke æ ktp ĉiam rilatas al ISO-8859-1, neniam ajn al ISO-8859-3) (aŭ la 7-bitan +utf7kodo-).
| Kodo | Donas literon | |
|---|---|---|
| +AQg- | Ĉ | = C kun cirkumflekso |
| +AQk- | ĉ | = c kun cirkumflekso |
| +ARw- | Ĝ | = G kun cirkumflekso |
| +AR0- | ĝ | = g kun cirkumflekso |
| +ASQ- | Ĥ | = H kun cirkumflekso |
| +ASU- | ĥ | = h kun cirkumflekso |
| +ATQ- | Ĵ | = J kun cirkumflekso |
| +ATU- | ĵ | = j kun cirkumflekso |
| +AVw- | Ŝ | = S kun cirkumflekso |
| +AV0- | ŝ | = s kun cirkumflekso |
| +AWw- | Ŭ | = U kun bireto |
| +AW0- | ŭ | = u kun bireto |
^ NCR de HTML (Unikodo) |
Vi ne bezonas (?) tiun <meta...> se temas pri pura HTML NCR. Simple uzu la 7-bitan &#unikodo; (memoru ke æ ktp ĉiam rilatas al ISO-8859-1, neniam ajn al ISO-8859-3).
Unikodo uzebla en HTML (version >=4) En Java kaj en ECMAscript, uzu \uHHHH kie HHHH estas deksesume.
+ = + = plussigno (singardu pri + en UTF-7)(ekzemple en UTF-7 estu ne <font size=+1> sed <font size=+-1> !)
| Kodo (dekume - prefere) | Kodo (deksesume - evitinde) | Donas literon | |
|---|---|---|---|
| Ĉ | Ĉ | Ĉ | = C kun cirkumflekso |
| ĉ | ĉ | ĉ | = c kun cirkumflekso |
| Ĝ | Ĝ | Ĝ | = G kun cirkumflekso |
| ĝ | ĝ | ĝ | = g kun cirkumflekso |
| Ĥ | Ĥ | Ĥ | = H kun cirkumflekso |
| ĥ | ĥ | ĥ | = h kun cirkumflekso |
| Ĵ | Ĵ | Ĵ | = J kun cirkumflekso |
| ĵ | ĵ | ĵ | = j kun cirkumflekso |
| Ŝ | Ŝ | Ŝ | = S kun cirkumflekso |
| ŝ | ŝ | ŝ | = s kun cirkumflekso |
| Ŭ | Ŭ | Ŭ | = U kun bireto |
| ŭ | ŭ | ŭ | = u kun bireto |
^ Unikodaj URL-oj |
| URL kodo | Donas literon | |
|---|---|---|
| %c4%88 | Ĉ | = C kun cirkumflekso |
| %c4%89 | ĉ | = c kun cirkumflekso |
| %c4%9c | Ĝ | = G kun cirkumflekso |
| %c4%9d | ĝ | = g kun cirkumflekso |
| %c4%a4 | Ĥ | = H kun cirkumflekso |
| %c4%a5 | ĥ | = h kun cirkumflekso |
| %c4%b4 | Ĵ | = J kun cirkumflekso |
| %c4%b5 | ĵ | = j kun cirkumflekso |
| %c5%9c | Ŝ | = S kun cirkumflekso |
| %c5%9d | ŝ | = s kun cirkumflekso |
| %c5%ac | Ŭ | = U kun bireto |
| %c5%ad | ŭ | = u kun bireto |
^ MES-1 |
MES-1 (kaj do MES-2 & MES-3) subtenas Esperanton.
| Unikodo XX__ | Unikodo __XX |
|---|---|
| 00 | 20-7E, A0-FF |
| 01 | 00-13 16-2B 2E-4D 50-7F B7 EE EF |
| 02 | 18-1B 1E 1F 7C 92 C7 D8-DB DD |
| 1E | 02 03 0A 0B 1E 1F 40 41 56 57 60 61 6A 6B 80-85 9B F2 F3 |
| 20 | 15 18 19 1C 1D AC |
| 21 | 22 26 5B-5E 90-93 |
| 26 | 6A |
^ T.51 |
Oficiala laŭ normo de ITU, ŝajne (?) uzata en Teletekso/Videotekso (do Minitel) kaj Teleteksto 2 kaj ties tiparo.
Ekzistas 7-bita versio de T.51.
| Kodo (dekume) | Kodo (deksesume) | Donas literon | |
|---|---|---|---|
| 65 | 41 | A | = A |
| 195 67 | C3 43 | Ĉ | = C kun cirkumflekso |
| 195 99 | C3 63 | ĉ | = c kun cirkumflekso |
| 195 71 | C3 47 | Ĝ | = G kun cirkumflekso |
| 195 103 | C3 67 | ĝ | = g kun cirkumflekso |
| 195 72 | C3 48 | Ĥ | = H kun cirkumflekso |
| 195 104 | C3 68 | ĥ | = h kun cirkumflekso |
| 195 74 | C3 4A | Ĵ | = J kun cirkumflekso |
| 195 106 | C3 6A | ĵ | = j kun cirkumflekso |
| 195 83 | C3 53 | Ŝ | = S kun cirkumflekso |
| 195 115 | C3 73 | ŝ | = s kun cirkumflekso |
| 198 85 | C6 55 | Ŭ | = U kun bireto |
| 198 117 | C6 75 | ŭ | = u kun bireto |
| 241 | F1 | æ | = ae ligita |
^ JIS |
Malkiel Unikodo, ne estas tie ĉi Han-unuiĝo.
| Tiparo | Enkodigo | Komentoj | ||
|---|---|---|---|---|
| JIS | Shift-JIS | EUC | ||
| JIS-Latin (Japanio) | Jes | Jes | Jes | ASCII sed kun ¥ anstataŭ \, kaj kun du aliaj modifoj |
| Duonlarĝa Katakana (Japanio) | Jes | Jes | Jes | Por fremd-vortoj kaj emfazoj, eĉ meze de Kanji |
| JIS X 0208-1990 (Japanio) | Jes | Jes | Jes | Inkludas la sensupersignitajn Latin-literojn A-Z |
| JIS X 0212-1990 (Japanio) | Jes | Ne | Jes | La Esperantaj literoj, kaj ĉiuj supersignitaj Latin-literoj, troviĝas en rangoj 10 kaj 11 |
| KS C 5601-1992 (Koreio) | Jes | Ne | Jes | |
| GB 2312-80 (Ĉinio) | Jes | Ne | Jes | |
| Granda Kvinaĵo (Tajvano) | Ne | Ne | Jes | |
^ ISO-8859-3 |
ISO-8859-3 = Latin-3.
Kiam Latin-3-igante vian TTT-paĝon, nepre metu ene de <head></head> la jenon: <meta http-equiv="Content-type" content="text/html; charset=ISO-8859-3"> (sed multaj kroziloj miskomprenas tiun ĉi linion stultece).
Metodo evitinda pro tio ke multaj ĝaĝaj sistemoj ne subtenas la normon.
La nova versio de Latin-3 (versio 1998) enhavas nenion novan krom la Unikodigon de la nomoj de la literoj/simboloj. Eĉ la simbolo por la eŭro (€) mankas!
| Kodo (dekume) | Kodo (deksesume) | Donas literon | |
|---|---|---|---|
| 198 | C6 | Ĉ | = C kun cirkumflekso |
| 230 | E6 | ĉ | = c kun cirkumflekso |
| 216 | D8 | Ĝ | = G kun cirkumflekso |
| 248 | F8 | ĝ | = g kun cirkumflekso |
| 166 | A6 | Ĥ | = H kun cirkumflekso |
| 182 | B6 | ĥ | = h kun cirkumflekso |
| 172 | AC | Ĵ | = J kun cirkumflekso |
| 188 | BC | ĵ | = j kun cirkumflekso |
| 222 | DE | Ŝ | = S kun cirkumflekso |
| 254 | FE | ŝ | = s kun cirkumflekso |
| 221 | DD | Ŭ | = U kun bireto |
| 253 | FD | ŭ | = u kun bireto |
^ ESPERANTO-ASCII |
EO-ASCII estas la "NORMA" ASCII por Esperanto.
charset=EO-ASCII
alinome sed malprefere, charset=ENKI (Esperanta Norma Kodo por Informinterŝanĝo)
Laŭ normo Z.314 de ITU, estas nur dek 7-bitaj kodoj uzeblaj por aliaj lingvoj (vidu unuan suban tabelon). (Tamen, en Teleteksto 1, uzeblaj estas dek tri, nome 23=# 24=$ 40=@ 5B=[ 5C=\ 5D=] 5E=^ 5F=_ 60=` 7B={ 7C=| 7D=} 7E=~.) La kodoj de la normo EO-ASCII estis zorge elektitaj, ekzemple pro formo @ ] } $ ~ ^. La normo estas, kvankam interesa, neniam uzita kaj ne oficiale agnoskita.
| en EO-ASCII | Kodo (deksesume) | Donas literon | |
|---|---|---|---|
| @ | 40 | Ĉ | = C kun cirkumflekso |
| ` | 60 | ĉ | = c kun cirkumflekso |
| [ | 5B | Ĝ | = G kun cirkumflekso |
| { | 7B | ĝ | = g kun cirkumflekso |
| \ | 5C | € | = eŭro |
| | | 7C | = sekvas [0-F][0-F] por bitoko de UTF-8 | |
| |C4|A4 | 7C... | Ĥ | = H kun cirkumflekso |
| |C4|A5 | 7C... | ĥ | = h kun cirkumflekso |
| ] | 5D | Ĵ | = J kun cirkumflekso |
| } | 7D | ĵ | = j kun cirkumflekso |
| # | 23 | Ŝ | = S kun cirkumflekso |
| $ | 24 | ŝ | = s kun cirkumflekso |
| ^ | 5E | Ŭ | = U kun bireto |
| ~ | 7E | ŭ | = u kun bireto |