Latinsk tegn i Unicode
Latinske bokstaver , dvs. tegn som er basert på det latinske alfabetet , finnes i forskjellige blokker i Unicode .
De 26 grunnleggende bokstavene er - i tillegg til sifre , skilletegn og kontrolltegn - i Unicode-blokken Basic Latin , mens de andre blokkene inneholder utvidelser av grunnalfabetet:
- modifiserte bokstavformer som ð , ə eller ŋ
- Ligaturer som æ , œ eller ƕ
- Ytterligere bokstaver som þ eller ɛ lånt fra andre manus, men brukt i latinske ortografier
- diakritiske merker som kan kombineres med grunnbokstaver
- Av hensyn til kompatibilitet med eldre kodesider, et stort antall ferdige kombinasjoner av grunnbokstaver og diakritiske merker som ä , ç , č eller ữ
- også for kompatibilitet individuelle digraphs som ij , nj eller dz
- Visning av de latinske bokstavene for CJK- skriftene (full bredde og halv bredde)
- Ornamentale og kalligrafiske varianter som Ⓐ, ⒜, ⒈, ℋ, ℳ , ℕ
- Symboler basert på det latinske alfabetet som $ , ℃ , ℅ , ™
Kodede tegn
Bokstaver
Opp til kodepunktet U + 00FF følger Unicode den latinske-1 tegnkodingen, og dermed også ASCII . Dermed er de grunnleggende bokstavene i det latinske alfabetet sammen med andre tegn i Unicode-blokken Basic Latin , følgende blokk Latin-1, supplement inneholder, blant andre tegn, bokstaver med diakritiske skrifter og noen spesialbokstaver, spesielt den tyske ß . Neste latinske blokk , utvidet-A, inneholder de andre latinske bokstavene fra ISO / IEC-8859- koding 2, 3, 4 og 9, samt bokstaver kodet i ISO 6937 . Denne blokken inneholder også de lange s . Den Unicode blokk Latin, utvidet-B inneholder hovedsakelig fonetiske og ikke-europeiske utvidelser av det latinske alfabetet, inkludert de fleste av karakterene i den afrikanske alfabet som fortsatt mangler . Siden Unicode 3.0, den rumenske bokstavene S og T har også blitt kodet i denne blokken. Den latinske blokken , ytterligere tillegg, inneholder ytterligere latinske bokstaver, inkludert de i det vietnamesiske alfabetet og hovedstaden ß . Den Unicode blokken latin, utvidet-C dekker Uigurisk alfabet og en forlengelse av det latinske alfabet ved Claudius . Ytterligere historiske bokstaver finnes i Unicode-blokkene Latin, utvidet-D og Latin, utvidet-E .
Den Unicode blokk Alfabetisk presentasjonsformer koder noen ligaturer av latinske bokstaver for kompatibilitet med andre standarder .
For å vise bokstaver med diakritiske merker som ikke er kodet i Unicode, kan de skrives som en kombinasjon av en grunnbokstav med en kombinerende karakter . Disse finnes i blokkene Kombinerer diakritikk , kombinerer diakritikk, komplement , kombinerer halvdiakritikk og kombinerer diakritikk, utvidet .
Fonetisk stavemåte
Fonetiske transkripsjoner som det internasjonale fonetiske alfabetet og det urale fonetiske alfabetet bruker latinske og greske bokstaver, samt noen av sine egne utvidelser. I Unicode brukes disse utvidelsene for det meste også som latinske bokstaver. Disse tegnene finnes i blokkene IPA-utvidelser , avstandsmodifikasjonsbokstaver , fonetiske utvidelser , fonetiske utvidelser, tillegg og overskrift og abonnement .
Tegn i full bredde
Den Unicode blokk med halv bredde og full bredde skjemaer inneholder latinske grunnleggende bokstavene i et bredt form der de brukes sammen med østasiatiske skript i Unicode .
Symboler
Unicode koder også for et antall symboler avledet fra latinske bokstaver. Disse er i blokkene Bokstavlignende symboler , lukkede alfanumeriske tegn og matematiske alfanumeriske symboler . Spesielt sistnevnte er ment for bruk med de andre matematiske tegnene i Unicode . Tegnene for romerske tall i Unicode-blokken Tall regnes også som latinske tegn.
hovne opp
- Julie D. Allen et al.: Unicode Standard. Versjon 6.2 - Kjernespesifikasjon. Unicode Consortium, Mountain View, CA, 2012. ISBN 978-1-936213-07-8 . Kapittel 7.1: Latin. ( online , PDF)
weblenker
- Koordineringskontor for IT-standarder (KoSIT) Bremen: latinske tegn i Unicode (datatype "String.Latin" i XML-skjema ; PDF; 812 kB)
- Prosjektgruppe for den tyske innenriksministerkonferansen: Konvertering til latinske tegn i Unicode - Spesifikasjoner for identifikasjonsprosedyrer (PDF; 2,6 MB), 17. januar 2012