Latinsk tegn i Unicode

Latinske bokstaver , dvs. tegn som er basert på det latinske alfabetet , finnes i forskjellige blokker i Unicode .

De 26 grunnleggende bokstavene er - i tillegg til sifre , skilletegn og kontrolltegn - i Unicode-blokken Basic Latin , mens de andre blokkene inneholder utvidelser av grunnalfabetet:

Kodede tegn

Bokstaver

Opp til kodepunktet U + 00FF følger Unicode den latinske-1 tegnkodingen, og dermed også ASCII . Dermed er de grunnleggende bokstavene i det latinske alfabetet sammen med andre tegn i Unicode-blokken Basic Latin , følgende blokk Latin-1, supplement inneholder, blant andre tegn, bokstaver med diakritiske skrifter og noen spesialbokstaver, spesielt den tyske ß . Neste latinske blokk , utvidet-A, inneholder de andre latinske bokstavene fra ISO / IEC-8859- koding 2, 3, 4 og 9, samt bokstaver kodet i ISO 6937 . Denne blokken inneholder også de lange s . Den Unicode blokk Latin, utvidet-B inneholder hovedsakelig fonetiske og ikke-europeiske utvidelser av det latinske alfabetet, inkludert de fleste av karakterene i den afrikanske alfabet som fortsatt mangler . Siden Unicode 3.0, den rumenske bokstavene S og T har også blitt kodet i denne blokken. Den latinske blokken , ytterligere tillegg, inneholder ytterligere latinske bokstaver, inkludert de i det vietnamesiske alfabetet og hovedstaden ß . Den Unicode blokken latin, utvidet-C dekker Uigurisk alfabet og en forlengelse av det latinske alfabet ved Claudius . Ytterligere historiske bokstaver finnes i Unicode-blokkene Latin, utvidet-D og Latin, utvidet-E .

Den Unicode blokk Alfabetisk presentasjonsformer koder noen ligaturer av latinske bokstaver for kompatibilitet med andre standarder .

For å vise bokstaver med diakritiske merker som ikke er kodet i Unicode, kan de skrives som en kombinasjon av en grunnbokstav med en kombinerende karakter . Disse finnes i blokkene Kombinerer diakritikk , kombinerer diakritikk, komplement , kombinerer halvdiakritikk og kombinerer diakritikk, utvidet .

Fonetisk stavemåte

Fonetiske transkripsjoner som det internasjonale fonetiske alfabetet og det urale fonetiske alfabetet bruker latinske og greske bokstaver, samt noen av sine egne utvidelser. I Unicode brukes disse utvidelsene for det meste også som latinske bokstaver. Disse tegnene finnes i blokkene IPA-utvidelser , avstandsmodifikasjonsbokstaver , fonetiske utvidelser , fonetiske utvidelser, tillegg og overskrift og abonnement .

Tegn i full bredde

Den Unicode blokk med halv bredde og full bredde skjemaer inneholder latinske grunnleggende bokstavene i et bredt form der de brukes sammen med østasiatiske skript i Unicode .

Symboler

Unicode koder også for et antall symboler avledet fra latinske bokstaver. Disse er i blokkene Bokstavlignende symboler , lukkede alfanumeriske tegn og matematiske alfanumeriske symboler . Spesielt sistnevnte er ment for bruk med de andre matematiske tegnene i Unicode . Tegnene for romerske tall i Unicode-blokken Tall regnes også som latinske tegn.

hovne opp

  • Julie D. Allen et al.: Unicode Standard. Versjon 6.2 - Kjernespesifikasjon. Unicode Consortium, Mountain View, CA, 2012. ISBN 978-1-936213-07-8 . Kapittel 7.1: Latin. ( online , PDF)

weblenker