ISO 8859

ISO 8859
-1 Latin-1 , vesteuropeisk
-2 Latin-2 , sentraleuropeisk
-3 Latin-3 , Sør-europeisk
-4 Latin-4 , Nord-europeisk
-5 Kyrillisk
-6 Arabisk
-7 gresk
-8 Hebraisk
-9 Latin-5 , tyrkisk
-10 Latin-6 , nordisk
-11 Thai
-12 (eksisterer ikke)
-1. 3 Latin-7 , baltisk
-14 Latin-8 , keltisk
-15 Latin-9 , vesteuropeisk
-16 Latin-10 , sørøst-europeisk

ISO 8859- serien av standarder  , nærmere bestemt ISO / IEC 8859 , fra International Organization for Standardization definerer forskjellige 8-bits tegnsett for informasjonsteknologi i 15 adopterte og en avvist understandard , inkludert:

  • ISO 8859-1 var den nest vanligste kodingen av nettsteder med 1,7% i desember 2020 , etter UTF-8 med 95,9%.
  • ISO 8859-9 brukes av 0,1% av alle nettsteder.
  • de andre understandardene spiller ingen rolle i praksis.

Generell struktur for tegnsettene

  • De første 128 posisjonene er identiske i alle understandarder og tilsvarer tegnene i det 7-bits settet US-ASCII .
    • 00 hex til 1F hex og 7F hex representerer kontrolltegn . Betydningen av tegnene er ikke definert i denne standarden.
    • 20 hex til 7E hex inneholder utskrivbare tegn ( bokstaver , tall , skilletegn ...)
  • Tegnene 7F hex til 9F hex er ikke definert i standarden ( "Deres bruk er utenfor rammen av ISO / IEC 8859; det er spesifisert i andre internasjonale standarder, for eksempel ISO / IEC 6429. " )
  • De siste 96 posisjonene (A0 hex til FF hex ) inneholder regionale spesialtegn og utgjør forskjellen mellom understandardene. De presenteres i tabellform nedenfor. Spesielt karakteroppgaven fra ISO 8859-1 gjenspeiler strukturen til ASCII.
    • A0 hex til BF hex inneholder hovedsakelig skilletegn og spesialtegn.
    • C0 hex til DF hex inneholder hovedsakelig store bokstaver.
    • E0 hex til FF hex inneholder hovedsakelig små bokstaver.

Merknader

  • Det ofte brukte Latin-1-tegnsettet er identisk med de første 256 tegnene i Unicode- tegnsettet.
  • Det nyere Latin-9 tegnsettet ( ISO 8859-15 ) skiller seg bare i åtte posisjoner fra Latin-1 tegnsettet; blant annet er det generelle valutasymbolet ¤ erstattet av eurosymbolet €.
  • Ingen “ISO 8859-12” tegnsett ble spesifisert i familien av standarder. Begrepet ble midlertidig brukt for to forskjellige forslag, men ingen ble vedtatt som standard.
  • ISO / IEC utvikler ikke lenger aktivt ISO 8859-standardene. Tegnsettene er erstattet av ISO UCS , som har samme innhold som Unicode- standarden. Dette brukes hovedsakelig i form av UTF-8-koding.

Bokstaver for det tyske språket

De tyske umlautene Ä = C4 hex , ä = E4 hex , Ö = D6 hex , ö = F6 hex , Ü = DC hex og ü = FC hex samt den lille Eszett ß = DF hex kan finnes i ti understandarder av den latinske gruppen de samme posisjonene eller med samme kode. En kompatibilitet mellom disse standardene er gitt, i det minste for tyskspråklige tekster.

Bare i undernormene for alfabetene -5 kyrillisk, -6 arabisk, -7 gresk, -8 hebraisk og -11 thai er de tyske spesialtegnene ikke tilgjengelige.

Tabell over regionale spesialtegn

Ved posisjon A0 ligger sekskant alltid mellomrom (Engl. Non breaking space , NBSP) og AD hex vanligvis den betingede bindestrek (Engl. Soft bindestrek , SHY), som bare er synlig på slutten av linjen. Andre tegn symbolisert med bokstaver på hebraisk er toveiskontrolltegnene LRM og RLM i posisjon FD hex eller FE hex . Tomme felt er enten (ennå) ikke fylt ut eller kan ikke vises på systemet som brukes.

Tillegg og endringer i 2003-versjonen av standarden.
Udefinerte tegn er uthevet i grønt.

Tildeling av ISO 8859 understandarder med regionale spesialtegn
Binær Okt Des Hex -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -1. 3 -14 -15 -16
10100000 240 160 A0 NBSP
10100001 241 161 A1 ¡ EN H EN Ё   '   ¡ EN ¡ EN
10100010 242 162 A2 ¢ ˘ ˘ ĸ Ђ   ' ¢ ¢ Ē ¢ ¢ en
10100011 243 163 A3 £ Ł £ Ŗ Ѓ   £ £ £ G £ £ £ Ł
10100100 244 164 A4 ¤ ¤ ¤ ¤ Є ¤ ¤ ¤ JEG ¤ Ċ
10100101 245 165 A5 ¥ Ľ   JEG Ѕ   ¥ ¥ JEG " ċ ¥ "
10100110 246 166 A6 ¦ Ś H Ļ І   ¦ ¦ ¦ Ķ ¦ Š Š
10100111 247 167 A7 § § § § Ї   § § § § § § § §
10101000 250 168 A8 ¨ ¨ ¨ ¨ Ј   ¨ ¨ ¨ Ļ O š š
10101001 251 169 A9 © Š JEG Š Љ   © © © Đ © © © ©
10101010 252 170 AA ª Ş Ş Ē Њ   ͺ × ª Š Ŗ ª Ș
10101011 253 171 FRA « Ť G G Ћ   « « « Ŧ « « «
10101100 254 172 AC ¬ Ź Ĵ Ŧ Ќ , ¬ ¬ ¬ Ž ¬ ¬ Ź
10101101 255 173 AD SJENERT SJENERT
10101110 256 174 AE ® Ž   Ž Ў     ® ® Ū ® ® ® ź
10101111 257 175 AF ¯ Ż Ż ¯ Џ   - ¯ ¯ Ŋ Æ Ÿ ¯ Ż
Binær Okt Des Hex -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -1. 3 -14 -15 -16
10110000 260 176 B0 ° ° ° ° А   ° ° ° ° ° ° °
10110001 261 177 B1 ± en H en Б   ± ± ± en ± ± ±
10110010 262 178 B2 ² ˛ ² ˛ В   ² ² ² ē ² G ² Č
10110011 263 179 B3 ³ ł ³ ŗ Г   ³ ³ ³ G ³ G ³ ł
10110100 264 180 B4 ´ ´ ´ ´ Д   ΄ ´ ´ Jeg " Ž Ž
10110101 265 181 B5 µ ľ µ Jeg Е   ΅ µ µ Jeg µ µ
10110110 266 182 B6 ś H ļ Ж   Ά ķ
10110111 267 183 B7 · ˇ · ˇ З   · · · · · · ·
10111000 270 184 B8 ¸ ¸ ¸ ¸ И   Έ ¸ ¸ ļ O ž ž
10111001 271 185 B9 ¹ š Jeg š Й   Ή ¹ ¹ đ ¹ ¹ č
10111010 272 186 BA º ş ş ē К   Ί ÷ º š ŗ º ș
10111011 273 187 BB » ť G G Л ; » » » ŧ » » »
10111100 274 188 F.Kr. ¼ ź ĵ ŧ М   Ό ¼ ¼ ž ¼ Œ Œ
10111101 275 189 BD ½ ˝ ½ Ŋ Н   ½ ½ ½ - ½ œ œ
10111110 276 190 VÆRE ¾ ž   ž О   Ύ ¾ ¾ ū ¾ Ÿ Ÿ
10111111 277 191 BF ¿ ż ż ŋ П ? Ώ   ¿ ŋ æ ¿ ż
Binær Okt Des Hex -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -1. 3 -14 -15 -16
11000000 300 192 C0 EN Ŕ EN EN Р   ΐ   EN EN EN EN EN EN
11000001 301 193 C1 EN EN EN EN С ء Α   EN EN JEG EN EN EN
11000010 302 194 C2 EN EN EN EN Т آ Β   EN EN EN EN EN EN
11000011 303 195 C3 EN EN   EN У أ Γ   EN EN Ć EN EN EN
11000100 304 196 C4 EN EN EN EN Ф ؤ Δ   EN EN EN EN EN EN
11000101 305 197 C5 EN Ĺ Ċ EN Х إ Ε   EN EN EN EN EN Ć
11000110 306 198 C6 Æ Ć Ĉ Æ Ц ئ Ζ   Æ Æ Ę Æ Æ Æ
11000111 307 199 C7 Ç Ç Ç JEG Ч ا Η   Ç JEG Ē Ç Ç Ç
11001000 310 200 C8 È Č È Č Ш ب Θ   È Č Č È È È
11001001 311 201 C9 É É É É Щ ة Ι   É É É É É É
11001010 312 202 CA Ê Ę Ê Ę Ъ ت Κ   Ê Ę Ź Ê Ê Ê
11001011 313 203 CB Ë Ë Ë Ë Ы ث Λ   Ë Ë Ė Ë Ë Ë
11001100 314 204 CC JEG Ě JEG Ė Ь ج Μ   JEG Ė G JEG JEG JEG
11001101 315 205 CD JEG JEG JEG JEG Э ح Ν   JEG JEG Ķ JEG JEG JEG
11001110 316 206 CE JEG JEG JEG JEG Ю خ Ξ   JEG JEG JEG JEG JEG JEG
11001111 317 207 CF JEG Ď JEG JEG Я د Ο   JEG JEG Ļ JEG JEG JEG
Binær Okt Des Hex -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -1. 3 -14 -15 -16
11010000 320 208 D0 Ð Đ   Đ а ذ Π   G Ð Š Ŵ Ð Đ
11010001 321 209 D1 Ñ Ń Ñ Ņ б ر Ρ   Ñ Ņ Ń Ñ Ñ Ń
11010010 322 210 D2 O Ň O O в ز     O O Ņ O O O
11010011 323 211 D3 O O O Ķ г س Σ   O O O O O O
11010100 324 212 D4 O O O O д ش Τ   O O O O O O
11010101 325 213 D5 O O G O е ص Υ   O O O O O O
11010110 326 214 D6 Ö Ö Ö Ö ж ض Φ   Ö Ö Ö Ö Ö Ö
11010111 327 215 D7 × × × × з ط Χ   × Ũ × × Ś
11011000 330 216 D8 O Ř G O и ظ Ψ   O O Ų O O Ű
11011001 331 217 D9 Ù Ů Ù Ų jeg ع Ω   Ù Ų Ł Ù Ù Ù
11011010 332 218 DER Ú Ú Ú Ú к غ Ϊ   Ú Ú Ś Ú Ú Ú
11011011 333 219 DB Û Ű Û Û л   Ϋ   Û Û   Ū Û Û Û
11011100 334 220 DC Ü Ü Ü Ü м   ά   Ü Ü   Ü Ü Ü Ü
11011101 335 221 DD Ý Ý Ŭ Ũ н   έ   JEG Ý   Ż Ý Ý Ę
11011110 336 222 DE Þ Ţ Ŝ Ū о   ή   Ş Þ   Ž Ŷ Þ Ț
11011111 337 223 DF ß ß ß ß п   ί ß ß ฿ ß ß ß ß
Binær Okt Des Hex -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -1. 3 -14 -15 -16
11100000 340 224 E0 en ŕ en - р ـ ΰ א en - en en en en
11100001 341 225 E1 en en en en с ف α ב en en Jeg en en en
11100010 342 226 E2 en en en en т ق β ג en en - en en en
11100011 343 227 E3 en en   en у ك γ ד en en ć en en en
11100100 344 228 E4 EN EN EN EN ф ل δ ה EN EN EN EN EN EN
11100101 345 229 E5 en ĺ ċ en х م ε ו en en en en en ć
11100110 346 230 E6 æ ć ĉ æ ц ن ζ ז æ æ ę æ æ æ
11100111 347 231 E7 ç ç ç Jeg ч ه η ח ç Jeg ē ç ç ç
11101000 350 232 E8 è č è č ш و θ ט è č č è è è
11101001 351 233 E9 é é é é щ ى ι י é é é é é é
11101010 352 234 EA ê ę ê ę ъ ي κ ך ê ę ź ê ê ê
11101011 353 235 EB ë ë ë ë ы ً λ כ ë ë ė ë ë ë
11101100 354 236 EC Jeg ě Jeg ė ь ٌ μ ל Jeg ė G Jeg Jeg Jeg
11101101 355 237 ED Jeg Jeg Jeg Jeg э ٍ ν ם Jeg Jeg ķ Jeg Jeg Jeg
11101110 356 238 EE Jeg Jeg Jeg Jeg ю َ ξ מ Jeg Jeg Jeg Jeg Jeg Jeg
11101111 357 239 EF Jeg ď Jeg Jeg я ُ ο ן Jeg Jeg ļ Jeg Jeg Jeg
Binær Okt Des Hex -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -1. 3 -14 -15 -16
11110000 360 240 F0 ð đ   đ ِ π נ G ð š ŵ ð đ
11110001 361 241 F1 ñ ń ñ ņ ё ّ ρ ס ñ ņ ń ñ ñ ń
11110010 362 242 F2 O ň O O ђ ْ ς ע O O ņ O O O
11110011 363 243 F3 O O O ķ ѓ   σ ף O O O O O O
11110100 364 244 F4 O O O O є   τ פ O O O O O O
11110101 365 245 F5 O O G O ѕ   υ ץ O O O O O O
11110110 366 246 F6 ö ö ö ö і   φ צ ö ö ö ö ö ö
11110111 367 247 F7 ÷ ÷ ÷ ÷ ї   χ ק ÷ ũ ÷ ÷ ś
11111000 370 248 F8 O ř G O ј   ψ ר O O ų O O ű
11111001 371 249 F9 ù ů ù ų љ   ω ש ù ų ł ù ù ù
11111010 372 250 FA ú ú ú ú њ   ϊ ת ú ú ś ú ú ú
11111011 373 251 FB û ű û û ћ   ϋ   û û ū û û û
11111100 374 252 FC ü ü ü ü ќ   ό   ü ü   ü ü ü ü
11111101 375 253 FD ý ý ŭ ũ §   ύ LRM Jeg ý   ż ý ý ę
11111110 376 254 FE þ ţ ŝ ū ў   ώ RLM ş þ   ž ŷ þ ț
11111111 377 255 FF ÿ ˙ ˙ ˙ џ       ÿ ĸ   ' ÿ ÿ ÿ
Binær Okt Des Hex -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -1. 3 -14 -15 -16

Se også

Individuelle bevis

  1. https://w3techs.com/technologies/history_overview/character_encoding ISO 8859-2, og 8859-15 er også nevnt, med (litt?) Mindre enn 0,17%.
  2. ISO / IEC 8859-1: 1998, s.5

weblenker