Windows-1252

Zeichenkodierung From Wikipedia, the free encyclopedia

Windows-1252 (auch Codepage 1252, cp1252,[1] Westeuropäisch (Western European) oder ANSI) ist eine 8-Bit-Zeichenkodierung, die für das Betriebssystem Microsoft Windows entwickelt wurde. Der Zeichensatz basiert auf ISO 8859-1 (Latin-1), weicht aber im Bereich 8016  9F16 von dieser ab; statt der (sehr selten genutzten) C1-Steuerzeichen enthalten diese 32 Positionen hier 27 darstellbare Zeichen, u. a. die in ISO 8859-15 hinzugekommenen und einige für bessere Typografie notwendige Zeichen.[2]

Windows-Codepages
0874 Thai
0932 Japanisch
0936 Vereinfachtes Chinesisch
0949 Koreanisch
0950 Traditionelles Chinesisch
1200 Unicode UTF-16, little endian
1201 Unicode UTF-16, big endian
1250 Mitteleuropäisch
1251 Kyrillisch
1252 Westeuropäisch
1253 Griechisch
1254 Türkisch
1255 Hebräisch
1256 Arabisch
1257 Baltisch
1258 Vietnamesisch
12000 Unicode UTF-32, little endian
12001 Unicode UTF-32, big endian
65000 Unicode UTF-7
65001 Unicode UTF-8

Aktuelle Windows-Versionen unterstützen Unicode, neue Windows-Anwendungen sollten Unicode verwenden und keine 8-Bit-Zeichenkodierungen wie Windows-1252.[3]

Manche Applikationen vermischen die Definitionen von ISO 8859-1 und Windows-1252. Da auch in HTML die zusätzlichen Steuerzeichen aus ISO 8859-1 keine Bedeutung haben, schreibt der HTML5-Standard vor, dass als ISO 8859-1 markierte Texte als Windows-1252 zu interpretieren sind.[4][5] Trotzdem ist Windows-1252 ebenfalls bei der IANA registriert.[1] Im Juli 2022 verwendeten 1,2 % aller Websites die Zeichenkodierung implizit als ISO 8859-1, bei 0,3 % der Websites wurde explizit Windows-1252 verwendet,[6][7] bei jeweils fallender Tendenz. Latin-1 war damit nach UTF-8 (97,7 %) mit diesem Stand die zweithäufigste Kodierung von Websites, Windows-1252 nach Windows-1251 die vierthäufigste. Die Unterschiede zwischen all diesen Kodierungen sowie generell mangelnde Konsequenz bei der Unterstützung verschiedener Zeichensätze sind ein häufiges Interoperabilitätsproblem.

Weitere Informationen Code, …0 ...
Code …0…1…2…3…4…5…6…7…8…9…A…B…C…D…E…F
0… NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1… DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2… SP ! " # $ % & ' ( ) * + , - . /
3… 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4… @ A B C D E F G H I J K L M N O
5… P Q R S T U V W X Y Z [ \ ] ^ _
6… ` a b c d e f g h i j k l m n o
7… p q r s t u v w x y z { | } ~ DEL
8… ƒ ˆ Š Œ Ž
9… ˜ š œ žŸ
A… NBSP¡¢£¤¥¦§¨©ª«¬SHY®¯
B… °±²³´µ·¸¹º»¼½¾¿
C… ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏ
D… ÐÑÒÓÔÕÖרÙÚÛÜÝÞß
E… àáâãäåæçèéêëìíîï
F… ðñòóôõö÷øùúûüýþÿ
Schließen

Die farbigen Codepoints stellen Änderungen gegenüber ISO 8859-1 dar: Gelbe Felder sind belegt, grüne sind ungenutzt.

Da Unicode auf ISO 8859-1 und nicht auf Windows-1252 aufbaut, sind zwar die Unicode-Codepoints der nicht farbig unterlegten Zeichen zu den Codewerten in Windows-1252 identisch, die der farbig hinterlegten jedoch nicht:

Weitere Informationen …0, …1 ...
Unicode-Mapping der zu ISO 8859-1 verschiedenen Zeichen
…0…1…2…3…4…5…6…7…8…9…A…B…C…D…E…F
8…
U+20AC

U+201A
ƒ
U+0192

U+201E

U+2026

U+2020

U+2021
ˆ
U+02C6

U+2030
Š
U+0160

U+2039
Œ
U+0152
Ž
U+017D
 
9…  
U+2018

U+2019

U+201C

U+201D

U+2022

U+2013

U+2014
˜
U+02DC

U+2122
š
U+0161

U+203A
œ
U+0153
ž
U+017E
Ÿ
U+0178
Schließen

Unterschiede zwischen ISO 8859-1, ISO 8859-15, Windows-1252 und Unicode

Windows-1252 enthält neben den Zeichen aus ISO 8859-1 auch diejenigen Zeichen, welche in ISO 8859-15 hinzugefügt wurden und dort einige weniger oft gebrauchten Zeichen aus ISO 8859-1 ersetzen. Allerdings unterscheidet sich bei diesen Zeichen die Position sowohl zwischen Windows-1252 und ISO 8859-15 als auch zu der Codierung in Unicode. Alle Zeichen, die nicht in einer der beiden ISO-Codierungen auftauchen, belegen dabei die folgenden Positionen.

Weitere Informationen Zeichen, ISO 8859-1 ...
Unterschiede zwischen ISO 8859-1, ISO 8859-15, Windows-1252 und Unicode (Teil 1)
Zeichen ŠšŽžŒœŸ ¤¦¨´¸¼½¾
ISO 8859-1 A4A6A8B4B8BCBDBE
ISO 8859-15 A4A6A8B4B8BCBDBE
Windows-1252 808A9A8E9E8C9C9F A4A6A8B4B8BCBDBE
Unicode 20AC01600161017D017E015201530178 00A400A600A800B400B800BC00BD00BE
Schließen
Weitere Informationen Zeichen, ISO 8859-1 ...
Unterschiede zwischen ISO 8859-1, ISO 8859-15, Windows-1252 und Unicode (Teil 2)
Zeichen ƒˆ˜
ISO 8859-1
ISO 8859-15
Windows-1252 82838485868788898B9192939495969798999B
Unicode 201A0192201E20262020202102C62030203920182019201C201D20222013201402DC2122203A
Schließen

Siehe auch

Einzelnachweise

Related Articles

Wikiwand AI