-
Notifications
You must be signed in to change notification settings - Fork 2
Alphanumerische Codes
Ein Code ist eine klare Vorschrift, die jedem Zeichen eines Zeichenvorrats einem anderen Zeichen eines anderen Zeichenvorrats zuordnet. Beispielsweise stellt der Morsecode eine klare Zuordnung zwischen Buchstaben und einer Abfolge kurzer und langer Signale her.
Je nach Verwendungszweck unterscheidet man zwischen verschiedenen Code-Arten wie den Numerischen-, Alphanumerischen- und den Leistungs-Codes.
-
Numerische Codes wie der Binär- oder Barcode, codieren Ziffern. Angewendet werden sie in der IT-Brance oder in Warenhäusern in Form von Artikelnummern.
-
Alphanumerische Codes sind dazu da, um Texte auf Computern speichern zu können. Computer verstehen nur Zahlen im Binärsystem. Zum Speichern von Text müssen also alle Zeichen (Buchstaben, Zahlen und Sonderzeichen) in Codes aus dem Binärsystem umgewandelt werden. Zum Beispiel entspricht der Bustabe D dem Binärcode 01000100. Zu den Alphanumerische Codes gehören der ASCII-Code, ISO-Code, Unicode. Diese werden in den nachfolgenden Abschnitten näher beschrieben.
- Leitungscodes dienen zur Zuordnung von Binären Zahlenfolgen (1000011) zu beispielsweise Strömen, Spannungen oder Lichtintensitäten, die für die Informationsübertragung bei Telekommunikation notwendig sind. Als Übertragungsmedien der Signale eignen sich dem entsprechend Kupferleitungen oder Lichtwellenleiter (Glasfaserkabel).
American Standard Code for Information Interchange kurz Ascii. Die Anfänge fand der ASCII-Code in der Telegrafie und dem Morse-Code. Dieser wurde 1963 von der American Standards Association herrausgebracht. Der ASCII-Code enthält alle Groß- und Kleinbuchstaben, Zahlen, einige Sonderzeichen und Steuerzeichen (Zeichen, die nicht dargestellt werden, z.B. Zeilenumbruch).
Der ASCII-Code enthält insgesamt nur 128 Zeichen. Dies ist auch der Grund, warum europäische Umlaute wie Ä,Ö,Ü... nicht enthalten sind. Jedes Zeichen ist im ASCII-Code 7 Bit groß. Die Rechnung ist 27=128
Schriftzeichen |
Dezimal |
Hexadezimal |
Binär |
---|---|---|---|
A |
65 |
41 |
1000001 |
B |
66 |
42 |
1000010 |
C |
67 |
43 |
1000011 |
Ausschnitt einer Ascii Tabelle
Isocode (ISO = International Organisation for Standartization) baut auf ASCII auf, aber besitzt nicht nur 7 Bits, sondern 8 Bits / 1 Byte. Dadurch gibt es doppelt soviele Kombinationsmöglichkeiten wie beim ASCII-Code 28=256 .
Die ersten 127 Zeichen von ISO 8859 stimmen mit ASCII überein. Die übrigen Zeichen bilden Umlaute aus anderen Sprachen ab. Beispielsweise enthält ISO 8859-1 viele europäische Umlaute, wie z.Bsp. Ä, Ö und Ü aus dem Deutschen Alphabet.
Es gibt für verschieden Sprachen, verschieden IsoCode's. So steht der Iso-Code 8859-1 für Latin-1, Westeuropäisch. Der Code 8859-8 steht für Hebräisch
-1 | Latin-1, Westeuropäisch |
---|---|
-2 | Latin-2, Mitteleuropäisch |
-3 | Latin-3, Südeuropäisch |
-4 | Latin-4, Nordeuropäisch |
-5 | Kyrillisch |
-6 | Arabisch |
-7 | Griechisch |
-8 | Hebräisch |
-9 | Latin-5, Türkisch |
-10 | Latin-6, Nordisch |
-11 | Thai |
|
(existiert nicht) |
-13 | Latin-7, Baltisch |
-14 | Latin-8, Keltisch |
-15 | Latin-9, Westeuropäisch |
-16 | Latin-10, Südosteuropäisch |
Auch Unicode baut auf ASCII auf. Im Moment (Version 13.1) enthält Unicode 143,859 Zeichen. ASCII ist der Ursprung von Unicode. In der aktuellen Version 13.0 enthält Unicode 143,859 Zeichen und ist damit der umfangreichste Alphanumerische Code. Seine Vorteile liegen dadrin, dass dieser Code um Sprachen und Zeichen erweitert werden kann ohne diese in ein andern Code kodieren, wobei Kodierungsfehler entstehen könnten.
Das Ziel von Unicode ist es, alle Zeichen der Welt, aus allen Sprachen in einem Paket zusammenzuführen. Dies funktioniert nur, indem Unicode die inkompatiblen Kodierung zwischen den verschiedenen Ländern beseitigt.
Unter diesem Link, könnte ihr selber die Probleme von verschieden Codes ausprobieren. Umlaute werden anders dargestellt in verschieden Codes.
Zudem kommen auch die Emoji hinzu welche nicht nur in Standart Gelb, sondern in unterschiedlichen Farben verfügbar sind um gezielt gegen Rassismus und Ausgrenzung vorzugehen. So werden auch nach und nach z.Bsp. homosexuelle Paare, Frauen mit Bart oder Frauen mit Kopftüchern hinzugefügt.
Emoji sind geprägt durch die Gesellschaft und lassen sich von Generation zu Generation anders deuten. So sind diese Emoji z. Bsp. 💩,🍌,🍆,😏 in der Generation Y mit einer starken Doppeldeutigkeit belegt, welche die Generation X nicht versteht oder kennt.
Die am häufisten benutzte Variante im Internet ist UTF-8. Texte werden so kodiert, dass sie möglichst wenig Speicher verbrauchen. Daher haben die Zeichen unterschiedliche Längen. Das kürzeste Zeichen ist 8 Bit lang und das längeste 32 Bit.
Unicode-Tabelle in Hexadezimalzahlen
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
A |
B |
C |
D |
E |
F |
|
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0030 |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
: |
; |
< |
= |
> |
? |
0040 |
@ |
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
K |
L |
M |
N |
O |
0050 |
P |
Q |
R |
S |
T |
U |
V |
W |
X |
Y |
Z |
[ |
\ |
] |
^ |
_ |
Text: Jannes | Bild: Joschua | Quiz: Marvin