Site-Suche

ASCII (amerikanischer Standardcode für den Informationsaustausch) - grundlegende Textkodierung für das lateinische Alphabet

Laut der Internationalen Fernmeldeunion, in2016 genossen das Internet mit einer gewissen Regelmäßigkeit dreieinhalb Milliarden Menschen. Die meisten von ihnen denken nicht einmal, dass Nachrichten, die von ihnen über PCs oder mobile Geräte gesendet werden, sowie Texte, die auf allen Arten von Monitoren angezeigt werden, tatsächlich Kombinationen von 0 und 1 sind. Eine solche Darstellung von Informationen wird Kodierung genannt. Es bietet und erleichtert die Implementierung seiner Speicherung, Verarbeitung und Übertragung. 1963 wurde die amerikanische Kodierung von ASCII entwickelt, die Gegenstand dieses Artikels ist.

ASCII-Codierung

Präsentation von Informationen im Computer

Aus der Sicht eines jeden elektronischen ComputersDer Maschinentext besteht aus einzelnen Zeichen. Sie umfassen nicht nur Buchstaben, einschließlich Großbuchstaben, sondern auch Satzzeichen und Zahlen. Zusätzlich werden spezielle Symbole "=", "&", "(" und "Leerzeichen" verwendet.

Die Menge der Zeichen, aus denen der Text besteht,heißt das Alphabet, und ihre Zahl ist die Kraft (als N bezeichnet). Verwenden Sie dazu den Ausdruck N = 2 ^ b, wobei b die Anzahl der Bits oder das Informationsgewicht eines bestimmten Symbols ist.

Es ist bewiesen, dass Sie mit einem Alphabet mit einer Kapazität von 256 Zeichen alle notwendigen Symbole darstellen können.

Da 256 die achte Potenz von Zwei ist, beträgt das Gewicht jedes Symbols 8 Bits.

Eine Einheit von 8 Bits wird 1 Byte genannt, daher ist es üblich zu sagen, dass der Binärcode eines beliebigen Zeichens in dem auf dem Computer gespeicherten Text ein Byte des Speichers belegt.

ASCII-Codierungstabelle

Wie wird die Codierung durchgeführt?

Alle Texte werden in den Speicher eines persönlichen eingegebenComputer mittels Tasten der Tastatur, auf denen Zahlen, Buchstaben, Satzzeichen und andere Symbole geschrieben sind. Im RAM werden sie im Binärcode übertragen, dh jedes Zeichen ist an den üblichen menschlichen Dezimalcode von 0 bis 255 angepaßt, was einem Binärcode entspricht - von 00000000 bis 11111111.

Byte-Byte-Zeichencodierung ermöglichtDer Prozessor, der die Verarbeitung des Textes ausführt, greift auf jedes Symbol separat zu. Zur gleichen Zeit reichen 256 Zeichen aus, um irgendwelche Zeicheninformationen darzustellen.

ASCII-Textkodierung

Zeichencodierung ASCII

Diese Abkürzung steht in Englisch für amerikanischen Standardcode für den Informationsaustausch.

Zu Beginn der Computerisierung wurde das offensichtlichSie können eine Vielzahl von Möglichkeiten zum Codieren von Informationen finden. Um jedoch Informationen von einem Computer auf einen anderen zu übertragen, musste ein einziger Standard entwickelt werden. So gab es 1963 in den USA eine ASCII-Codierungstabelle. In ihm wird jedem Symbol des Computeralphabets seine Seriennummer in der Binärdarstellung zugewiesen. Anfangs wurde die ASCII-Codierung nur in den Vereinigten Staaten verwendet und wurde dann zum internationalen Standard für den PC.

Tabelleninhalt

Die ASCII-Codes sind in 2 Teile unterteilt. Der internationale Standard ist nur die erste Hälfte dieser Tabelle. Es enthält Symbole mit Ordnungszahlen von 0 (codiert als 00000000) bis 127 (Code 01111111).

Ordnungsnummer

N

ASCII-Textkodierung

Symbol

0 - 31

0000 0000 - 0001 1111

Symbole mit N von 0 bis 31 heißen Manager. Ihre Funktion besteht darin, den Prozess der Ausgabe von Text an einen Monitor oder ein Druckgerät zu "leiten", ein Audiosignal zu geben usw.

32 - 127

0010 0000 - 0111 1111

Symbole mit N von 32 bis 127 (der StandardteilTabellen) - Groß- und Kleinbuchstaben des lateinischen Alphabets, 10 Ziffern, Satzzeichen, sowie verschiedene Klammern, kommerzielle und andere Symbole. Das Symbol 32 bezeichnet einen Raum.

128 - 255

1000 0000 - 1111 1111

Symbole mit N von 128 bis 255 (AlternativteilTabellen oder Codepage) können verschiedene Varianten haben, von denen jede ihre eigene Nummer hat. Codepage wird verwendet, um die nationalen Alphabete anzugeben, die sich von Latein unterscheiden. Insbesondere ist es mit seiner Hilfe, dass ASCII für russische Zeichen kodiert ist.

In der Codierungstabelle folgen Groß- und Kleinbuchstaben in alphabetischer Reihenfolge und die Nummern sind in aufsteigender Reihenfolge. Dieses Prinzip wird auch für das russische Alphabet beibehalten.

Steuerzeichen

Die ASCII-Codierungstabelle wurde ursprünglich erstelltzum Empfangen und Übertragen von Informationen über ein Gerät, das lange Zeit nicht benutzt wurde, wie ein Fernschreiber. Diesbezüglich wurden die Nicht-Druckvorgänge, die als Befehle zum Steuern dieser Vorrichtung verwendet wurden, in dem Zeichensatz enthalten. Ähnliche Befehle wurden in solchen Vorcomputer-Nachrichtenübermittlungsverfahren wie Morse-Code usw. verwendet.

Das gebräuchlichste "Fernschreiber" -Symbol ist NUL (00, "Null"). Es wird immer noch in den meisten Programmiersprachen verwendet und bezeichnet das Ende der Zeile.

in ASCII-Codierung, jedes Zeichen

Wo wird die ASCII-Codierung verwendet?

Amerikanischer Standardcode wird nicht nur benötigtum Textinformationen über die Tastatur einzugeben. Es wird auch in Grafiken verwendet. Insbesondere im ASCII Art Maker-Programm repräsentieren Bilder verschiedener Erweiterungen eine Reihe von ASCII-Zeichensymbolen.

Ähnliche Produkte gibt es in zwei Arten: Ausführen der Funktion von Grafikeditoren durch Umwandeln von Bildern in Text und Konvertieren von "Zeichnungen" in ASCII-Grafiken. Ein bekannter Smiley ist beispielsweise ein anschauliches Beispiel für ein Kodierungssymbol.

ASCII kann auch beim Erstellen eines HTML-Dokuments verwendet werden. In diesem Fall können Sie bestimmte Zeichen eingeben. Wenn Sie die Seite anzeigen, wird auf dem Bildschirm ein Symbol angezeigt, das diesem Code entspricht.

ASCII wird auch für die Erstellung mehrsprachiger Sites benötigt, da Zeichen, die nicht Teil einer bestimmten nationalen Tabelle sind, durch ASCII-Codes ersetzt werden.

um Textinformationen in ASCII-Codierung zu kodieren

Einige Funktionen

Um Textinformationen in ASCII-Codierung zu kodieren, wurden ursprünglich 7 Bits verwendet (eines war leer), aber heute arbeitet es als ein 8-Bit-Bit.

Die Buchstaben in den Spalten oben und unten unterscheiden sich nur durch ein einziges Bit. Dies reduziert die Komplexität der Verifizierung erheblich.

Verwenden von ASCII in Microsoft Office

Bei Bedarf diese Art der TextkodierungInformationen können in Microsoft-Texteditoren wie Notepad und Office Word verwendet werden. In diesem Fall ist es jedoch unmöglich, einige Funktionen zu verwenden. Zum Beispiel können Sie keine Auswahl in Fettschrift treffen, da die ASCII-Codierung nur die Bedeutung der Information beibehält und deren allgemeine Erscheinung und Form ignoriert.

ASCII-Codierung für russische Zeichen

Standardisierung

ISO hat ISO 8859-Standards übernommen. Diese Gruppe definiert Acht-Bit-Codierungen für verschiedene Sprachgruppen. Insbesondere ist ISO 8859-1 Extended ASCII, eine Tabelle für die Vereinigten Staaten und die Länder Westeuropas. Und ISO 8859-5 ist eine Tabelle für kyrillisch, einschließlich Russisch.

Aus einer Reihe von historischen Gründen wurde der Standard ISO 8859-5 nicht sehr lange verwendet.

Für die russische Sprache wird Kodierung wirklich verwendet:

  • CP866 (Code Seite 866) oder DOS, das wird oft eine alternative Kodierung GOST genannt. Es wurde bis Mitte der 90er Jahre des letzten Jahrhunderts aktiv genutzt. Im Moment fast nicht benutzt.
  • KOI-8. Coding wurde in den 1970er und 1980er Jahren entwickelt, undDies ist der Standard für E-Mail-Nachrichten in RuNet. Es ist weit verbreitet im Betriebssystem der Unix-Familie, einschließlich Linux. Die "russische" Version von KOI-8 heißt KOI-8R. Darüber hinaus gibt es Versionen für andere kyrillische Sprachen, zum Beispiel Ukrainisch.
  • Code Seite 1251 (CP 1251, Windows - 1251). Entwickelt von Microsoft Corporation, um Unterstützung für die russische Sprache in einer Windows-Umgebung bereitzustellen.

Der Hauptvorteil der ersten Norm CP866war die Erhaltung pseudographischer Symbole an den gleichen Stellen wie im Extended ASCII. Dies erlaubt, unveränderte Textprogramme, ausländische Produktion, wie der berühmte Norton Commander zu laufen. Momentan wird CP866 für Programme verwendet, die unter Windows entwickelt wurden und im Vollbildmodus oder in Textfenstern arbeiten, einschließlich FAR Manager.

Computer-Texte, geschrieben in der CP866-Kodierung, waren in letzter Zeit selten, aber sie werden für russische Dateinamen in "Vindous" verwendet.

"Unicode"

Im Moment am weitesten verbreiteterhielt diese besondere Codierung. Unicode-Codes sind in Regionen unterteilt. Die erste (von U + 0000 bis U + 007F) enthält die Zeichen des ASCII-Satzes mit Codes. Folgen Sie dann den Zeichenfeldern verschiedener nationaler Schriften sowie Satzzeichen und technischen Symbolen. Darüber hinaus ist ein Teil der Unicode-Codes reserviert, falls in der Zukunft neue Symbole hinzugefügt werden müssen.

Zeichencodierung ASCII

Jetzt wissen Sie, dass jeder in der ASCII-CodierungDas Symbol wird als eine Kombination von 8 Nullen und Einsen dargestellt. Für Nichtspezialisten mag diese Information unnötig und uninteressant erscheinen, aber wollen Sie nicht wissen, was in den "Gehirnen" Ihres PCs passiert?

</ p>
  • Bewertung: