Informatyka dla gimnazjum/Standard ASCII

Jak wiadomo, jeden bajt przechowuje w sobie liczbę z przedziału 0-255 (szesnastkowo: 0h-0FFh), tak więc w zwykłym pliku tekstowym możemy użyć maksymalnie 256 różnych znaków. Aby jednak było oczywiste jaka liczba odpowiada jakiemu znakowi, już na początku istnienia komputerów amerykańscy informatycy stworzyli standard ASCII. Skrót ten pochodzi od angielskiej nazwy "American Standard Code for Information Interchange", co można przetłumaczyć na "standardowy amerykański kod wymiany informacji". Pierwsze 127 znaków tego kodu zawierało:

małe i duże litery alfabetu łacińskiego (A, B, C, D...)
cyfry dziesiętne (0, 1, 2, 3, 4...)
podstawowe znaki interpunkcyjne, takie jak kropka, wykrzyknik, znak zapytania, cudzysłów, apostrof...
podstawowe symbole matematyczne (+, -, =, <, >, nawiasy zwykłe, klamrowe i kwadratowe, znak równości)
znaki specjalne i sterujące (znak odstępu - spacja, znak tabulacji, końca linii)
inne symbole (gwiazdka - *, daszek - ^, at - @, backslash - \, hash - #, pipe - |)

Zatrzymajmy się jeszcze na chwilę przy znaku końca linii. Otóż różne systemy operacyjne różnie go zapisują. Systemy oparte na DOS-ie (MS-DOS, MS Windows) używają do tego dwóch bajtów (odpowiednio o wartościach dziesiętnych 13 i 10), a systemy uniksowe i oparte na architekturze MacOS - jednego, z tą jednak różnicą, że w Uniksie jest to znak numer 10, a w MacOS 13. Ma to dość duże znaczenie przy przenoszeniu plików między tymi platformami, gdyż np. dostępny w Windows notatnik nie rozpoznaje pojedynczego bajtu 10 jako znak końca linii i w miejscu jego wystąpienia pojawia się charakterystyczny prostokąt. Przenosząc pliki tekstowe między tymi platformami należy je uprzednio konwertować, lub otwierać w edytorach obsługujących "obcy" sposób zapisu znaku końca linii.

Wróćmy jednak do tablicy ASCII. Wiemy już co znajduje się w jej pierwszej części. Co więc z drugą? Otóż tam umieszczono np. symbole, za pomocą których w trybie tekstowym można rysować ramki. (Dość popularne w programach systemu MS-DOS). Pozostałe miejsce wypełniono literami niewystępującymi w alfabecie amerykańskim (np. francuskie: Á lub niemieckie: Ä, itp...). Szybko jednak okazało się, że niemożliwe jest, by wszystkie litery występujące w używanych na świecie językach pomieścić na pozostałych polach tablicy ASCII. Zaszła więc potrzeba stosowania różnych standardów ASCII dla tekstów pisanych w różnych językach i tak powstały różne strony kodowe, o których będzie w następnym rozdziale.

« Pliki tekstowe

Spis treści

standard Unicode »