Introducere in Stiinta Calculatoarelor 2013 | Page 48
standardul american (American Standard Code for Information
Interchange);
tabela Unicode – pe 16 biţi, care este o altă extensie a tabelei
ASCII (prima parte fiind identică cu tabela ASCII) şi care are un
număr mare de coduri disponibile, pentru reprezentarea nu numai
a caracterelor latine cu diverse diacritice, dar şi a caracterelor
diferite de cel latin (chirilic, arab etc.).
Tabela Unicode s-a impus mai ales prin utilizarea Internet-ului, unde
informaţia se personalizează în foarte mare măsură pentru ca oameni
din diferite colţuri ale lumii şi din diferite culturi să poată interacţiona
eficient cu aplicaţiile la distanţă, adică să comunice fiecare în limba şi
scrierea proprie.
Reprezentarea caracterelor
Pentru a se deosebi de identificatori (care pot fi litere singulare), la
manipularea caracterelor acestea se indică prin încadrarea simbolului
de scriere între apostrof-uri, adică se indică literali de tip caracter.
Exemplu ‘A’, ‘a’, ‘0’, ‘:’. Aceste simboluri nu au nici o semnificaţie în
sistemul de programe, ci ele au rol numai de a fi desenate pe
dispozitivele de ieşire (ecran, imprimantă) pentru a fi citite de om.
În oricare din tabelele de cod menționate, caracterelor li se asociază un
număr întreg (fără semn), astfel ca ordinea numerică a codurilor să fie
similară cu ordinea lexicografică a caracterelor în alfabetul ales. Astfel,
se dau mai jos exemple de coduri ataşate (identic) unor caractere în
tabela ASCII, IBM extins sau Unicode: ‘A’= 65(10), ‘B’= 66(10), ‘C’=
67(10), ‘a’= 97(10), ‘\n’= 10(10) – cod ataşat acţiunii de salt la nou rând,
‘\a’= 7(10) – cod ataşat sunetului „bell” produs pentru a atrage atenţia
sonor. După cum se observă, unele „caractere” sunt de fapt acţiuni
executate de la tastatură (de exemplul salt la o nouă linie), dar au fost
cazuri când caracterele au avut rol în comunicaţia de date – de exemplu
indicarea începutului şi sfârşitului de mesaj STX = 2(10), ETX = 3(10) sau
încheierii transmisiei EOT = 4(10).
Ordonarea lexicografică a caracterelor se poate face pe baza numerelor
asociate drept cod acestora; astfel, literele majuscule sunt înaintea
48