Introducere in Stiinta Calculatoarelor 2013 | Page 48

standardul american (American Standard Code for Information Interchange);  tabela Unicode – pe 16 biţi, care este o altă extensie a tabelei ASCII (prima parte fiind identică cu tabela ASCII) şi care are un număr mare de coduri disponibile, pentru reprezentarea nu numai a caracterelor latine cu diverse diacritice, dar şi a caracterelor diferite de cel latin (chirilic, arab etc.). Tabela Unicode s-a impus mai ales prin utilizarea Internet-ului, unde informaţia se personalizează în foarte mare măsură pentru ca oameni din diferite colţuri ale lumii şi din diferite culturi să poată interacţiona eficient cu aplicaţiile la distanţă, adică să comunice fiecare în limba şi scrierea proprie. Reprezentarea caracterelor Pentru a se deosebi de identificatori (care pot fi litere singulare), la manipularea caracterelor acestea se indică prin încadrarea simbolului de scriere între apostrof-uri, adică se indică literali de tip caracter. Exemplu ‘A’, ‘a’, ‘0’, ‘:’. Aceste simboluri nu au nici o semnificaţie în sistemul de programe, ci ele au rol numai de a fi desenate pe dispozitivele de ieşire (ecran, imprimantă) pentru a fi citite de om. În oricare din tabelele de cod menționate, caracterelor li se asociază un număr întreg (fără semn), astfel ca ordinea numerică a codurilor să fie similară cu ordinea lexicografică a caracterelor în alfabetul ales. Astfel, se dau mai jos exemple de coduri ataşate (identic) unor caractere în tabela ASCII, IBM extins sau Unicode: ‘A’= 65(10), ‘B’= 66(10), ‘C’= 67(10), ‘a’= 97(10), ‘\n’= 10(10) – cod ataşat acţiunii de salt la nou rând, ‘\a’= 7(10) – cod ataşat sunetului „bell” produs pentru a atrage atenţia sonor. După cum se observă, unele „caractere” sunt de fapt acţiuni executate de la tastatură (de exemplul salt la o nouă linie), dar au fost cazuri când caracterele au avut rol în comunicaţia de date – de exemplu indicarea începutului şi sfârşitului de mesaj STX = 2(10), ETX = 3(10) sau încheierii transmisiei EOT = 4(10). Ordonarea lexicografică a caracterelor se poate face pe baza numerelor asociate drept cod acestora; astfel, literele majuscule sunt înaintea 48