ASCII
De la Wikipedia, enciclopedia liberă
ASCII (cu pronunţia aproximativă 'e-schi) este acronimul pentru American Standard Code for Information Interchange, ceea ce înseamnă "Codul Standard American pentru Schimbul de Informaţii". ASCII reprezintă un sistem de codificare a caracterelor bazat pe alfabetul englez. Codurile ASCII reprezintă caractere text pentru calculatoare, echipamente de comunicaţie şi echipamente care lucrează cu text. Marea parte a codificărilor moderne, care asigură reprezentarea a şi mai multor caractere, se bazează pe ASCII.
Munca de proiectare la ASCII a început în 1960. Prima ediţie a standardului a fost publicată în 1963,[1] o revizie majoră în 1967, iar cea mai recentă actualizare a avut loc în 1986. Astăzi, ASCII defineşte 128 de caractere: 33 sunt neimprimabile (majoritatea acestora sunt caractere de control învechite, care indică cum trebuie procesat textul propriu-zis), iar restul de 95 sunt imprimabile.
Setul de caractere ASCII conţine 128 de caractere: litere mari şi mici, numere, elemente de punctuaţie şi coduri de control, cum ar fi grafemul ce marchează sfârşitul unei linii de text. Fiecare literă este reprezentată de un număr. De exemplu, litera A este reprezentată prin numărul 65, în timp ce pentru litera z este alocat numărul 122.
Există mai multe extensii ale standardului ASCII, descrise de standardele ISO 8859-x, unde x reprezintă un număr:
- ISO 8859-1 se numeşte Latin1 şi cuprinde caracterele pentru limbile indo-europene apusene. ISO 8859-1 trebuie folosit cu grijă pentru că utilizatorii formatului CP1252 (WinLatin1) au deseori impresia că folosesc formatul ISO 8859-1.
- ISO 8859-2 se numeşte Latin2 şi cuprinde limbile indo-europene răsăritene.
- ISO 8859-3 se numeşte Latin3 şi cuprinde limbile esperanto si malteză (şi, în trecut, şi limba turcă).
- ISO 8859-4 se numeşte Latin4 şi cuprinde limbile baltice si laponă.
- ISO 8859-5 se numeşte Cyrillic şi cuprinde limbile burgară, belorusă, macedoniană, rusă, sârbă (şi în trecut şi limba ucrainiană).
- ISO 8859-6 se numeşte Arabic şi cuprinde limba arabă (fără caracterele suplimentare pentru farsi şi urdu).
- ISO 8859-7 se numeşte Greek şi cuprinde limba greacă modernă.
- ISO 8859-8 se numeşte Hebrew şi cuprinde limba ebraică.
- ISO 8859-9 se numeşte Latin5 şi înlocuieşte literele folosite numai în Islanda cu cele mai folosite în limba turcă.
- ISO 8859-10 se numeşte Latin6 şi reorganizează formatul Latin4 ca să fie mai util şi să acopere întreaga regiunea nordică.
- ISO 8859-11 se numeşte Thai şi cuprinde limba thailandeză.
- ISO 8859-12 nu se foloseşte.
- ISO 8859-13 se numeşte Baltic Rim şi reorganizează şi îmbunătăţeşte formatele ISO 8859-4 si 8859-10.
- ISO 8859-14 se numeşte Latin8 sau Celtic şi cuprinde limbile galeză, gaelică şi bretonă.
- ISO 8859-15 se numeşte Latin9, uneori dar neofical Latin0, şi reorganizează formatul Latin1, adăugând simbolul pentru euro.
- ISO 8859-16 se numeşte South-Eastern European şi cuprinde limbile albaneză, croată, maghiară, poloneză, română, şi slovenă, dar şi franceza, italiana şi gaelica (ortografie nouă).
Pentru a vedea tabela ASCII completă mergeţi la asciitable.
O descriere mai completă a tuturor variaţiilor standardului 8859 poate fi găsită la [1]
[modifică] Legături externe

