ASCII, setul de caractere pentru datele de text și schimbul de informații

Informații articol

ASCII, setul de caractere pentru datele de text și schimbul de informații. Codul ASCII este unul dintre cele mai importante standarde de set de caractere.

ASCII, setul de caractere pentru datele de text și schimbul de informații

Termenul ASCII înseamnă „American Standard Code for Information Interchange”.

Descrie un set de caractere standard pentru datele de text și schimbul de informații.

Codările de caractere definesc modul în care literele și alte caractere text trebuie codificate în biți și octeți.

Codul ASCII este unul dintre cele mai importante standarde de set de caractere.

Se alătură cu Unicode, ISO-8859-1 și Windows 1252.

Codul a fost standardul dominant pentru paginile web pentru o lungă perioadă de timp.

Asta, până când a fost depășit de codificarea Unicode UTF-8 în 2007. Cu toate acestea, este încă relevant chiar și astăzi.

Există zone în care sunt permise doar caractere conținute în codul ASCII.

Istoric

Codul ASCII are o istorie lungă. Această istorie a început cu telegrafia și codul Morse, precum și codul Murray pe 5 biți.

Acesta a fost dezvoltat de inventatorul neozeelandez Donald Murray, între 1901 și 1932.

Prima versiune a codului ASCII a fost lansată în 1963, de ASA (American Standards Association).

A fost un precursor al American National Standards Institute (ANSI). În 1968 a fost publicată versiunea setului de caractere ce e valabilă și astăzi.

Setul de caractere ASCII pe 7 biți

Datorită istoricului său, codul original ASCII folosește doar șapte biți dintr-un octet comun de 8 biți. Poate codifica maximum 128 de caractere diferite.

Codul conține litere mari și mici ale alfabetului englez și cele mai importante semne de punctuație.

Nu sunt uitate nici simbolurile matematice. Sunt 33 de coduri de control pentru transferul de date și formatarea textului.

Sunt incluse următoarele grupuri de caractere:

0-32 și 127: coduri de control pentru transferul de date, precum și spații, file și pauze de linie;
48-57: cifre;
65-90: majuscule;
97-122: minuscule;
33-7, 58-64, 91-96 și 123-126: semne de punctuație, simboluri matematice, paranteze și alte caractere.

Caractere specifice fiecărei țări, cum ar fi și accentele, nu sunt incluse în codul ASCII.

Deși amenajarea poate părea haotică și arbitrară, rezultă dintr-o planificare și examinare minuțioasă.

Literele sunt poziționate astfel încât versiunile cu majuscule și minuscule ale unei litere diferă doar cu un bit.

Numerele, spațiile și alte simboluri sunt plasate în mod deliberat în fața literelor pentru a simplifica sortarea.

În plus, multe simboluri non-alfanumerice sunt amplasate pe poziții similare aranjamentelor de scris.

Seturi de caractere extinse: ISO-8859

Codul ASCII propriu-zis conține doar alfabetul englez. Pe de altă parte, au fost dezvoltate multe extensii specifice.

În acest context, seturile de caractere Windows-1252 și ISO-8859-1 au căpătat o importanță deosebită.

Ambele sunt extensii pe 8 biți ale standardului inițial și conțin multe caractere regionale speciale.

Datorită evoluțiilor istorice, ambele standarde sunt adesea denumite seturi de caractere ANSI.

ANSI nu a standardizat oficial aceste seturi de caractere.

Cu toate acestea, chiar și cu 8 biți, sunt disponibile doar 256 de caractere.

Prin urmare, nu toate limbile pot fi acoperite. Astfel, ISO-8859 a fost dezvoltat ca o colecție de seturi de caractere diferite pentru diferite limbi și regiuni.

De exemplu, ISO-8859-7 conține alfabetele latine și grecești. Pe de altă parte, ISO-8859-4 acoperă caractere speciale ale limbilor scandinave și baltice.

ISO-8859-1 conține alfabetele vest-europene și este aproape identic cu Windows 1252.

Atât pentru Windows 1252, cât și pentru ISO 8859-1, primele 128 de caractere sunt identice cu codul ASCII.

Din poziția 128, urmează caractere speciale specifice codului.

Prin acestea, numerele 128-159 nu sunt definite în standardul ISO-8859.

Începând cu numărul 160, sunt conținute caracterele speciale ale diferitelor limbi și regiuni.

ASCII, Unicode și UTF-8

Deși standardele ISO-8859 acoperă multe limbi, nu toate acestea sunt incluse.

În plus, seturile de caractere diferite au provocat confuzie în decursul timpului. Acestea nu sunt compatibile între ele.

Încă din 1988 au fost întocmite primele planuri pentru un set de caractere Unicode. Această versiune a fost lansată în anul 1991.

Unicode permite afișarea a peste un milion de caractere și înlocuiește treptat toate celelalte seturi de caractere.

Este deosebit de importantă codificarea Unicode UTF-8.

Codificarea respectivă este acum formatul de text predominant pe World Wide Web.

UTF-8 are marele avantaj că este compatibil ASCII, deoarece primele 128 de caractere sunt identice.

Structura tabelelor ASCII și ISO

De obicei, listele sau tabelele sunt utilizate pentru afișarea seturilor de caractere.

În acest mod, este mai ușor de găsit caracterul și valoarea lor numerică.

Aceste liste specifică o serie de caractere și valori zecimale, hexadecimale, octale și/sau binare.

Multe tabele sunt hexadecimale și separă codurile în octeții din prima și a doua jumătate.

De exemplu, „H” în tabelul ASCII se găsește în al 4-lea rând al celei de-a 8-a coloane. Astfel, rezultă notarea hexadecimală 0x48.

CR are codul 0x0D deoarece este în linia 0, iar coloana este D. 0x este un prefix obișnuit pentru a se referi la notația hexadecimală.

Cod ASCII, Unicode și optimizare SEO

ASCII și ISO-8859 au fost standardele de caractere text predominante pentru o lungă perioadă de timp.

Pe de altă parte, acestea sunt considerate învechite pentru web-ul de astăzi.

World Wide Web Consortium recomandă utilizarea exclusivă a UTF-8. Aceasta este codificarea caracterelor pentru orice website.

În plus față de textele efective de pe o pagină web, Unicode poate fi utilizat și în descrieri meta.

Caracterele Unicode (cârligele, inimile, stelele sau simbolurile valutare) pot declanșa impulsuri inconștiente.

De exemplu, bifarea și inimile generează aprobare. Pe de altă parte, plicurile și simbolurile telefonice încurajează un eventual contact.

Acest lucru nu are impact direct asupra clasamentelor motoarelor de căutare pentru optimizare SEO.

Cu toate acestea, cresc ratele de click și duc la mai mulți vizitatori și clienți.

În cuvintele cheie relevante pentru SEO și expresiile de cuvinte cheie se recomandă unele restricții.

Literele specifice fiecărei țări nu reprezintă nicio problemă.

Caracterele speciale neobișnuite pot face imposibilă recunoașterea cuvintelor cheie.

Ultima actualizare: 4 ani în urmă în Web Development Etichete: ASCII, ISO-8859-1, optimizare SEO, SEO, Unicode, Unicode UTF-8, website, Windows 1252

A fost articol-ul de ajutor?

Informații articol

ASCII, setul de caractere pentru datele de text și schimbul de informații

Istoric

Setul de caractere ASCII pe 7 biți

Seturi de caractere extinse: ISO-8859

ASCII, Unicode și UTF-8

Structura tabelelor ASCII și ISO

Cod ASCII, Unicode și optimizare SEO

Articole similare

Lasă un comentariu Anulează răspunsul