El procés de conversió de dades d'una forma a una altra forma es coneix com a codificació. S'utilitza per transformar les dades de manera que les dades puguin ser suportades i utilitzades per diferents sistemes. La codificació funciona de manera similar a la conversió de la temperatura de graus centígrads a Fahrenheit, ja que només es converteix en una altra forma, però el valor original sempre segueix sent el mateix. La codificació s'utilitza principalment en dos camps:
Nota: La codificació és diferent de l'encriptació, ja que la seva finalitat principal no és ocultar les dades sinó convertir-les en un format perquè es puguin consumir correctament.
En aquest tema, parlarem dels diferents tipus de tècniques de codificació que s'utilitzen en informàtica.
Tipus de tècnica de codificació
Codificació de caràcters
La codificació de caràcters codifica els caràcters en bytes . Informa als ordinadors com interpretar el zero i els uns en caràcters, números i símbols reals. L'ordinador només entén dades binàries; per tant, cal convertir aquests caràcters en codis numèrics. Per aconseguir-ho, cada caràcter es converteix en codi binari, i per això, els documents de text es guarden amb tipus de codificació. Es pot fer emparellant números amb caràcters. Si no apliquem la codificació de caràcters, el nostre lloc web no mostrarà els caràcters i el text en un format adequat. Per tant, disminuirà la llegibilitat i la màquina no podria processar les dades correctament. A més, la codificació de caràcters garanteix que cada caràcter tingui una representació adequada en format informàtic o binari.
Hi ha diferents tipus de tècniques de codificació de caràcters, que es mostren a continuació:
Codificació HTML
La codificació HTML s'utilitza per mostrar una pàgina HTML en un format adequat. Amb la codificació, un navegador web coneix quin conjunt de caràcters s'utilitzarà.
En HTML, hi ha diversos caràcters utilitzats en l'etiquetatge HTML, com ara . Per codificar aquests caràcters com a contingut, hem d'utilitzar una codificació.
Codificació d'URL
URL (localitzador uniforme de recursos) S'utilitza la codificació convertir caràcters en un format tal que es puguin transmetre per Internet . També es coneix com a codificació per cent. La codificació d'URL es realitza per enviar l'URL a Internet mitjançant el conjunt de caràcters ASCII. Els caràcters no ASCII se substitueixen per un %, seguit dels dígits hexadecimals.
Codificació UNICODE
Unicode és un estàndard de codificació per a un conjunt de caràcters universal. Permet codificar, representar i gestionar el text representat en la majoria dels idiomes o sistemes d'escriptura disponibles a tot el món. Proporciona un punt de codi o número per a cada caràcter en tots els idiomes admesos. Pot representar aproximadament tots els caràcters possibles possibles en tots els idiomes. Una seqüència particular de bits es coneix com a unitat de codificació.
Un estàndard UNICODE pot utilitzar 8, 16 o 32 bits per representar els caràcters.
L'estàndard Unicode defineix Unicode Transformation Format (UTF) per codificar els punts de codi.
L'estàndard de codificació UNICODE té els esquemes UTF següents:
L'UTF8 es defineix per l'estàndard UNICODE, que és la codificació de caràcters d'amplada variable que s'utilitza a la comunicació electrònica. UTF-8 és capaç de codificar tots els 1.112.064 punts de codi de caràcters vàlids en Unicode utilitzant un a quatre unitats de codi d'un byte (8 bits).
La codificació UTF16 representa els punts de codi d'un caràcter mitjançant un dels dos nombres enters de 16 bits.
La codificació UTF32 representa cada punt de codi com a nombres enters de 32 bits.
Codificació Base64
La codificació Base64 s'utilitza per codificar dades binàries en caràcters ASCII equivalents. La codificació Base64 s'utilitza al sistema de correu, ja que sistemes de correu com SMTP no poden funcionar amb dades binàries perquè només accepten dades textuals ASCII. També s'utilitza en l'autenticació HTTP simple per codificar les credencials. A més, també s'utilitza per transferir les dades binàries a galetes i altres paràmetres per fer que les dades siguin il·legibles per evitar la manipulació. Si es transfereix una imatge o un altre fitxer sense la codificació Base64, es corromprà perquè el sistema de correu no és capaç de tractar les dades binàries.
Base64 representa les dades en blocs de 3 bytes, on cada byte conté 8 bits; per tant, representa 24 bits. Aquests 24 bits es divideixen en quatre grups de 6 bits. Cadascun d'aquests grups o fragments es converteix en un valor Base64 equivalent.
Codificació ASCII
Codi estàndard americà per a l'intercanvi d'informació (ASCII) és un tipus de codificació de caràcters. Va ser el primer estàndard de codificació de caràcters llançat l'any 1963.
El codi ASCII s'utilitza per representar els caràcters anglesos com a números, on cada lletra s'assigna amb un número de 0 a 127. La majoria dels esquemes moderns de codificació de caràcters es basen en ASCII, tot i que admeten molts caràcters addicionals. És una codificació d'un sol byte que només utilitza els 7 bits inferiors. En un fitxer ASCII, cada caràcter alfabètic, numèric o especial es representa amb un nombre binari de 7 bits. Cada caràcter del teclat té un valor ASCII equivalent.
Codificació d'imatge i àudio i vídeo
La codificació d'imatges, àudio i vídeo es realitza per estalviar espai d'emmagatzematge. Un fitxer multimèdia com ara imatge, àudio i vídeo estan codificats per desar-los en un format més eficient i comprimit.
Aquests fitxers codificats contenen el mateix contingut amb una qualitat generalment similar, però amb una mida comprimida, de manera que es poden desar en menys espai, es poden transferir fàcilment per correu o es poden descarregar al sistema.
Ho podem entendre com un . El fitxer d'àudio WAV es converteix en fitxer .MP3 per reduir la mida en 1/10tha la seva mida original.