CODIFICA DELLE
INFORMAZIONI
Nel linguaggio naturale
Le informazioni
possono essere:
• Numeriche
• Alfabetiche
• Alfanumeriche
Nel linguaggio informatico
Le informazioni devono essere elaborate
dando loro una rappresentazione
simbolica idonea chiamata codifica
Il sistema dei simboli usati si chiama codice
Linguaggio binario
Le cifre binarie sono gli elementi
fondamentali della tecnica dei calcolatori
elettronici e prendono il nome di bit
I codici
Il codice del calcolatore è l’insieme delle
configurazioni binarie usate dalla
macchina per rappresentare i caratteri
L’insieme dei caratteri che possono essere
codificati è chiamato repertorio
Per costruire un codice che converta in
forma binaria ogni carattere del linguaggio
naturale è necessario stabilire una
corrispondenza biunivoca tra ciascun
carattere e una particolare configurazione
binaria
Codice ASCII
In questo codice ogni carattere viene
rappresentato con otto bit e quindi può
rappresentare 256 caratteri
BYTE
Un gruppo di 8 bit prende il nome di byte
Con un byte si possono rappresentare:
• Una lettera dell’alfabeto
• Una cifra numerica
• Un segno speciale
Caratteri non stampabili
33 dei caratteri del repertorio del codice
ASCII non sono stampabili e vengono
impiegati per segnalare condizioni
particolari
(per esempio eot che individua la fine del testo)
Al mondo esistono alfabeti diversi da quello latino
per “forma del carattere” o per complessità.
Codice UNICODE
Per questi diversi alfabeti si è creato un codice di
rappresentazione che comprende
universalmente tutti i caratteri possibili:
l’ UNICODE
Codice UNICODE
Il codice UNICODE con i suoi 2 byte di
rappresentazione può descrivere ben
65.536 caratteri diversi
UNICODE in evoluzione
Attualmente lo standard Unicode non
rappresenta ancora tutti i caratteri in uso
nel mondo. Essendo ancora in evoluzione,
si prefigge di coprire tutti i caratteri
rappresentabili.
LA COMPRESSIONE DEI DATI
La compressione dati
è una tecnica
utilizzata in ambito
informatico per la
riduzione della
quantità di bit
necessari alla
rappresentazione in
forma digitale di
un'informazione.
Tecniche di compressione
Le tecniche di compressione dati si dividono
in due grandi categorie:
• compressione dati lossy: comprime i dati attraverso un
processo con perdita d’ informazione che sfrutta le
ridondanze nell'utilizzo dei dati;
• compressione dati lossless: comprime i dati attraverso
un processo senza perdita d'informazione che sfrutta le
ridondanze nella codifica del dato
Compressione dati lossless
Le tecniche senza perdita consentono di
preservare l'informazione originale in ogni sua
parte. È l'unica via possibile quando si devono
comprimere file di testo, programmi, documenti,
database, schemi elettrici ecc.
ZIP
Un esempio è il formato ZIP, il quale consente di
archiviare o trasmettere uno o più file
risparmiando sulle risorse necessarie (spazio su
disco o tempo di trasmissione). Al momento in
cui vengono recuperati i file dallo ZIP
(decompressione) questi risultano indistinguibili
dagli originali.
GIF e PNG
Un altro esempio di caso in cui viene usata la
compressione senza perdita è quello delle
immagini non fotografiche. Per questo scopo
esistono formati come il GIF o PNG. L'immagine
compressa con uno di questi formati mantiene
esattamente l'aspetto originale fino al dettaglio
più insignificante.
Compressione dati lossy
Le tecniche con perdita di informazione permettono anche
delle compressioni molto spinte, quindi un grande
risparmio di risorse, a discapito però della qualità
dell'immagine o dell'audio che si è voluto comprimere.
Generalmente queste tecniche si usano per comprimere
i file multimediali. Pur mantenendo minima la perdita di
qualità, il risparmio rispetto ad una compressione
lossless sulla stessa informazione è sempre
decisamente apprezzabile.
Esempi compressioni lossy
Le informazioni multimediali come audio o video, in
origine sono troppo grandi per essere agevolmente
trasmesse o memorizzate, quindi si può preferire
avere una piccola riduzione della qualità ma nel
contempo file molto più leggeri. Alcuni esempi sono:
la compressione di immagini in formato JPEG,
largamente usata in fotografia digitale e sul Web, la
compressione video in formato XviD oppure la
compressione audio in formato MP3.
Fine
Scarica

CODIFICA DELLE INFORMAZIONI - Belmesser-iki