Logo dell'Università di Catania: Siciliae Studium Generale 1434 Logo DMI, Fondamenti di informatica
matite e gomma
Loghi istituzionali: Siciliae Studium Generale 1434, Università di Catania, Facoltà di Scienze Matematiche, Fisiche, Naturali, Insegnamento di Fondamenti di Informatica

Compressione e validazione dei dati

Lezione 7 di Fondamenti di informatica

Docente: Giuseppe Scollo

Università di Catania
Facoltà di Scienze Matematiche, Fisiche e Naturali
Corso di Laurea in Informatica, I livello, AA 2009-10

Logo di Conformità WCAG-1 di Livello Tripla A, W3C-WAI Web Content Accessibility Guidelines 1.0 Validazione XHTML 1.0 Validazione CSS 3

Indice

  1. Compressione e validazione dei dati
  2. motivazioni per la compressione dei dati
  3. tecniche generiche di compressione
  4. compressione di immagini e suoni
  5. codici per il controllo di errore
  6. codici per la correzione di errore
  7. temi per ulteriori approfondimenti

motivazioni per la compressione dei dati

compressione dei dati:

la compressione dei dati richiede algoritmi di (de)codifica:

rapporto di compressione di una codifica c per una data sequenza binaria T:

tecniche generiche di compressione

"generiche": tecniche di compressione applicabili a qualsiasi sequenza binaria

codifica run-length

codifica differenziale, o relativa

codifica dipendente dalla frequenza dei simboli

codifica basata su dizionario, adattativa

compressione di immagini e suoni

sono largamente in uso tecniche di compressione specifiche

tecniche di compressione audio:

standard di compressione di immagini:

compressione A/V:

codici per il controllo di errore

problema:

soluzione:

esempi (in ordine di crescente complessità algoritmica):

codici per la correzione di errore

per configurazioni binarie di uguale lunghezza, distanza di Hamming :

un codice con distanza di Hamming 2n+1 permette di rivelare fino a 2n errori nella trasmissione della codifica di un simbolo, e di correggere fino a n errori

A000000
B001111
C010011
D011100
E100110
F101001
G110101
H111010

l'errore di un bit nella trasmissione della codifica del simbolo D provoca la ricezione della configurazione 010100, estranea al codice

la correzione rimpiazza la configurazione ricevuta con quella valida a distanza di Hamming minima da essa

A2
B4
C3
D1
E3
F5
G2
H4

temi per ulteriori approfondimenti

  1. Tecniche generiche di compressione adattativa
    L'algoritmo LZW di compressione generica, pubblicato nel 1984, è un raffinamento di algoritmi proposti in precedenza: è adottato in alcuni programmi di utilità, ad es. compress in sistemi Unix di vecchia data, ma nel corso del tempo questi hanno ceduto il posto ad altre tecniche generiche, quali ad es. gzip, bzip2, rzip, che vantano rapporti di compressione mediamente migliori. Meritano approfondimento gli algoritmi di compressione impiegati in tali tecniche e un'analisi comparativa dei relativi pregi e limiti.
  2. Tecniche di compressione lossy
    Si indicano con questo termine le tecniche caratterizzate dalla possibilità di perdita di informazione attraverso la codifica, ragion per cui la decodifica non è esattamente l'inversa della codifica, ma ne è solo un'approssimazione. Per la compressione di dati multimediali tale perdita, se contenuta entro certi limiti, è spesso accettabile, ad es. quando genera differenze impercettibili dai sensi umani interessati (visione, udito). Alcune tecniche lossy sono impiegate negli standard di cui si son dati cenni a lezione, altre sono tuttora oggetto di ricerca, ad es. le tecniche di compressione frattale o quelle basate su ondulette (ingl. wavelet). Si possono approfondire le idee alla base di tali tecniche, i relativi algoritmi e i campi d'impiego in cui risultano meglio applicabili.