Logo dell'Università di Catania: Siciliae Studium Generale 1434 Logo DMI, Fondamenti di informatica
matite e gomma
Loghi istituzionali: Siciliae Studium Generale 1434, Università di Catania, Facoltà di Scienze Matematiche, Fisiche, Naturali, Insegnamento di Fondamenti di Informatica

Compressione e validazione dei dati

Lezione 7 di Fondamenti di informatica

Docenti: Marina Madonia & Giuseppe Scollo

Università di Catania
Facoltà di Scienze Matematiche, Fisiche e Naturali
Corso di Laurea in Informatica, I livello, AA 2008-09

Logo di Conformità WCAG-1 di Livello Tripla A, W3C-WAI Web Content Accessibility Guidelines 1.0 Validazione XHTML 1.0 Validazione CSS 2

Indice

  1. Compressione e validazione dei dati
  2. motivazioni per la compressione dei dati
  3. tecniche generiche di compressione
  4. compressione di immagini e suoni
  5. codici per il controllo di errore
  6. codici per la correzione di errore
  7. esercizi

motivazioni per la compressione dei dati

compressione dei dati: rappresentazione dell'informazione con sequenze più brevi
(si spera ;)

la compressione dei dati richiede algoritmi di (de)codifica:

tecniche generiche di compressione

sono dette generiche le tecniche di compressione applicabili a qualsiasi sequenza binaria

codifica run-length

codifica differenziale, o relativa

codifica dipendente dalla frequenza dei simboli

codifica basata su dizionario, adattativa

compressione di immagini e suoni

sono largamente in uso tecniche di compressione specifiche

tecniche di compressione audio:

standard di compressione di immagini:

compressione A/V:

codici per il controllo di errore

problema:

soluzione:

esempi:

codici per la correzione di errore

per configurazioni binarie di uguale lunghezza, distanza di Hamming :

un codice con distanza di Hamming 2n+1 permette di rivelare fino a 2n errori nella trasmissione della codifica di un simbolo, e di correggere fino a n errori

A000000
B001111
C010011
D011100
E100110
F101001
G110101
H111010

l'errore di un bit nella trasmissione della codifica del simbolo D provoca la ricezione della configurazione 010100, estranea al codice

la correzione rimpiazza la configurazione ricevuta con quella valida a distanza di Hamming minima da essa

A2
B4
C3
D1
E3
F5
G2
H4

esercizi

  1. Il rapporto di compressione di una tecnica di compressione dei dati c, per una data sequenza binaria I, è il rapporto fra la lunghezza di I e quella della sequenza compressa c(I). Spiegare perché non può esistere una tecnica di compressione generica che garantisca un rapporto di compressione maggiore di 1 per qualsiasi sequenza binaria I.
  2. Perché la codifica relativa è particolarmente adatta alla compressione di dati video?
  3. Si supponga che tutte le parole che occorrono in un testo T, in codice ASCII, siano presenti nel dizionario per il controllo ortografico di un elaboratore di testi. Si assuma di comprimere il testo mediante una codifica basata su tale dizionario, esteso con "voci" distinte per i segni di interpunzione e altri caratteri speciali. Sia V il numero di voci distinte del dizionario esteso. Per quale valor medio della lunghezza delle parole in T (considerando come tali anche i segni di interpunzione e i caratteri speciali) ci si può attendere un rapporto di compressione minore di 1?
    • (suggerimento: formulare la risposta in funzione di lgV )
  4. Si supponga di voler codificare un insieme A di simboli assegnando un byte a ciascun simbolo, con un codice a correzione di errore, basato sulla distanza di Hamming, in grado di correggere fino a 3 errori nella trasmissione di ciascun simbolo. Qual è la massima cardinalità di A per la quale ciò è fattibile?