INTERAZIONE E MULTIMEDIA M - Z

Anno accademico 2018/2019 - 2° anno

Docente: Filippo STANCO
Crediti: 9
Organizzazione didattica: 225 ore d'impegno totale, 153 di studio individuale, 36 di lezione frontale, 36 di esercitazione
Semestre: 1°
ENGLISH VERSION

Obiettivi formativi

Obiettivi formativi generali dell'insegnamento in termini di risultati di apprendimento attesi.

Conoscenza e capacità di comprensione (knowledge and understanding): l'obiettivo del corso è quello di far acquisire conoscenze che consentano allo studente di comprendere i meccanismi teorici e fisici che stanno alla base del sistema visivo umano, della formazione ed elaborazione delle immagini digitali, del miglioramento della qualità visiva delle immagini digitali.
Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): lo studente acquisirà le competenze necessarie per acquisire, editare, comprimere e salvare una immagine digitale. In particolare una parte del corso sarà relativa allo studio del software Processing per applicare tali conoscenze teoriche.
Autonomia di giudizio (making judgements): Attraverso esempi in aula lo studente sarà messo nelle condizioni di comprendere se le soluzioni da lui proposte soddisfano un certo grado di qualità.
Abilità comunicative (communication skills): lo studente acquisirà le necessarie abilità comunicative e la proprietà di linguaggio tecnico nell'ambito del settore Multimediale.
Capacità di apprendimento (learning skills): il corso si propone, come obiettivo, di fornire allo studente le necessarie metodologie teoriche e pratiche per poter affrontare e risolvere autonomamente nuove problematiche che dovessero sorgere durante una attività lavorativa. A tale scopo diversi argomenti saranno trattati a lezione coinvolgendo lo studente nella ricerca di possibili soluzioni a problemi reali.

Modalità di svolgimento dell'insegnamento

Didattica Frontale

Esercitazioni laboratoriali in Aula

Prerequisiti richiesti

Buona conoscenza della programmazione di base. E' sufficiente aver superato il corso di programmazione I.

Frequenza lezioni

E' fortemente consigliata la presenza alle lezioni.

Contenuti del corso

Introduzione alle immagini digitali

Formazione della immagini nell’occhio umano

Equazione della lente sottile

Illusioni ottiche

I sensori digitali

Il Bayer pattern

Color interpolation

Immagini Raster e immagini vettoriali

Rappresentazione delle immagini raster

Campinamento

Quantizzazione

Aliasing

Risoluzione delle immagini digitali

Interpolazione replication, bilineare e bicubica

Il PSNR

Il colore

Gli spazi di colore RGB, CMY, HSV, Munsell, YUV, YCbCr

Le immagini indicizzate e le palette

Il reindexing

L’istogramma di una immagine

Le operazioni puntuali e le LUT

Bit-planes

Operatori lineari e invarianti per traslazione

Noise reduction

Edge detection

Dominio spaziale

Dominio delle frequenze

Trasformata di Fourier

La convoluzione e il teorema della convoluzione

Compressione lossy e lossless

Teorema di Shannon per la compressione

Codifica di Huffman

Lo standard Jpeg

Introduzione a Processing

metodi principali e variabili principali: settings(), setup(), draw() e frameRate, width, heigth, ecc…;
principali primitive di disegno ellipse(), rect(), line(), bezier(), beginShape(), ecc… e modificatori ellipseMode(), rectMode(), ecc…
tipo color e metodo color().

Interazione utente e rilevamento input da mouse e da tastiera

variabili mousePressed, keyPressed, mouseButton, key, keycode;
metodi mousePressed(), keyPressed(), mouseReleased(), mouseClicked().

Operazioni affini per il disegno:

Metodi rotate(), shearX(), shearY(), translate(), applyMatrix() più pushMatrix() e popMatrix().

Classi e oggetti in Processing, ereditarietà e strutture dati.

Elaborazione immagini, classe PImage e metodi;

metodi Processing: loadImage(), createImage(), copy(), red(), green(), blue(), saveFrame();
metodi e variabili di PImage: save(), get(), set(), loadPixels(), updatePixels(), pixels, ecc…..

Implementazione algoritmi di elaborazione immagine

quantizzazione uniforme e logaritmica;
interpolazione replication e calcolo PSNR;
operazioni puntuali: negativo, logaritmo e gamma;
stretching dell’istogramma e equalizzazione;
operazioni affini per l’immagine: rotazione, scaling, shear;
operatori locali di rango: mediano, massimo e minimo;
operatori locali lineari e invarianti per traslazione applicati mediante convoluzione: sobel, prewitt, media N box, ecc…;
estrazione bitplane.

Testi di riferimento

Fondamenti di Image Processing di S. Battiato e F. Stanco - Ediargo

ELABORAZIONE DELLE IMMAGINI DIGITALI, Terza Edizione, Rafael C. Gonzalez, Richard E. Woods, Ediz. Pearson, Prentice Hall

Programmazione del corso

	Argomenti	Riferimenti testi
1	La percezione visiva, Acquisizione delle immagini, campionamento e quantizzazione, strumenti matematici usati nella elaborazione delle immagini	Capitolo 2 di "Elaborazione delle Immagini Digitali"
2	Istogrammi, filtraggi spaziali, Smoothing	Capitolo 3 di "Elaborazione delle Immagini Digitali"
3	Filtraggio nel dominio delle frequenza, trasformata di Fourier, Filtraggi nel dominio della frequenza	Capitolo 4 di "Elaborazione delle Immagini Digitali"
4	Rumore, filtraggio spaziale	Capitolo 5 di "Elaborazione delle Immagini Digitali"
5	Spazi colore	Capitolo 6 di "Elaborazione delle Immagini Digitali"
6	Compressione delle immagini	Fondamenti di Image Processing

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

Occorre superare le seguenti prove:

1. esame scritto

2. Laboratorio di Processing

3. Colloquio orale

E' prevista una prova in itinere nel periodo di sospensione delle lezioni per prove in itinere previsto dal Corso di Laurea. Le date sono riportate su http://web.dmi.unict.it/corsi/l-31/calendario-didattico

Esempi di domande e/o esercizi frequenti

le domande nell'esame scritto sono a risposta aperta. Ne riporto un paio come esempio.

L’operatore “potenza” è puntuale, locale o globale? Che significa? Tale operatore, in genere, schiarisce o incupisce l’immagine? Applicare l’operatore potenza ^2 alla matrice di seguito riportata. Infine normalizzare linearmente tra 0 e 255 la matrice risultato.

56	45	11
67	100	232
0	129	50

Quali sono le caratteristiche fondamentali della codifica di Huffman? Costruire la codifica di Huffman per i simboli che compongono la stringa “esame per esame”.
Esercizio di Processing:
Si implementino in Processing le seguenti funzioni con le caratteristiche dichiarate:
- imMean() – Deve avere come parametro di input un’immagine RGB. L’output della funzione è un colore RGB, ottenuto dalla media dei colori di ogni pixel che costituiscono l’immagine di input. Per media tra colori RGB, si intende la media canale per canale.
- regionMean () – Deve avere come parametro di input un’immagine RGB, e tre interi x, y e n. L’output deve essere un colore, ottenuto utilizzando la funzione imMean() sulla sottoimmagine centrata in x e y, di dimensione n × n. Lo studente può gestire come preferisce la situazione in cui la sottoimmagine include regioni esterne all’immagine originale.
Si implementi uno sketch Processing in cui:
- Si apre un’immagine RGB di dimensioni 512×512 (oppure si ridimensiona in modo che diventi di dimensioni 512×512) e una finestra di dimensioni 1024×512, si inizializza inoltre una variabile K con valore pari a 10 moltiplicato per l’ultima cifra del numero di matricola dello studente +1.
- In ogni momento, durante l’esecuzione dello sketch, nella parte sinistra della finestra si visualizza l’immagine originale. Inoltre viene applicata la funzione regionMean(), passando come parametri di input l’immagine originale, x e y pari alle coordinate del pixel dell’immagine originale su cui si trova il mouse in quel momento, e infine il valore K. Nella parte destra della finestra si visualizza un rettangolo di dimensioni 512×512, del colore restituito dalla funzione regionMean() applicata come descritto sopra. Attenzione! Se le coordinate x e y sono tali che l’intorno includa regioni esterne all’immagine, queste coordinate vanno riportate entro i limiti prima di chiamare regionMean().
- Inoltre, deve essere sempre mostrato un quadrato di dimensione K × K, senza colore di riempimento e dal bordo di un colore a scelta dello studente, che permetta di capire qual è la regione che in quel momento è considerata nel calcolo della media.
- Ogni volta che viene premuto il tasto ‘+’ il valore di K aumenta di 10, mentre alla pressione del tasto ‘-’ viene decrementato di 10. Si limiti comunque questo valore tra un minimo di 10 e un massimo di 250.

Corso di laurea in

Informatica