COMPUTER VISION E LABORATORIO
Modulo LABORATORIO

Anno accademico 2025/2026 - Docente: FRANCESCO GUARNERA

Risultati di apprendimento attesi

Conoscenza e capacità di comprensione (knowledge and understanding): l'obiettivo del corso è quello di far acquisire conoscenze che consentano allo studente di comprendere i meccanismi teorici e fisici che stanno alla base di un sistema di visione artificiale

Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): lo studente acquisirà le competenze necessarie per configurare interamente un sistema, scegliendo la configurazione hw/sw ottimale A tale riguardo una parte del corso consisterà in lezioni di laboratorio, con esempi pratici di configurazione e utilizzo di librerie ad-hoc anche in ambiente mobile

Autonomia di giudizio (making judgements): Attraverso delle vere e proprie sessioen di simulaizoni sul campo, lo studente sarà in grado di elaborare autonomamente soluzioni in grado di risolvere i principali problemi di carattere pratico e di design di un sistema di visione (setting di parametri, realtime processing, ecc.)

Abilità comunicative (communication skills): lo studente acquisirà le necessarie abilità comunicative e di appropriatezza espressiva nell'impiego del linguaggio tecnico nell'ambito generale dei sistemi informativi e della comuter vision in particolare.

Capacità di apprendimento (learning skills): il corso si propone, come obiettivo, di fornire allo studente le necessarie metodologie teoriche e pratiche per poter affrontare e risolvere autonomamente nuove problematiche che dovessero sorgere durante una attività lavorativa. A tale scopo diversi argomenti saranno trattati a lezione coinvolgendo lo studente nella ricerca di possibili soluzioni a problemi reali.

Modalità di svolgimento dell'insegnamento

Lezioni frontali ed esercitazioni laboratoriali in aula tramite l'utilizzo del linguaggio di programmazione Python. Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel Syllabus.

Prerequisiti richiesti

Buone capacità di programmazione in Python, conoscenze derivanti dal corso di Fondamenti di Analisi Dati.

Frequenza lezioni

Fortemente consigliata

Contenuti del corso

Il corso si propone di offrire un’ampia e approfondita panoramica delle teorie e delle tecniche della visione artificiale, presentandone le principali applicazioni in ambito pratico e scientifico. Nella prima parte, gli studenti saranno guidati attraverso lo studio dei Modelli di Formazione dell’Immagine, della Calibrazione e della Stereoscopia, per poi affrontare i filtri e le caratteristiche delle Event Camera, come il rilevamento dei bordi, delle texture e la costruzione della piramide laplaciana. Seguiranno le tecniche di individuazione dei punti d’interesse (Corner Detection, Harris, ecc.), l’analisi del modello SIFT con i suoi principi teorici e applicativi, e le metodologie di segmentazione visuale.

La seconda parte del corso sarà invece dedicata ai modelli di visione applicati a casi concreti, quali il riconoscimento facciale (Face Recognition), la ricostruzione e il restauro di immagini e video (Image/Video Restoration) e lo studio dei Visual Foundation Models, con un’attenzione particolare alle loro implicazioni e alle applicazioni emergenti. Per ciascun tema verranno discussi nel dettaglio sia gli approcci tradizionali sia quelli di più recente sviluppo, basati su architetture neurali di nuova generazione, come le GAN e i modelli di diffusione.

Testi di riferimento

  1. E. Trucco, A. Verri, “Introductory Techniques for 3-D Computer Vision”, Prentice Hall, 1998
  2. G. Bradski, A. Kaehler, “Learning OpenCV Computer Vision with the OpenCV Library” O'Reilly Media, 2008
  3. Mubarak Shah, "Fundamentals of Computer Vision" (pdf), 1997
  4. R. Hartley and A. Zisserman, “Multiple View Geometry in Computer Vision”, 2004
  5. D. A. Forsyth, J. Ponce, “Computer Vision a Modern Approach”, Prentice Hall PTR, 2002
  6. Richard Szeliski, Computer Vision: Algorithms and Application, Springer 2010
  7. Fondamenti di Image Processing - Guida teorico/pratica per l’elaborazione e la codifica di immagini digitali – ISBN: 88-88659-49-8 - EdiArgo 2006
  8. Elaborazione delle Immagini Digitali - R.C. Gonzales, R.E. Woods – Pearson Italia 2008

Programmazione del corso

 ArgomentiRiferimenti testi
1Fundamental Matrix; Estrinsic and Intrinsic Paramters; Camera CalibrationCapitoli 1-3 Trucco/Verri
2Low Level visionForsyth/Ponce, Zseliski
3SIFT and related issuesFundamentals of Computer Vision
4Mid Level visionForsyth/Ponce, Zseliski
5Face Recognition and DetectionDispense del docente
6Image Video RestorationDispense del docente

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

Colloquio Orale e Progetto individuale da concordare con il docente

La prova orale è strutturata in modo che ad ogni studente sia attribuito un voto secondo il seguente schema:

  • Non approvato: lo studente non ha acquisito i concetti di base e non è in grado di rispondere ad almeno il 60% delle domande né di svolgere gli esercizi.
  • 18-23: lo studente dimostra una padronanza minima dei concetti di base, le sue capacità  di collegamento dei contenuti sono modeste, riesce a risolvere semplici esercizi.
  • 24-27:  lo studente dimostra una buona padronanza dei contenuti del corso, le sue capacità di collegamento dei contenuti sono buone,  risolve gli esercizi con pochi errori.
  • 28-30 e lode: lo studente ha acquisito tutti i contenuti del corso ed è in grado di padroneggiarli compiutamente e di collegarli con spirito critico; risolve gli esercizi in modo completo e senza errori.

Il progetto individuale permette di aggiungere al voto di base da 1 a 4 punti.

La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere.

Gli studenti con disabilità e/o DSA dovranno contattare con sufficiente anticipo il docente, il referente CInAP del DMI (prof.ssa Daniele) e il CInAP per fruire delle opportune misure compensative.



Esempi di domande e/o esercizi frequenti

  • Dettagli sull'algoritmo SIFT
  • Autocalibrazione
  • Parametri intrinseci ed estrinseci della camera
  • Algoritmi di Face Detection
  • Pipeline di Image Generation

Si precisa che le domande sono puramente indicative: le domande poste durante l'esame potrebbero differire, anche significativamente.

ENGLISH VERSION