COMPUTER VISION E LABORATORIOModulo LABORATORIO
Anno accademico 2025/2026 - Docente: FRANCESCO GUARNERARisultati di apprendimento attesi
Conoscenza e capacità di comprensione (knowledge and understanding): l'obiettivo del corso è quello di far acquisire conoscenze che consentano allo studente di comprendere i meccanismi teorici e fisici che stanno alla base di un sistema di visione artificiale
Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): lo studente acquisirà le competenze necessarie per configurare interamente un sistema, scegliendo la configurazione hw/sw ottimale A tale riguardo una parte del corso consisterà in lezioni di laboratorio, con esempi pratici di configurazione e utilizzo di librerie ad-hoc anche in ambiente mobile
Autonomia di giudizio (making judgements): Attraverso delle vere e proprie sessioen di simulaizoni sul campo, lo studente sarà in grado di elaborare autonomamente soluzioni in grado di risolvere i principali problemi di carattere pratico e di design di un sistema di visione (setting di parametri, realtime processing, ecc.)
Abilità comunicative (communication skills): lo studente acquisirà le necessarie abilità comunicative e di appropriatezza espressiva nell'impiego del linguaggio tecnico nell'ambito generale dei sistemi informativi e della comuter vision in particolare.
Capacità di apprendimento (learning skills): il corso si propone, come obiettivo, di fornire allo studente le necessarie metodologie teoriche e pratiche per poter affrontare e risolvere autonomamente nuove problematiche che dovessero sorgere durante una attività lavorativa. A tale scopo diversi argomenti saranno trattati a lezione coinvolgendo lo studente nella ricerca di possibili soluzioni a problemi reali.
Modalità di svolgimento dell'insegnamento
Lezioni frontali ed esercitazioni laboratoriali in aula tramite l'utilizzo del linguaggio di programmazione Python. Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel Syllabus.
Prerequisiti richiesti
Frequenza lezioni
Contenuti del corso
Il corso si propone di offrire un’ampia e approfondita panoramica delle teorie e delle tecniche della visione artificiale, presentandone le principali applicazioni in ambito pratico e scientifico. Nella prima parte, gli studenti saranno guidati attraverso lo studio dei Modelli di Formazione dell’Immagine, della Calibrazione e della Stereoscopia, per poi affrontare i filtri e le caratteristiche delle Event Camera, come il rilevamento dei bordi, delle texture e la costruzione della piramide laplaciana. Seguiranno le tecniche di individuazione dei punti d’interesse (Corner Detection, Harris, ecc.), l’analisi del modello SIFT con i suoi principi teorici e applicativi, e le metodologie di segmentazione visuale.
La seconda parte del corso sarà invece dedicata ai modelli di visione applicati a casi concreti, quali il riconoscimento facciale (Face Recognition), la ricostruzione e il restauro di immagini e video (Image/Video Restoration) e lo studio dei Visual Foundation Models, con un’attenzione particolare alle loro implicazioni e alle applicazioni emergenti. Per ciascun tema verranno discussi nel dettaglio sia gli approcci tradizionali sia quelli di più recente sviluppo, basati su architetture neurali di nuova generazione, come le GAN e i modelli di diffusione.
Testi di riferimento
- E. Trucco, A. Verri, “Introductory Techniques for 3-D Computer Vision”, Prentice Hall, 1998
- G. Bradski, A. Kaehler, “Learning OpenCV Computer Vision with the OpenCV Library” O'Reilly Media, 2008
- Mubarak Shah, "Fundamentals of Computer Vision" (pdf), 1997
- R. Hartley and A. Zisserman, “Multiple View Geometry in Computer Vision”, 2004
- D. A. Forsyth, J. Ponce, “Computer Vision a Modern Approach”, Prentice Hall PTR, 2002
- Richard Szeliski, Computer Vision: Algorithms and Application, Springer 2010
- Fondamenti di Image Processing - Guida teorico/pratica per l’elaborazione e la codifica di immagini digitali – ISBN: 88-88659-49-8 - EdiArgo 2006
- Elaborazione delle Immagini Digitali - R.C. Gonzales, R.E. Woods – Pearson Italia 2008
Programmazione del corso
| Argomenti | Riferimenti testi | |
|---|---|---|
| 1 | Fundamental Matrix; Estrinsic and Intrinsic Paramters; Camera Calibration | Capitoli 1-3 Trucco/Verri |
| 2 | Low Level vision | Forsyth/Ponce, Zseliski |
| 3 | SIFT and related issues | Fundamentals of Computer Vision |
| 4 | Mid Level vision | Forsyth/Ponce, Zseliski |
| 5 | Face Recognition and Detection | Dispense del docente |
| 6 | Image Video Restoration | Dispense del docente |
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
Colloquio Orale e Progetto individuale da concordare con il docente
La prova orale è strutturata in modo che ad ogni studente sia attribuito un voto secondo il seguente schema:
- Non approvato: lo studente non ha acquisito i concetti di base e non è in grado di rispondere ad almeno il 60% delle domande né di svolgere gli esercizi.
- 18-23: lo studente dimostra una padronanza minima dei concetti di base, le sue capacità di collegamento dei contenuti sono modeste, riesce a risolvere semplici esercizi.
- 24-27: lo studente dimostra una buona padronanza dei contenuti del corso, le sue capacità di collegamento dei contenuti sono buone, risolve gli esercizi con pochi errori.
- 28-30 e lode: lo studente ha acquisito tutti i contenuti del corso ed è in grado di padroneggiarli compiutamente e di collegarli con spirito critico; risolve gli esercizi in modo completo e senza errori.
Il progetto individuale permette di aggiungere al voto di base da 1 a 4 punti.
La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere.
Gli studenti con disabilità e/o DSA dovranno contattare con sufficiente anticipo il docente, il referente CInAP del DMI (prof.ssa Daniele) e il CInAP per fruire delle opportune misure compensative.
Esempi di domande e/o esercizi frequenti
- Dettagli sull'algoritmo SIFT
- Autocalibrazione
- Parametri intrinseci ed estrinseci della camera
- Algoritmi di Face Detection
- Pipeline di Image Generation