COMPUTER VISION E LABORATORIOModulo COMPUTER VISION
Anno accademico 2024/2025 - Docente: SEBASTIANO BATTIATORisultati di apprendimento attesi
Conoscenza e capacità di comprensione (knowledge and understanding): l'obiettivo del corso è quello di far acquisire conoscenze che consentano allo studente di comprendere i meccanismi teorici e fisici che stanno alla base di un sistema di visione artificiale
Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): lo studente acquisirà le competenze necessarie per configurare interamente un sistema, scegliendo la configurazione hw/sw ottimale A tale riguardo una parte del corso consisterà in lezioni di laboratorio, con esempi pratici di configurazione e utilizzo di librerie ad-hoc anche in ambiente mobile
Autonomia di giudizio (making judgements): Attraverso delle vere e proprie sessioen di simulaizoni sul campo, lo studente sarà in grado di elaborare autonomamente soluzioni in grado di risolvere i principali problemi di carattere pratico e di design di un sistema di visione (setting di parametri, realtime processing, ecc.)
Abilità comunicative (communication skills): lo studente acquisirà le necessarie abilità comunicative e di appropriatezza espressiva nell'impiego del linguaggio tecnico nell'ambito generale dei sistemi informativi e della comuter vision in particolare.
Capacità di apprendimento (learning skills): il corso si propone, come obiettivo, di fornire allo studente le necessarie metodologie teoriche e pratiche per poter affrontare e risolvere autonomamente nuove problematiche che dovessero sorgere durante una attività lavorativa. A tale scopo diversi argomenti saranno trattati a lezione coinvolgendo lo studente nella ricerca di possibili soluzioni a problemi reali.
Modalità di svolgimento dell'insegnamento
Lezioni frontali
Prerequisiti richiesti
Frequenza lezioni
Contenuti del corso
Il corso si propone di approfondire teorie e tecniche specificatamente rivolte alla visione artificiale con una serie di applicazioni.
La prima parte del corso verterà su: Modelli di Formazione dell’Immagine, Calibrazione e Stereoscopia, Filters and Features: Edges, Texture, Laplacian Pyramid,Corner Detection (Harris, …), SIFT(Teoria e Applicazioni), Segmentazione visuale.
La seconda parte del corso è dedicata allo studio di modelli di visione applicati a Face Recognition, Image/Video Restoration, Medical Imaging, DeepFake e Generative AI
Per ogni argomento verranno illustrati in dettaglio sia gli approcci "tradizionali" che quelli più recenti basati su archietetture neurali di nuova generazione (GAN, Diffusion model, ecc)
L'ultima parte del corso è dedicata ad un tema "specialistico" d'approfondimento.
Testi di riferimento
- E. Trucco, A. Verri, “Introductory Techniques for 3-D Computer Vision”, Prentice Hall, 1998
- G. Bradski, A. Kaehler, “Learning OpenCV Computer Vision with the OpenCV Library” O'Reilly Media, 2008
- Mubarak Shah, "Fundamentals of Computer Vision" (pdf), 1997
- R. Hartley and A. Zisserman, “Multiple View Geometry in Computer Vision”, 2004
- D. A. Forsyth, J. Ponce, “Computer Vision a Modern Approach”, Prentice Hall PTR, 2002
- Richard Szeliski, Computer Vision: Algorithms and Application, Springer 2010
- Fondamenti di Image Processing - Guida teorico/pratica per l’elaborazione e la codifica di immagini digitali – ISBN: 88-88659-49-8 - EdiArgo 2006
- Elaborazione delle Immagini Digitali - R.C. Gonzales, R.E. Woods – Pearson Italia 2008
- Sito del corso
- http://www.dmi.unict.it/~battiato/teaching_research.htm
- Materiale didattico disponibile su Studium
Programmazione del corso
Argomenti | Riferimenti testi | |
---|---|---|
1 | Fundamental Matrix; Estrinsic and Intrinsic Paramters; Camera Calibration | Capitoli 1-3 Trucco/Verri |
2 | Low Level vision | Forsyth/Ponce, Zseliski |
3 | SIFT and related issues | Fundamentals of Computer Vision |
4 | Mid Level vision | Forsyth/Ponce, Zseliski |
5 | Face Recognition and Detection | Dispense del docente |
6 | Generative AI e Deepfake | Dispense del docente |
7 | Medical Imaging | Dispense del docente |
8 | Image Video REstoration | Dispense del docente |
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
Colloquio Orale
Progetto individuale da concordare con il docente
Gli studenti con disabilità e/o DSA dovranno contattare con sufficiente anticipo rispetto alla data dell'esame il docente e il referente CInAP del DMI per comunicare che intendono sostenere l'esame fruendo delle opportune misure compensative.La prova è strutturata in modo che ad ogni studente sia attribuito un voto secondo il seguente schema:
- Non approvato: lo studente non ha acquisito i concetti di base e non è in grado di rispondere ad almeno il 60% delle domande né di svolgere gli esercizi.
- 18-23: lo studente dimostra una padronanza minima dei concetti di base, le sue capacità di collegamento dei contenuti sono modeste, riesce a risolvere semplici esercizi.
- 24-27: lo studente dimostra una buona padronanza dei contenuti del corso, le sue capacità di collegamento dei contenuti sono buone, risolve gli esercizi con pochi errori.
- 28-30 e lode: lo studente ha acquisito tutti i contenuti del corso ed è in grado di padroneggiarli compiutamente e di collegarli con spirito critico; risolve gli esercizi in modo completo e senza errori.
Esempi di domande e/o esercizi frequenti
- Dettagli sulle SIFT
- Autocalibrazione
- Parametri Intrinseci/Estrinseci della Camera
- Algoritmo Viola/Jones per il Face Detection
- Image Generation Pipeline
- Interest point detectors
- Interest point descriptors