DEEP LEARNING
Anno accademico 2025/2026 - Docente: ANTONINO FURNARIRisultati di apprendimento attesi
Conoscenza e capacità di comprensione (knowledge and understanding): Al termine del corso, lo studente avrà una conoscenza approfondita dei modelli e metodi avanzati di Deep Learning, esplorando le frontiere di ricerca e applicazioni complesse. Comprenderà tecniche come Metric Learning, Domain Adaptation, Knowledge Distillation, Deep Unsupervised e Self-Supervised Representation Learning, Multimodal Learning, e Reinforcement Learning, sviluppando una comprensione critica delle loro basi teoriche e delle sfide attuali.
Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): Lo studente sarà in grado di applicare metodologie avanzate di Deep Learning per problemi complessi (apprendimento di rappresentazioni da dati non etichettati, trasferimento di conoscenze tra domini, comprensione di contenuti multimodali e integrazione delle modalità). Avrà le competenze per implementare e ottimizzare modelli per il Multimodal Learning, lavorare con architetture di grandi dimensioni e applicare tecniche di ottimizzazione come la Knowledge Distillation. Sarà inoltre in grado di comprendere e applicare i principi del Reinforcement Learning.
Autonomia di giudizio (making judgements): Lo studente svilupperà una spiccata autonomia di giudizio nella valutazione e selezione di modelli e metodi avanzati di Deep Learning. Saprà analizzare criticamente la letteratura scientifica, identificando punti di forza e debolezza delle soluzioni e proponendo approcci innovativi. Acquisirà la capacità di prendere decisioni informate sull'applicabilità ed efficacia delle tecniche all'avanguardia in contesti reali, considerando implicazioni pratiche.
Abilità comunicative (communication skills): Lo studente sarà in grado di comunicare in modo esperto e appropriato concetti complessi legati ai modelli avanzati di Deep Learning. Saprà presentare in modo chiaro risultati progetti e analisi, usando un linguaggio tecnico accurato. Le abilità comunicative includeranno la capacità di discutere criticamente, collaborare in gruppi multidisciplinari e redigere documentazione tecnica e rapporti scientifici di alta qualità.
Capacità di apprendimento (learning skills): Lo studente svilupperà un'elevata capacità di apprendimento autonomo, essenziale per rimanere all'avanguardia nel Deep Learning avanzato. Sarà proattivo nell'identificare e assimilare nuove teorie, algoritmi e tecnologie, sfruttando autonomamente risorse complesse come articoli di ricerca e tutorial. Questa competenza lo preparerà a intraprendere percorsi di ricerca e sviluppo avanzati, affrontando le sfide future dell'intelligenza artificiale.
Modalità di svolgimento dell'insegnamento
L’insegnamento si svolge tramite lezioni frontali e attività di laboratorio, che permetteranno l'applicazione pratica dei concetti teorici con esercitazioni e casi studio.
Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus.
Prerequisiti richiesti
Frequenza lezioni
Contenuti del corso
Testi di riferimento
1. Materiale fornito dal docente e distribuito tramite il sito del docente (http://antoninofurnari.github.io/) e il team con codice “cq90ptp”.
2. Bellet, A., Habrard, A., & Sebban, M. (2015). Metric learning. Morgan & Claypool Publishers.
3. Csurka, Gabriela. "Domain adaptation for visual applications: A comprehensive survey." arXiv preprint arXiv:1702.05374 (2017).
4. Wang, M., & Deng, W. (2018). Deep visual domain adaptation: A survey. Neurocomputing, 312, 135-153.
5. Gou, Jianping, et al. "Knowledge distillation: A survey." International Journal of Computer Vision 129.6 (2021): 1789-1819.
6. Chen, Y., Mancini, M., Zhu, X., & Akata, Z. (2022). Semi-supervised and unsupervised deep visual learning: A survey. IEEE transactions on pattern analysis and machine intelligence, 46(3), 1327-1347.
7. Gui, J., Chen, T., Zhang, J., Cao, Q., Sun, Z., Luo, H., & Tao, D. (2024). A survey on self-supervised learning: Algorithms, applications, and future trends. IEEE Transactions on Pattern Analysis and Machine Intelligence.
8. Jabeen, Summaira, et al. "A review on methods and applications in multimodal deep learning." ACM Transactions on Multimedia Computing, Communications and Applications 19.2s (2023): 1-41.
9. Gao, J., Li, P., Chen, Z., & Zhang, J. (2020). A survey on deep learning for multimodal data fusion. Neural Computation, 32(5), 829-864.
10. Zhang, D., Yu, Y., Dong, J., Li, C., Su, D., Chu, C., & Yu, D. (2024). Mm-llms: Recent advances in multimodal large language models. arXiv preprint arXiv:2401.13601.
11. Patro, Badri Narayana, and Vijay Srinivas Agneeswaran. "Mamba-360: Survey of state space models as transformer alternative for long sequence modelling: Methods, applications, and challenges." arXiv preprint arXiv:2404.16112 (2024).
12. Barto, A. G. (2021). Reinforcement learning: An introduction. by richard’s sutton. SIAM Rev, 6(2), 423.
Programmazione del corso
| Argomenti | Riferimenti testi | |
|---|---|---|
| 1 | Metric Learning: introduzione e definizione del problema | [1] [2] (Capitoli 1,2,9) |
| 2 | Principali approcci di Deep Metric Learning | [1,2] |
| 3 | Introduzione al problema della Domain Adaptation | [1] |
| 4 | Principali metodi di Deep Domain Adaptation | [1,3,4] |
| 5 | Knowledge Distillation: principi e applicazioni | [1,5] |
| 6 | Principali metodi di Knowledge Distillation | [1,5] |
| 7 | Apprendimento di rappresentazioni non supervisionato | [1,6] |
| 8 | Principali metodi di deep unsupervised learning | [1,6] |
| 9 | Principali metodi di deep self-supervised learning | [1,7] |
| 10 | Learning multimodale: sfide e applicazioni | [1,8,9] |
| 11 | Modelli multimodali basati su video: principali task, benchmarks e tecniche | [1,8,9] |
| 12 | Modelli multimodali basate su visione e lingua: principali task, benchmarks e tecniche | [1,8,9] |
| 13 | Modelli efficienti per il deep sequential modeling avanzato | [1,10] |
| 14 | Deep sequential modeling online ed efficiente: task, applicazioni e sfide | [1,10] |
| 15 | Online transformers and state space models per deep sequential modeling | [1,10] |
| 16 | Deep Reinforcement learning | [1,11] |
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
L’esame del corso “Deep Learning” si compone di due esami individuali, associati ai due moduli. A ciascun esame viene assegnato un voto individuale. Il voto dell’esame complessivo è ottenuto come media dei voti associati ai due moduli “Core models and methods” e “Advanced models and methods”.
L’esame del modulo “Core models and methods” consiste in una prova scritta e in un progetto individuale o di gruppo, generalmente consistente nell’implementazione e analisi di un modello avanzato di Deep Learning su un dataset reale. La prova scritta è volta a verificare la conoscenza teorica degli argomenti del corso, nonché le capacità espressive e la proprietà di linguaggio degli studenti. La prova scritta consiste generalmente in tre domande a risposta aperta. Il progetto valuterà l'applicazione delle conoscenze avanzate, l'autonomia, la qualità dell'implementazione e dell'analisi. Il progetto va svolto successivamente alla prova scritta. A ciascuna delle due prove è assegnato un punteggio in trentesimi e il voto finale assegnato al modulo è ottenuto mediante la media aritmetica dei due voti.
L’esame del modulo “Advanced models and methods” consiste in una prova scritta e in un progetto individuale o di gruppo, generalmente consistente nell’implementazione e analisi di un modello avanzato di Deep Learning su un dataset reale. La prova scritta è volta a verificare la conoscenza teorica degli argomenti del corso, nonché le capacità espressive e la proprietà di linguaggio degli studenti. La prova scritta consiste generalmente in un insieme di domande a risposta multipla e aperta. Il progetto valuterà l'applicazione delle conoscenze avanzate, l'autonomia, la qualità dell'implementazione e dell'analisi. Il progetto va svolto successivamente alla prova scritta. A ciascuna delle due prove è assegnato un punteggio in trentesimi e il voto finale assegnato al modulo è ottenuto mediante la media aritmetica dei due voti.
Le prove del modulo “Core models and methods” vanno sostenute prima delle prove del modulo “Advanced models and methods”.
Per l'attribuzione del voto finale si seguiranno di norma i seguenti criteri:
· Non approvato: lo studente non ha acquisito i concetti di base e non è in grado di svolgere il progetto.
· 18-23: lo studente dimostra padronanza minima dei concetti avanzati; progetto con carenze significative.
· 24-27: lo studente dimostra buona padronanza dei contenuti avanzati; progetto ben strutturato e analisi adeguata.
· 28-30 e lode: lo studente ha acquisito tutti i contenuti avanzati; progetto eccellente e innovativo, analisi completa, critica e senza errori, dimostrando piena autonomia.
Gli studenti con disabilità e/o DSA dovranno contattare con sufficiente anticipo il docente, il referente CInAP del DMI (prof.ssa Daniele) e il CInAP per fruire delle opportune misure compensative. La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere.
Esempi di domande e/o esercizi frequenti
· Illustrare il concetto di Metric Learning e il suo uso per migliorare sistemi di localizzazione basati su immagini.
· Spiegare la differenza tra Domain Adaptation e Transfer Learning tradizionale, descrivendo un algoritmo di Domain Adaptation basato su reti avversarie.
· Descrivere il concetto di Knowledge Distillation e come può essere utilizzata per migliorare l'efficienza di un modello.
· Spiegare i principi del Deep Unsupervised e Self-Supervised Representation Learning, evidenziandone le differenze e i benefici per i dati non etichettati.
· Spiegare l'importanza dell'allineamento tra modalità nei modelli multimodali.
· Illustrare i principali vantaggi dei modelli sequenziali ricorrenti basati su state space models.
· Illustrare i principi di base del Reinforcement Learning.
Si precisa che tali domande hanno carattere puramente indicativo: le domande proposte all'esame potranno divergere, anche in modo significativo.