DEEP LEARNING

Anno accademico 2025/2026 - Docente: ANTONINO FURNARI

Risultati di apprendimento attesi

Conoscenza e capacità di comprensione (knowledge and understanding): Al termine del corso, lo studente avrà una conoscenza approfondita dei modelli e metodi avanzati di Deep Learning, esplorando le frontiere di ricerca e applicazioni complesse. Comprenderà tecniche come Metric Learning, Domain Adaptation, Knowledge Distillation, Deep Unsupervised e Self-Supervised Representation Learning, Multimodal Learning, e Reinforcement Learning, sviluppando una comprensione critica delle loro basi teoriche e delle sfide attuali.

 

Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): Lo studente sarà in grado di applicare metodologie avanzate di Deep Learning per problemi complessi (apprendimento di rappresentazioni da dati non etichettati, trasferimento di conoscenze tra domini, comprensione di contenuti multimodali e integrazione delle modalità). Avrà le competenze per implementare e ottimizzare modelli per il Multimodal Learning, lavorare con architetture di grandi dimensioni e applicare tecniche di ottimizzazione come la Knowledge Distillation. Sarà inoltre in grado di comprendere e applicare i principi del Reinforcement Learning.

 

Autonomia di giudizio (making judgements):  Lo studente svilupperà una spiccata autonomia di giudizio nella valutazione e selezione di modelli e metodi avanzati di Deep Learning. Saprà analizzare criticamente la letteratura scientifica, identificando punti di forza e debolezza delle soluzioni e proponendo approcci innovativi. Acquisirà la capacità di prendere decisioni informate sull'applicabilità ed efficacia delle tecniche all'avanguardia in contesti reali, considerando implicazioni pratiche.

 

Abilità comunicative (communication skills): Lo studente sarà in grado di comunicare in modo esperto e appropriato concetti complessi legati ai modelli avanzati di Deep Learning. Saprà presentare in modo chiaro risultati progetti e analisi, usando un linguaggio tecnico accurato. Le abilità comunicative includeranno la capacità di discutere criticamente, collaborare in gruppi multidisciplinari e redigere documentazione tecnica e rapporti scientifici di alta qualità.

 

Capacità di apprendimento (learning skills): Lo studente svilupperà un'elevata capacità di apprendimento autonomo, essenziale per rimanere all'avanguardia nel Deep Learning avanzato. Sarà proattivo nell'identificare e assimilare nuove teorie, algoritmi e tecnologie, sfruttando autonomamente risorse complesse come articoli di ricerca e tutorial. Questa competenza lo preparerà a intraprendere percorsi di ricerca e sviluppo avanzati, affrontando le sfide future dell'intelligenza artificiale.

Modalità di svolgimento dell'insegnamento

L’insegnamento si svolge tramite lezioni frontali e attività di laboratorio, che permetteranno l'applicazione pratica dei concetti teorici con esercitazioni e casi studio.

 

Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus.

Prerequisiti richiesti

Solide basi di Deep Learning (reti neurali convoluzionali e ricorrenti, backpropagation, regolarizzazione) e familiarità con la programmazione scientifica in Python.

Frequenza lezioni

La regolare partecipazione alle lezioni non è obbligatoria ma vivamente raccomandata per una comprensione approfondita degli argomenti e delle metodologie.

Contenuti del corso

Il corso "Deep Learning: Advanced Models and Methods" esplora le attuali frontiere del Deep Learning. Si inizia con tecniche avanzate per migliorare la generalizzazione e l'efficienza dei modelli: Metric Learning (apprendimento di spazi di rappresentazione semantica) e Domain Adaptation (adattamento a dati provenienti da distribuzioni diverse). Verrà introdotta la Knowledge Distillation per trasferire conoscenze da modelli complessi a modelli più efficienti. Seguirà il modulo Unsupervised e Self-Supervised Representation Learning, cruciale per sfruttare grandi quantità di dati non etichettati per apprendere rappresentazioni significative. Ampio spazio sarà dedicato al Multimodal Learning, includendo metodi capaci di gestire dati che includono diverse modalità, quali immagini, video, audio, e testo. Verranno dunque trattati metodi avanzati di modellamento di dati sequenziali, quali gli state space models. Infine, si concluderà con un'introduzione ai principi e agli algoritmi fondamentali del Reinforcement Learning, con esempi di applicazione in contesti decisionali.

Testi di riferimento

1.     Materiale fornito dal docente e distribuito tramite il sito del docente (http://antoninofurnari.github.io/) e il team con codice “cq90ptp”.

2.     Bellet, A., Habrard, A., & Sebban, M. (2015). Metric learning. Morgan & Claypool Publishers.

3.     Csurka, Gabriela. "Domain adaptation for visual applications: A comprehensive survey." arXiv preprint arXiv:1702.05374 (2017).

4.     Wang, M., & Deng, W. (2018). Deep visual domain adaptation: A survey. Neurocomputing, 312, 135-153.

5.     Gou, Jianping, et al. "Knowledge distillation: A survey." International Journal of Computer Vision 129.6 (2021): 1789-1819.

6.     Chen, Y., Mancini, M., Zhu, X., & Akata, Z. (2022). Semi-supervised and unsupervised deep visual learning: A survey. IEEE transactions on pattern analysis and machine intelligence, 46(3), 1327-1347.

7.     Gui, J., Chen, T., Zhang, J., Cao, Q., Sun, Z., Luo, H., & Tao, D. (2024). A survey on self-supervised learning: Algorithms, applications, and future trends. IEEE Transactions on Pattern Analysis and Machine Intelligence.

8.     Jabeen, Summaira, et al. "A review on methods and applications in multimodal deep learning." ACM Transactions on Multimedia Computing, Communications and Applications 19.2s (2023): 1-41.

9.     Gao, J., Li, P., Chen, Z., & Zhang, J. (2020). A survey on deep learning for multimodal data fusion. Neural Computation, 32(5), 829-864.

10.   Zhang, D., Yu, Y., Dong, J., Li, C., Su, D., Chu, C., & Yu, D. (2024). Mm-llms: Recent advances in multimodal large language models. arXiv preprint arXiv:2401.13601.

11.   Patro, Badri Narayana, and Vijay Srinivas Agneeswaran. "Mamba-360: Survey of state space models as transformer alternative for long sequence modelling: Methods, applications, and challenges." arXiv preprint arXiv:2404.16112 (2024).

12.   Barto, A. G. (2021). Reinforcement learning: An introduction. by richard’s sutton. SIAM Rev, 6(2), 423.

Programmazione del corso

 ArgomentiRiferimenti testi
1Metric Learning: introduzione e definizione del problema [1] [2] (Capitoli 1,2,9)
2Principali approcci di Deep Metric Learning [1,2]
3Introduzione al problema della Domain Adaptation[1]
4Principali metodi di Deep Domain Adaptation[1,3,4]
5Knowledge Distillation: principi e applicazioni[1,5]
6Principali metodi di Knowledge Distillation[1,5]
7Apprendimento di rappresentazioni non supervisionato[1,6]
8Principali metodi di deep unsupervised learning[1,6]
9Principali metodi di deep self-supervised learning[1,7]
10Learning multimodale: sfide e applicazioni[1,8,9]
11Modelli multimodali basati su video: principali task, benchmarks e tecniche[1,8,9]
12Modelli multimodali basate su visione e lingua: principali task, benchmarks e tecniche[1,8,9]
13Modelli efficienti per il deep sequential modeling avanzato[1,10]
14Deep sequential modeling online ed efficiente: task, applicazioni e sfide[1,10]
15Online transformers and state space models per deep sequential modeling[1,10]
16Deep Reinforcement learning[1,11]

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

L’esame del corso “Deep Learning” si compone di due esami individuali, associati ai due moduli. A ciascun esame viene assegnato un voto individuale. Il voto dell’esame complessivo è ottenuto come media dei voti associati ai due moduli “Core models and methods” e “Advanced models and methods”.

L’esame del modulo “Core models and methods” consiste in una prova scritta e in un progetto individuale o di gruppo, generalmente consistente nell’implementazione e analisi di un modello avanzato di Deep Learning su un dataset reale. La prova scritta è volta a verificare la conoscenza teorica degli argomenti del corso, nonché le capacità espressive e la proprietà di linguaggio degli studenti. La prova scritta consiste generalmente in tre domande a risposta aperta. Il progetto valuterà l'applicazione delle conoscenze avanzate, l'autonomia, la qualità dell'implementazione e dell'analisi. Il progetto va svolto successivamente alla prova scritta. A ciascuna delle due prove è assegnato un punteggio in trentesimi e il voto finale assegnato al modulo è ottenuto mediante la media aritmetica dei due voti.

L’esame del modulo “Advanced models and methods” consiste in una prova scritta e in un progetto individuale o di gruppo, generalmente consistente nell’implementazione e analisi di un modello avanzato di Deep Learning su un dataset reale. La prova scritta è volta a verificare la conoscenza teorica degli argomenti del corso, nonché le capacità espressive e la proprietà di linguaggio degli studenti. La prova scritta consiste generalmente in un insieme di domande a risposta multipla e aperta. Il progetto valuterà l'applicazione delle conoscenze avanzate, l'autonomia, la qualità dell'implementazione e dell'analisi. Il progetto va svolto successivamente alla prova scritta. A ciascuna delle due prove è assegnato un punteggio in trentesimi e il voto finale assegnato al modulo è ottenuto mediante la media aritmetica dei due voti.

Le prove del modulo “Core models and methods” vanno sostenute prima delle prove del modulo “Advanced models and methods”.

 

Per l'attribuzione del voto finale si seguiranno di norma i seguenti criteri:

 

·       Non approvato: lo studente non ha acquisito i concetti di base e non è in grado di svolgere il progetto.

·       18-23: lo studente dimostra padronanza minima dei concetti avanzati; progetto con carenze significative.

·       24-27: lo studente dimostra buona padronanza dei contenuti avanzati; progetto ben strutturato e analisi adeguata.

·       28-30 e lode: lo studente ha acquisito tutti i contenuti avanzati; progetto eccellente e innovativo, analisi completa, critica e senza errori, dimostrando piena autonomia.

 

Gli studenti con disabilità e/o DSA dovranno contattare con sufficiente anticipo il docente, il referente CInAP del DMI (prof.ssa Daniele) e il CInAP per fruire delle opportune misure compensative. La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere.

Esempi di domande e/o esercizi frequenti

·       Illustrare il concetto di Metric Learning e il suo uso per migliorare sistemi di localizzazione basati su immagini.

·       Spiegare la differenza tra Domain Adaptation e Transfer Learning tradizionale, descrivendo un algoritmo di Domain Adaptation basato su reti avversarie.

·       Descrivere il concetto di Knowledge Distillation e come può essere utilizzata per migliorare l'efficienza di un modello.

·       Spiegare i principi del Deep Unsupervised e Self-Supervised Representation Learning, evidenziandone le differenze e i benefici per i dati non etichettati.

·       Spiegare l'importanza dell'allineamento tra modalità nei modelli multimodali.

·       Illustrare i principali vantaggi dei modelli sequenziali ricorrenti basati su state space models.

·       Illustrare i principi di base del Reinforcement Learning.

 

Si precisa che tali domande hanno carattere puramente indicativo: le domande proposte all'esame potranno divergere, anche in modo significativo.

ENGLISH VERSION