Omics Data Analysis
Anno accademico 2025/2026 - Docente: GIOVANNI MICALERisultati di apprendimento attesi
Di seguito sono elencati gli obiettivi formativi generali dell'insegnamento in termini di risultati di apprendimento attesi:
- Conoscenza e capacità di comprensione (knowledge and understanding): Il corso mira a formare le conoscenze e le competenze avanzate per l’analisi, l’integrazione e l’interpretazione di diverse tipologie di dati omici, inclusi dati genomici, trascrittomici, epigenomici, proteomici e metabolomici.
- Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): Lo studente acquisirà competenze pratiche riguardo ai modelli e agli algoritmi per l’analisi di dati omici, quali: variant calling, analisi di espressione differenziale, analisi di dati single-cell, analisi di arricchimento funzionale, peak calling, integrazione multi-omica e costruzione di workflow riproducibili.
- Autonomia di giudizio (making judgements): Attraverso esempi concreti e casi di studio, lo studente sarà in grado di elaborare autonomamente soluzioni a determinati problemi legati all'analisi dei dati multi-omici, scegliendo le pipeline più adeguate e valutando criticamente i risultati ottenuti.
- Abilità comunicative (communication skills): Lo studente acquisirà le necessarie abilità comunicative e di appropriatezza espressiva nell'impiego del linguaggio tecnico per descrivere e presentare in modo efficace i risultati di analisi complesse.
- Capacità di apprendimento (learning skills): Il corso si propone, come obiettivo, di fornire allo studente le necessarie metodologie teoriche e pratiche per poter affrontare e risolvere autonomamente nuove problematiche che dovessero sorgere durante una attività lavorativa, permettendogli di rimanere aggiornato sulle tecnologie e sugli algoritmi emergenti nel campo dell'analisi omica.
Modalità di svolgimento dell'insegnamento
Lezioni frontali con numerose esercitazioni pratiche al computer.
Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus.
Prerequisiti richiesti
- Programmazione (preferibilmente R o Python)
- Statistica di base
- Biologia Molecolare e Genetica
- Fondamenti di Bioinformatica
Frequenza lezioni
La frequenza a lezione è obbligatoria.
Per seguire meglio le lezioni, saranno messe a disposizione delle slide dal docente. Si ricorda che le slide non costituiscono un mezzo di studio, ma forniscono un compendio per aiutare nell'apprendimento dei concetti illustrati a lezione. Lo studio dei materiali forniti dal docente, dei testi consigliati e lo svolgimento degli esercizi è fondamentale per apprendere appieno i concetti illustrati durante le lezioni.
Contenuti del corso
Modulo 1 – Introduzione all’analisi multi-omica
- Panoramica dei dati omici e obiettivi del corso: Introduzione al corso e tipologie di dati omici. Motivazioni e sfide dell’integrazione multi-omica. Workflow e principi FAIR.
- Reperimento, formati e preprocessing dei dati: Formati standard (FASTQ, BAM, VCF, GTF, mzML). Database pubblici (GEO, SRA, ENCODE, PRIDE). Esercitazione: esplorazione di dataset multi-omici.
Modulo 2 – Genomica computazionale
- Analisi dei dati genomici: Richiami su varianti genomiche (SNV, indel, CNV, SV). Pipeline di variant calling (BWA, GATK). QC e filtraggio delle varianti.
- Interpretazione dei dati genomici: Annotazione funzionale (ANNOVAR, VEP) e interpretazione clinica (ClinVar, SIFT). Esercitazione: annotazione e visualizzazione di varianti.
- Metilazione del DNA e struttura della cromatina: DNA methylation (bisulfite-seq) e introduzione all’analisi epigenomica.
Modulo 3 – Interazioni DNA/RNA-proteina
- Analisi ChIP-seq: Concetti di arricchimento e peak calling (MACS2). Assegnazione dei picchi e annotazione funzionale.
- Tecnologie CLIP-seq e CLASH: Panoramica su PAR-CLIP, iCLIP. Interazioni miRNA-mRNA e identificazione di RBP target.
- Esercitazione su dati di interazione: Analisi e visualizzazione di binding sites e interazioni.
Modulo 4 – Trascrittomica bulk e arricchimento funzionale
- RNA-seq: pipeline di base: Allineamento, quantificazione e normalizzazione (STAR, Salmon, DESeq2).
- Differential expression e arricchimento funzionale: Analisi con DESeq2/edgeR. Arricchimento con GO, KEGG, GSEA.
- Visualizzazione trascrittomica: PCA, MA-plot, heatmap, volcano plot.
Modulo 5 – Single-Cell e Spatial Transcriptomics
- Introduzione alla scRNA-seq: Tecnologie, filtraggio, normalizzazione, UMAP/PCA.
- Clustering e identificazione di tipi cellulari: Pipeline Seurat/Scanpy. Analisi di Pseudotime e RNA Velocity.
- Spatial transcriptomics: Tecnologie (Visium, seqFISH) e integrazione con scRNA-seq.
Modulo 6 – Metabolomica e cenni di proteomica
- Dati metabolomici: Tecniche (LC-MS, NMR), preprocessing (XCMS), enrichment e pathway analysis.
- Introduzione alla proteomica: MS-based proteomics (DDA vs DIA). Software open source (MaxQuant, OpenMS).
Modulo 7 – Integrazione multi-omica
- Approcci all’integrazione: Early, intermediate, late integration. Problemi di scaling e batch effect.
- Metodi computazionali per l’integrazione: iCluster, MOFA, mixOmics. Integrazione multiome (RNA + ATAC).
Modulo 8 – Interpretazione biologica e casi studio
- Casi studio: cancro e immunologia: Pan-cancer analysis, immunoterapia e dati multi-omici.
- Visualizzazione e narrazione scientifica: ggplot2, Shiny, plotly. Presentazione efficace di dati integrati.
- Casi studio: malattie metaboliche e neurologiche: Alzheimer, diabete. Prospettive multi-omiche.
Testi di riferimento
Data la natura avanzata della materia, il materiale principale sarà costituito dalle slide fornite dal docente e da articoli scientifici di riferimento. Si consigliano i seguenti testi per approfondimenti:
- “Modern Statistics for Modern Biology”. Autori: Susan Holmes, Wolfgang Huber. Editore: Cambridge University Press (2019).
- “Bioinformatics Data Skills”. Autore: Vince Buffalo. Editore: O'Reilly Media (2015).
- "R for Data Science". Autori: Hadley Wickham, Garrett Grolemund. Editore: O'Reilly Media (2017).
Altre risorse aggiornate saranno indicate dal docente nelle slides utilizzate a lezione.
Programmazione del corso
Argomenti | Riferimenti testi | |
---|---|---|
1 | Introduzione all'analisi multi-omica | |
2 | Genomica computazionale | |
3 | Interazioni DNA/RNA-proteina | |
4 | Trascrittomica bulk e arricchimento funzionale | |
5 | Single-Cell e Spatial Transcriptomics | |
6 | Metabolomica e cenni di proteomica | |
7 | Integrazione multi-omica | |
8 | Interpretazione biologica e casi studio |
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
L'esame finale consiste in una prova scritta e un colloquio orale nel quale sarà discusso un progetto concordato tra il docente e lo studente.
- La prova scritta e il colloquio orale avranno una valutazione in trentesimi e la valutazione finale sarà ottenuta come media pesata tra valutazione della prova scritta (peso: 25% del voto finale) e valutazione della prova orale (peso: 75% del voto finale).
- La prova scritta è costituita da una domanda di teoria su argomenti del corso che lo studente dovrà argomentare per mostrare un'ampia comprensione della materia.
- Il voto minimo per superare la prova scritta è 18/30. Chi non supera la prova scritta, non potrà sostenere l'orale. La prova scritta può essere visionata insieme al docente in qualunque momento.
- Il voto minimo per considerare superato l'esame finale è di 18/30.
- Il progetto dovrà essere completato entro 1 mese dal superamento della prova scritta. Il progetto potrà essere concordato con il docente in qualunque momento. In caso di rifiuto del voto scritto, la valutazione del progetto sarà conservata per tutto l'anno accademico. In caso di rifiuto del voto finale lo studente dovrà sostenere nuovamente tutta la prova (scritto e progetto).
- Gli orari e i luoghi di svolgimento delle prove saranno comunicati mediante i mezzi previsti dall’ateneo.
Note:
- È vietato l'uso di qualsiasi strumento hardware (calcolatrici, tablet, smartphone, cellulari, auricolari BT etc.), di libri o documenti personali durante l'esame scritto.
- Per sostenere gli esami è obbligatorio prenotarsi utilizzando gli appositi strumenti previsti dall’ateneo.
- Non sono ammesse prenotazioni tardive tramite email. In mancanza di prenotazione, l'esame non potrà essere verbalizzato.
- La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere.