Computational GenomicsModulo Genomics Data Analysis
Anno accademico 2025/2026 - Docente: Marco FICHERARisultati di apprendimento attesi
Conoscenza e capacità di comprensione (knowledge and understanding): Al termine del corso lo studente avrà acquisito solide conoscenze teoriche sui principali metodi bioinformatici per l’analisi di dati genomici, inclusi sequenziamento massivo (NGS), identificazione di varianti, analisi di espressione genica e bioinformatica strutturale. Avrà compreso le basi degli algoritmi, le loro applicazioni e i limiti metodologici e computazionali nel contesto della genomica
Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): Lo studente saprà utilizzare software bioinformatici specifici per l'analisi e interpretazione di dati genomici. Sarà in grado di implementare pipeline computazionali per la rilevazione di varianti genetiche, analisi trascrittomiche e interpretazione funzionale dei dati prodotti, applicando queste competenze a casi concreti e dataset reali.
Autonomia di giudizio (making judgements): Lo studente svilupperà la capacità di valutare criticamente i risultati ottenuti dalle analisi genomiche, selezionando metodi appropriati in base alla tipologia di dato disponibile e agli obiettivi dello studio. Saprà inoltre identificare eventuali limitazioni tecniche e interpretative dei risultati ottenuti.
Abilità comunicative (communication skills): Lo studente acquisirà competenze nella comunicazione efficace dei risultati derivanti da analisi genomiche, utilizzando un linguaggio tecnico-scientifico appropriato sia in forma scritta (report e articoli scientifici) sia orale (presentazioni e discussioni scientifiche).
Capacità di apprendimento (learning skills): Lo studente acquisirà le capacità di aggiornamento autonomo nel campo della genomica computazionale, sapendo consultare la letteratura scientifica, le risorse online e le banche dati per approfondire le proprie competenze e restare aggiornato sugli sviluppi metodologici e tecnologici.
Modalità di svolgimento dell'insegnamento
Le lezioni si svolgeranno in presenza, con modalità frontale e attività pratiche di laboratorio informatico. È prevista l’esposizione teorica da parte del docente con supporto di slide, tutorial guidati ed esercitazioni pratiche su casi reali. La partecipazione attiva degli studenti sarà incoraggiata attraverso momenti di discussione e problem solving in aula. Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus.
Prerequisiti richiesti
Conoscenze di base di biologia molecolare, genetica e statistica. Familiarità di base con l’ambiente Linux è fortemente raccomandata
Frequenza lezioni
Per una comprensione approfondita degli argomenti trattati e delle metodologie presentate, si raccomanda vivamente la regolare partecipazione alle lezioni.
Contenuti del corso
Contenuti del corso
Dopo un breve richiamo ai concetti fondamentali della genetica medica per garantire una comprensione comune delle basi teoriche necessarie, il corso affronterà in modo integrato teoria e pratica della genomica computazionale. Saranno trattati gli approcci algoritmici per il sequenziamento massivo (WES, WGS, RNA-seq) tramite short e long-reads, includendo il controllo qualità delle sequenze e la mappatura del genoma di riferimento.
Particolare attenzione sarà dedicata all’identificazione e annotazione delle varianti genetiche, includendo il calling bayesiano delle varianti per la stima accurata della probabilità di errore e l'affidabilità delle chiamate e la previsione in silico del loro impatto funzionale tramite programmi previsionali e consultazione di database genomici. Gli studenti apprenderanno le tecniche avanzate per l'analisi differenziale dell'espressione genica tramite RNA-seq e le pipeline bioinformatiche associate
Saranno esplorate le tecniche bioinformatiche per l'analisi di dati epigenomici, con focus sulla metilazione del DNA, e la loro correlazione con la regolazione dell’espressione genica.
Testi di riferimento
Programmazione del corso
Argomenti | Riferimenti testi | |
---|---|---|
1 | Introduzione alle basi della Genetica Medica | |
2 | Introduzione alla genomica computazionale | |
3 | Varianti genetiche e genomiche | |
4 | Database genomici | |
5 | Principi di NGS e tecnologie correlate | |
6 | Assemblaggio e mappatura di sequenze | |
7 | Identificazione e annotazione di varianti | |
8 | Interpretazione funzionale delle varianti | |
9 | Analisi dell’espressione genica | |
10 | Metodi per l’identificazione di varianti strutturali | |
11 | Analisi differenziale e funzionale dei dati trascrittomici | |
12 | Epigenomica computazionale |
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
La verifica dell’apprendimento prevede una prova orale con domande teoriche e pratiche su pipeline analitiche e interpretazione di risultati computazionali volte all’approndimento delle capacità di ragionamento e analisi critica dello studente nonché all’adeguatezza del linguaggio tecnico utilizzato.
Tale prova potrà avere luogo per via telematica, qualora le condizioni lo dovessero richiedere.
Per
l'attribuzione del voto finale si seguiranno di norma i seguenti criteri:
- non approvato: lo studente non ha acquisito i concetti di base e non è in
grado di svolgere gli esercizi.
- 18-23: lo studente dimostra una padronanza minima dei concetti di base, le
sue capacità di esposizione e di collegamento dei contenuti sono modeste,
riesce a risolvere semplici esercizi.
- 24-27: lo studente dimostra una buona padronanza dei contenuti del
corso, le sue capacità di esposizione e di collegamento dei contenuti sono
buone, risolve gli esercizi con pochi errori.
- 28-30 e lode: lo studente ha acquisito tutti i contenuti del corso ed è in
grado di esporli compiutamente e di collegarli con spirito critico; risolve gli
esercizi in modo completo e senza errori.
Gli studenti con disabilità e/o DSA dovranno contattare con sufficiente anticipo rispetto alla data dell'esame il docente, il referente CInAP del DMI (prof.ssa Daniele) e il CInAP per comunicare che intendono sostenere l'esame fruendo delle opportune misure compensative.
Esempi di domande e/o esercizi frequenti
1. Descrivere i passaggi principali per il calling bayesiano delle varianti da dati di sequenziamento massivo.
2. Come valuteresti l'affidabilità di una variante identificata tramite RNA-seq? Quali sono i principali fattori che influenzano la qualità dei risultati?
3. Quali sono le principali differenze metodologiche tra sequenziamento short-read e long-read, e in quali scenari applicativi ciascuno risulta più vantaggioso?
4. Che cos'è il Phred quality score e in che modo influisce sull'affidabilità delle basi chiamate nei dati di sequenziamento
Si precisa che tali domande hanno carattere puramente indicativo: le domande effettivamente proposte in sede d’esame potranno divergere, anche in modo significativo, da quelle riportate in questa lista.