Computational Genomics
Modulo Genomics Data Analysis

Anno accademico 2025/2026 - Docente: MARCO FICHERA

Risultati di apprendimento attesi

Conoscenza e capacità di comprensione (knowledge and understanding): Al termine del corso lo studente avrà acquisito solide conoscenze teoriche sui principali metodi bioinformatici per l’analisi di dati genomici, inclusi sequenziamento massivo (NGS), identificazione di varianti, analisi di espressione genica e bioinformatica strutturale. Avrà compreso le basi degli algoritmi, le loro applicazioni e i limiti metodologici e computazionali nel contesto della genomica

Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): Lo studente saprà utilizzare software bioinformatici specifici per l'analisi e interpretazione di dati genomici. Sarà in grado di implementare pipeline computazionali per la rilevazione di varianti genetiche, analisi trascrittomiche e interpretazione funzionale dei dati prodotti, applicando queste competenze a casi concreti e dataset reali.

Autonomia di giudizio (making judgements): Lo studente svilupperà la capacità di valutare criticamente i risultati ottenuti dalle analisi genomiche, selezionando metodi appropriati in base alla tipologia di dato disponibile e agli obiettivi dello studio. Saprà inoltre identificare eventuali limitazioni tecniche e interpretative dei risultati ottenuti.

Abilità comunicative (communication skills): Lo studente acquisirà competenze nella comunicazione efficace dei risultati derivanti da analisi genomiche, utilizzando un linguaggio tecnico-scientifico appropriato sia in forma scritta (report e articoli scientifici) sia orale (presentazioni e discussioni scientifiche).

Capacità di apprendimento (learning skills): Lo studente acquisirà le capacità di aggiornamento autonomo nel campo della genomica computazionale, sapendo consultare la letteratura scientifica, le risorse online e le banche dati per approfondire le proprie competenze e restare aggiornato sugli sviluppi metodologici e tecnologici.

Modalità di svolgimento dell'insegnamento

Le lezioni si svolgeranno in presenza, con modalità frontale e attività pratiche di laboratorio informatico. È prevista l’esposizione teorica da parte del docente con supporto di slide, tutorial guidati ed esercitazioni pratiche su casi reali. La partecipazione attiva degli studenti sarà incoraggiata attraverso momenti di discussione e problem solving in aula. Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus.

Prerequisiti richiesti

Conoscenze di base di biologia molecolare, genetica e statistica. Familiarità di base con l’ambiente Linux è fortemente raccomandata

Frequenza lezioni

Per una comprensione approfondita degli argomenti trattati e delle metodologie presentate, si raccomanda vivamente la regolare partecipazione alle lezioni.

Contenuti del corso

Dopo un breve richiamo ai concetti fondamentali della genetica medica per garantire una comprensione comune delle basi teoriche necessarie, il corso affronterà in modo integrato teoria e pratica della genomica computazionale. Saranno trattati gli approcci algoritmici per il sequenziamento massivo (WES, WGS, RNA-seq) tramite short e long-reads, includendo il controllo qualità delle sequenze e la mappatura del genoma di riferimento.

Particolare attenzione sarà dedicata all’identificazione e annotazione delle varianti genetiche, includendo il calling bayesiano delle varianti per la stima accurata della probabilità di errore e l'affidabilità delle chiamate e la previsione in silico del loro impatto funzionale tramite programmi previsionali e consultazione di database genomici. Gli studenti apprenderanno le tecniche avanzate per l'analisi differenziale dell'espressione genica tramite RNA-seq e le pipeline bioinformatiche associate

Saranno esplorate le tecniche bioinformatiche per l'analisi di dati epigenomici, con focus sulla metilazione del DNA, e la loro correlazione con la regolazione dell’espressione genica.

Testi di riferimento

Dispense fornite dal docente

Programmazione del corso

	Argomenti	Riferimenti testi
1	Introduzione alle basi della Genetica Medica
2	Introduzione alla genomica computazionale
3	Varianti genetiche e genomiche
4	Database genomici
5	Principi di NGS e tecnologie correlate
6	Assemblaggio e mappatura di sequenze
7	Identificazione e annotazione di varianti
8	Interpretazione funzionale delle varianti
9	Analisi dell’espressione genica
10	Metodi per l’identificazione di varianti strutturali
11	Analisi differenziale e funzionale dei dati trascrittomici
12	Epigenomica computazionale

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

La verifica dell’apprendimento prevede una prova orale con domande teoriche e pratiche su pipeline analitiche e interpretazione di risultati computazionali volte all’approndimento delle capacità di ragionamento e analisi critica dello studente nonché all’adeguatezza del linguaggio tecnico utilizzato.

Tale prova potrà avere luogo per via telematica, qualora le condizioni lo dovessero richiedere.

Per l'attribuzione del voto finale si seguiranno di norma i seguenti criteri:
- non approvato: lo studente non ha acquisito i concetti di base e non è in grado di svolgere gli esercizi.
- 18-23: lo studente dimostra una padronanza minima dei concetti di base, le sue capacità di esposizione e di collegamento dei contenuti sono modeste, riesce a risolvere semplici esercizi.
- 24-27: lo studente dimostra una buona padronanza dei contenuti del corso, le sue capacità di esposizione e di collegamento dei contenuti sono buone, risolve gli esercizi con pochi errori.
- 28-30 e lode: lo studente ha acquisito tutti i contenuti del corso ed è in grado di esporli compiutamente e di collegarli con spirito critico; risolve gli esercizi in modo completo e senza errori.

Gli studenti con disabilità e/o DSA dovranno contattare con sufficiente anticipo rispetto alla data dell'esame il docente, il referente CInAP del DMI (prof.ssa Daniele) e il CInAP per comunicare che intendono sostenere l'esame fruendo delle opportune misure compensative.

Esempi di domande e/o esercizi frequenti

1. Descrivere i passaggi principali per il calling bayesiano delle varianti da dati di sequenziamento massivo.

2. Come valuteresti l'affidabilità di una variante identificata tramite RNA-seq? Quali sono i principali fattori che influenzano la qualità dei risultati?

3. Quali sono le principali differenze metodologiche tra sequenziamento short-read e long-read, e in quali scenari applicativi ciascuno risulta più vantaggioso?

4. Che cos'è il Phred quality score e in che modo influisce sull'affidabilità delle basi chiamate nei dati di sequenziamento

Si precisa che tali domande hanno carattere puramente indicativo: le domande effettivamente proposte in sede d’esame potranno divergere, anche in modo significativo, da quelle riportate in questa lista.

ENGLISH VERSION

Corso di laurea magistrale in

Informatica

Computational Genomics
Modulo Genomics Data Analysis

Risultati di apprendimento attesi

Modalità di svolgimento dell'insegnamento

Prerequisiti richiesti

Frequenza lezioni

Contenuti del corso

Testi di riferimento

Programmazione del corso

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

Esempi di domande e/o esercizi frequenti

Dipartimento di

Matematica e Informatica

Dove siamo

Contatti

Corso di laurea magistrale in

Informatica

Computational GenomicsModulo Genomics Data Analysis

Risultati di apprendimento attesi

Modalità di svolgimento dell'insegnamento

Prerequisiti richiesti

Frequenza lezioni

Contenuti del corso

Testi di riferimento

Programmazione del corso

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

Esempi di domande e/o esercizi frequenti

Dipartimento di

Matematica e Informatica

Computational Genomics
Modulo Genomics Data Analysis