AUDIO PROCESSING

Anno accademico 2022/2023 - Docente: FILIPPO LUIGI MARIA MILOTTA

Risultati di apprendimento attesi

Il corso fornisce un’introduzione al mondo dell’Audio Processing (Elaborazione di segnali audio) attraverso approfondimenti mirati in Acustica, Psicoacustica, Digitalizzazione dell’audio, Compressione dell’audio, Formati audio e librerie utili per la programmazione orientata al trattamento dei segnali sonori.
Durante il corso sono previsti approfondimenti integrativi su argomenti come le soglie di tolleranza al rumore sul posto di lavoro, l’impatto di Shannon sulla materia, o il tool ffmpeg per la gestione degli stream audio/video.
Inoltre, sulla base della positiva esperienza degli anni precedenti del corso, ulteriori argomenti integrativi verranno presentati nella forma di seminari integrativi.

Obiettivi formativi generali dell'insegnamento in termini di risultati di apprendimento attesi.

  1. Conoscenza e capacità di comprensione (knowledge and understanding): l'obiettivo del corso è quello di far acquisire conoscenze che consentano allo studente di comprendere i meccanismi teorici e fisici che stanno alla base del sistema uditivo umano, della formazione ed elaborazione del suono e dei segnali audio, del miglioramento della qualità dei segnali audio.
  2. Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): lo studente acquisirà le competenze necessarie per acquisire, editare, comprimere e salvare un segnale audio. In particolare una parte del corso sarà relativa all'approfondimento di software specifici per applicare tali conoscenze teoriche.
  3. Autonomia di giudizio (making judgements): Attraverso esempi in aula lo studente sarà messo nelle condizioni di comprendere se le soluzioni da lui proposte soddisfano un certo grado di qualità.
  4. Abilità comunicative (communication skills): lo studente acquisirà le necessarie abilità comunicative e la proprietà di linguaggio tecnico nell'ambito del settore dell'Informatica Musicale.
  5. Capacità di apprendimento (learning skills): il corso si propone, come obiettivo, di fornire allo studente le necessarie metodologie teoriche e pratiche per poter affrontare e risolvere autonomamente nuove problematiche che dovessero sorgere durante una attività lavorativa. A tale scopo diversi argomenti saranno trattati a lezione coinvolgendo lo studente nella ricerca di possibili soluzioni a problemi reali.

Modalità di svolgimento dell'insegnamento

Didattica Frontale

Autovalutazioni disponibili online e ripetute in Aula

Esercitazioni laboratoriali in Aula

Seminari integrativi

Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus

Prerequisiti richiesti

Non ci sono requisiti specifici.

Risulteranno utili conoscenze di fisica, elettronica, acustica, psicoacustica e programmazione I.

Frequenza lezioni

E' fortemente consigliata la frequenza delle lezioni.

Contenuti del corso

  • Acustica
    • Differenza fra suono e audio
    • Definizioni delle proprietà fisiche delle onde
    • Root Mean Square (RMS)
    • Decibel
    • Legge dell’inverso del quadrato
    • Velocità del suono
    • Rifrazione, Riflessione, Diffrazione, Eco, Effetto Doppler, Bang Supersonico
    • Ottave in scala diatonica e temperata
    • Introduzione all’analisi di Fourier
    • Ampiezza e inviluppo
    • Rumori colorati
  • Psicoacustica
    • Fisica e cognizione, fisiologia dell’udito
    • Soglie di tolleranza al rumore sul posto di lavoro
    • Parametri della percezione
    • Diagramma di Fletcher-Munson
    • Timbro e formanti
    • Bande critiche uditive
    • Mascheramento tonale e non tonale
    • Localizzazione delle sorgenti sonore
  • Digitalizzazione
    • Rappresentazione digitale del suono
    • Indice SNR
    • Campionamento e Aliasing
    • Quantizzazione
    • Rumore SNR e SQNR
    • Codifica del segnale audio
    • Codifica PCM
    • Codici ECC e bit di parità
    • Rappresentazioni dell’ampiezza della forma d’onda
    • Equalizzatori grafici e parametrici
    • Filtri: HPF, LPF, Shelving, Peaking, Telephone, Walkie-Talkie, ecc.
    • Operazioni e operatori sul range dinamico
  • Compressione
    • Compressione del silenzio
    • Spazio occupato in memoria
    • Codifiche μ-law e A-law
    • Ri-Quantizzazione
    • Codifiche DPCM e ADPCM
    • Fattori di compressione
    • Entropia percettiva
    • La tecnica Compansion
    • Compressione di tipo percettivo: Block Coding, Transform Coding, Sub-band Coding e Huffman Coding
  • Formati Audio
    • Formato MPEG e le sue varianti più importanti
    • MP1, MP2 e MP3
    • Formati audio avanzati
    • Il tool FFmpeg
    • Protocollo MIDI e messaggi MIDI
  • Librerie Audio utili e script di interesse
    • Conversione di formato audio usando FFmpeg
    • Laboratorio Python
    • Lettura, conversione, elaborazione e scrittura di un file audio
  • Seminari integrativi

Testi di riferimento

  1. Lombardo, V., & Valle, A. (2014). Audio e Multimedia (IV ed.) Apogeo.
  2. For international students: Kirk, R. & Hunt, A. (1999). Digital Sound Processing for Music and Multimedia Focal Press.
  3. Tarabella, L. (2014). Musica Informatica Apogeo.
  4. Rocchesso, D. (2003). Sound Processing

Programmazione del corso

 ArgomentiRiferimenti testi
1AcusticaCapitolo 1 di "Audio e Multimedia"
2PsicoacusticaCapitolo 2 di "Audio e Multimedia"
3DigitalizzazioneCapitolo 3 di "Audio e Multimedia"
4CompressioneCapitolo 4 di "Audio e Multimedia"
5MIDICapitolo 6 di "Audio e Multimedia"
6MPEGCapitolo 4 di "Audio e Multimedia"
7Laboratorio PythonOnline / Script condivisi
8Seminari sugli argomenti del corsoOnline / Dispense
9ERASMUS STUDENTSDigital Sound Processing for Music and Multimedia, Ross Kirk, Andy Hunt

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

Occorre superare obbligatoriamente le seguenti prove:

1. Esame scritto

E' possibile sostenere in maniera opzionale le seguenti prove:

2. Colloquio orale

Non è prevista alcuna prova in itinere (su richiesta degli studenti, sarà possibile svolgere un'esercitazione sugli argomenti nella prima parte del corso nel periodo di sospensione delle lezioni per prove in itinere previsto dal Corso di Laurea).

La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere. In tal caso l'esame verrà strutturato con un colloquio orale e da eventuali domande a risposta multipla ed esercizi.

Learning assessment may also be carried out on line, should the conditions require it.

Esempi di domande e/o esercizi frequenti

  • A quale livello SPL è fissata la soglia del dolore?
  • Fissata a 98Hz la frequenza del SOL2 (cioè il SOL della 2^ ottava, con ottave che iniziano e terminano con Do), calcolare quanto valgono, rispettivamente: SOL0, SOL1, SOL3, SOL4
  • Nel grafico di Fletcher-Munson, dove si trovano i suoni che hanno bisogno di più energia per essere percepiti?
  • Quanto è grande la larghezza di banda critica per un segnale con una frequenza maggiore di 15kHz?
  • Quali sono i 3 componenti principali di un dispositivo di digitalizzazione?
  • Riportare l’equazione sinusoidale di un’onda con ampiezza 4, frequenza 0.5, fase -1.
  • Dati i seguenti valori campionati di ampiezza [-3, 3, -3], calcolare l’RMS.
  • A che temperatura il suono viaggia nell'aria se ha una velocità di 270 m/s?
  • Quando si verifica lo stato di “Campionamento critico”?
  • Dato un tasso di campionamento pari a 90kHz e una PCM a 16bit, quanti byte servono per memorizzare un audio stereo di 5 secondi?

L'elenco di esercizi pratici è presente su Studium. Sono disponibili dei test di autovalutazione reperibili dalla homepage del docente.