Data Engineer - Big Data & GCP

  • Progettare e sviluppare pipeline di elaborazione dati batch e streaming con Apache Beam e Apache Spark su Google Cloud Dataproc.
  • Modellare, ottimizzare e interrogare dataset di grandi dimensioni su BigQuery, con attenzione a costi e performance.
  • Lavorare con BigQuery Studio per esplorazione dati, sviluppo di notebook analitici e collaborazione con i team di Data Science e Analytics.
  • Integrare sorgenti dati eterogenee (database relazionali, API, event stream) nelle pipeline GCP.
  • Monitorare la qualità dei dati, implementare test e alert sulle pipeline in produzione.
  • Collaborare con il team di Data Science per rendere i dati disponibili, affidabili e ben documentati.
  • Contribuire alla definizione degli standard di data engineering del team: naming convention, data catalog, lineage.