Apache Spark Base
Descrizione
Azure Databricks è una piattaforma di analisi veloce, semplice e collaborativa che consente l'utilizzo di Apache Spark ed è integrata con i servizi e la sicurezza di Azure.
Questo corso fornirà le basi per avviare un ambiente ed elaborare in parallelo big data archiviati con una logica di distribuzione.
Target
Analisti
Prerequisiti
Conoscenza del linguaggio SQL
Programma Corso
Modulo 1
- Introduzione a Spark
- Architettura
- Le API disponibili
- Le strutture dati
- Muovere i primi passi con Spark in Python (pySpark)
- Piccola introduzione al linguaggio Python
- Trasformare i dati con Spark
- Esercitazioni
Modulo 2
- Effettuare trasformazioni e calcoli avanzati
- SparkSQL
- Spark Machine Learning
- Spark Streaming (cenni)
- Ottimizzare le prestazioni di Spark
- Esercitazioni