Databricks

Databricks

  • Codice
    DT0286
  • Prezzo
    1.190,00 €
  • Durata
    2 gg

Descrizione

Il corso è strutturato in modo tale da fornire una breve panoramica del cloud di azure in modo tale da poter effettuare le corrette configurazioni propedeutiche all’utilizzo, l’installazione e la configurazione di Databricks, una piattaforma che offre strumenti che consentono di connettere le origini dati a un'unica piattaforma per elaborare, archiviare, condividere, analizzare, modellare e monetizzare i set di dati con soluzioni dalla BI all’intelligenza artificiale generativa.

Target

Professionisti IT, data scientist, data engineer e analisti

Prerequisiti

Conoscenza di base di programmazione, fondamenti di cloud computing

Programma Corso

Giorno 1

  • Il Cloud Computing ed Azure
  • Architettura di Azure ed i servizi principali
  • Azure ed i Data Services principali
  • Gestione dei gruppi di risorse in Azure
  • Gli Storage Accounts in Azure
  • Il Database Sql Server sul Cloud di Microsoft
  • Introduzione a DataBricks
  • Architettura DataBricks
  • Configurazione dell'ambiente
  • Installare e configurare Databricks
  • La UI di DataBricks e come navigare
  • Cosa sono i Workspace di DataBricks
  • Come creare un Workspace DataBricks
  • Data Management in DataBricks
  • Apache Spark al centro della piattaforma Azure DataBricks
  • Spark per alimentare i Cluster di calcolo e Sql WareHouse
  • Qual è la relazione tra Apache Spark e Azure DataBricks ?
  • Come funziona Apache Spark in Azure DataBricks
  • Perché utilizzare Apache Spark in Azure DataBricks

Giorno 2

  • Configurare le proprietà di Spark in DataBricks SQL
  • Collegare una fonte di dati Apache Spark
  • Comprensione delle colonne di base e dei tipi di dati
  • Gestione del File System nei Notebook
  • Gestione dei Jobs e dei Cluster
  • Creazione e configurazione di Cluster
  • Creazione di Job utilizzando il Notebook
  • Come eseguire un Job
  • Visualizzazione dei Job e dei dettagli
  • Introduzione a Delta Lake
  • Delta Lake, una evoluzione del Data Lake tra Big Data e Spark
  • Utilizzo di Delta Lake in Databricks
  • Caricamento dei dati in Delta Lake
  • Gestione dei dati in Delta Lake
  • Panoramica sulla sicurezza in Databricks
  • Gestione della sicurezza di Databricks
  • Gestione del Backup e del Recovery
  • Risoluzione dei problemi
  • Troubleshooting