Confluent Administrator for Apache Kafka

Confluent Administrator for Apache Kafka

  • Codice
    DT0006
  • Prezzo
    1.590,00 €
  • Durata
    4 gg

Descrizione

Obiettivo del corso è preparare alla certificazione "Confluent Certified Administrator for Apache Kafka", si partirà dall'installazione e configurazione della piattaforma Confluent. Si procederà poi ad utilizzare gli strumenti di gestione confluent per eseguire Kafka più facilmente, oltre che Archiviare ed elaborare i dati del flusso in ingresso, ottimizzare e gestire i cluster Kafka.

Target

Sistemisti

Prerequisiti

  • Esperienze sistemistiche su sistemi Linux
  • Consigliate conoscenze sistemistiche di base

Programma Corso

Modulo 1: Introduzione all’ecosistema software Kafka

  • Il mondo Apache
  • Concetti Base della Messagistica
  • Principali modelli di Messagistica
  • Protocolli
  • Apache Kafka
  • Campi di applicazione
  • Kafka Connect
  • Schema Registry
  • REST Proxy
  • Ksql
  • Zookeeper
  • Introduzione alle Kafka Java Client APIs
    • Producer API
    • Consumer API
    • Streams API
    • Connect API
  • Installazione Ambiente
    • Installazione di Zookepeer
    • Installazione di Kafka
    • Installazione di altri moduli Confluent
    • Configurazione Java

Modulo 2: Kafka fundamentals

  • Publish/Subscribe Messaging e Streaming
  • Kafka’s Command Line Tools
  • Fundamentals
    • Apache Kafka architecture, design principles, and purposes
    • Distributed Systems - Scalability, Fault Tolerance, High Availability
    • Primary functions of: Producer, Consumer, Broker
    • Meaning of “immutable” log
    • Meaning of “committed”
    • Topics, Partitions
    • Essential services of Apache Zookeeper
    • Replication, Leaders, Followers
    • Kafka Messages, structure, make-up, metadata
    • Kafka Controller
    • Exactly Once Semantics
  • Brokers & Cluster
  • Il Flow completo di Kafka
  • Approfondimenti
    • Disk-Based Retention
    • Scalabilità
    • Alte performance
    • Security
  • Zookeeper

Modulo 3: Managing, configuring, and optimizing a cluster for performance

  • Startup sequence; component dependencies
  • How many partitions? Tradeoffs
  • Scalability factors
  • Sources and tools for monitoring; Display of metrics
  • InSyncReplicas (ISR); Fully and Under replicated, and offline
  • Consumer lag, Under/Over Consumption
  • Broker failure, detection, and recovery
  • Batching and its impacts/consequences
  • Determining and solving data imbalance across brokers
  • Impacts of average and maximum message sizes
  • Quotas
  • Tuning

Modulo 4: Kafka Avanzato

  • Brokers and Zookeeper
  •  CPU, RAM, network, storage considerations
  • Number of nodes
  • Rack awareness
  • Kafka Connect
    • Source and Sink Connectors
    • Scalability and High Availability
  • Business Continuity / DR
  • Data retention