Confluent Administrator for Apache Kafka
Descrizione
Obiettivo del corso è preparare alla certificazione "Confluent Certified Administrator for Apache Kafka", si partirà dall'installazione e configurazione della piattaforma Confluent. Si procederà poi ad utilizzare gli strumenti di gestione confluent per eseguire Kafka più facilmente, oltre che Archiviare ed elaborare i dati del flusso in ingresso, ottimizzare e gestire i cluster Kafka.
Target
Sistemisti
Prerequisiti
- Esperienze sistemistiche su sistemi Linux
- Consigliate conoscenze sistemistiche di base
Programma Corso
Modulo 1: Introduzione all’ecosistema software Kafka
- Il mondo Apache
- Concetti Base della Messagistica
- Principali modelli di Messagistica
- Protocolli
- Apache Kafka
- Campi di applicazione
- Kafka Connect
- Schema Registry
- REST Proxy
- Ksql
- Zookeeper
- Introduzione alle Kafka Java Client APIs
- Producer API
- Consumer API
- Streams API
- Connect API
- Installazione Ambiente
- Installazione di Zookepeer
- Installazione di Kafka
- Installazione di altri moduli Confluent
- Configurazione Java
Modulo 2: Kafka fundamentals
- Publish/Subscribe Messaging e Streaming
- Kafka’s Command Line Tools
- Fundamentals
- Apache Kafka architecture, design principles, and purposes
- Distributed Systems - Scalability, Fault Tolerance, High Availability
- Primary functions of: Producer, Consumer, Broker
- Meaning of “immutable” log
- Meaning of “committed”
- Topics, Partitions
- Essential services of Apache Zookeeper
- Replication, Leaders, Followers
- Kafka Messages, structure, make-up, metadata
- Kafka Controller
- Exactly Once Semantics
- Brokers & Cluster
- Il Flow completo di Kafka
- Approfondimenti
- Disk-Based Retention
- Scalabilità
- Alte performance
- Security
- Zookeeper
Modulo 3: Managing, configuring, and optimizing a cluster for performance
- Startup sequence; component dependencies
- How many partitions? Tradeoffs
- Scalability factors
- Sources and tools for monitoring; Display of metrics
- InSyncReplicas (ISR); Fully and Under replicated, and offline
- Consumer lag, Under/Over Consumption
- Broker failure, detection, and recovery
- Batching and its impacts/consequences
- Determining and solving data imbalance across brokers
- Impacts of average and maximum message sizes
- Quotas
- Tuning
Modulo 4: Kafka Avanzato
- Brokers and Zookeeper
- CPU, RAM, network, storage considerations
- Number of nodes
- Rack awareness
- Kafka Connect
- Source and Sink Connectors
- Scalability and High Availability
- Business Continuity / DR
- Data retention