Confluent Administrator for Apache Kafka

Descrizione

Obiettivo del corso è preparare alla certificazione "Confluent Certified Administrator for Apache Kafka", si partirà dall'installazione e configurazione della piattaforma Confluent. Si procederà poi ad utilizzare gli strumenti di gestione confluent per eseguire Kafka più facilmente, oltre che Archiviare ed elaborare i dati del flusso in ingresso, ottimizzare e gestire i cluster Kafka.

Target

Sistemisti

Prerequisiti

Esperienze sistemistiche su sistemi Linux
Consigliate conoscenze sistemistiche di base

Programma Corso

Modulo 1: Introduzione all’ecosistema software Kafka

Il mondo Apache
Concetti Base della Messagistica
Principali modelli di Messagistica
Protocolli
Apache Kafka
Campi di applicazione
Kafka Connect
Schema Registry
REST Proxy
Ksql
Zookeeper
Introduzione alle Kafka Java Client APIs

Producer API
Consumer API
Streams API
Connect API

Installazione Ambiente

Installazione di Zookepeer
Installazione di Kafka
Installazione di altri moduli Confluent
Configurazione Java

Modulo 2: Kafka fundamentals

Publish/Subscribe Messaging e Streaming
Kafka’s Command Line Tools
Fundamentals

Apache Kafka architecture, design principles, and purposes
Distributed Systems - Scalability, Fault Tolerance, High Availability
Primary functions of: Producer, Consumer, Broker
Meaning of “immutable” log
Meaning of “committed”
Topics, Partitions
Essential services of Apache Zookeeper
Replication, Leaders, Followers
Kafka Messages, structure, make-up, metadata
Kafka Controller
Exactly Once Semantics

Brokers & Cluster
Il Flow completo di Kafka
Approfondimenti

Disk-Based Retention
Scalabilità
Alte performance
Security

Zookeeper

Modulo 3: Managing, configuring, and optimizing a cluster for performance

Startup sequence; component dependencies
How many partitions? Tradeoffs
Scalability factors
Sources and tools for monitoring; Display of metrics
InSyncReplicas (ISR); Fully and Under replicated, and offline
Consumer lag, Under/Over Consumption
Broker failure, detection, and recovery
Batching and its impacts/consequences
Determining and solving data imbalance across brokers
Impacts of average and maximum message sizes
Quotas
Tuning

Modulo 4: Kafka Avanzato

Brokers and Zookeeper
CPU, RAM, network, storage considerations
Number of nodes
Rack awareness
Kafka Connect

Source and Sink Connectors
Scalability and High Availability

Business Continuity / DR
Data retention