Data Universe
Newsletter
AccueilOutilsApache Kafka
Apache Kafka logo

Apache Kafka

Streaming

La plateforme de streaming d'événements distribuée

Tarif

Open source gratuit / Confluent Cloud payant

Open sourceFree tierAvancé

Apache Kafka est la plateforme de streaming d'événements de référence. Créée par LinkedIn, elle permet de publier, stocker et consommer des flux de données à très grande échelle et faible latence. Standard pour les architectures événementielles.

Topics et partitions distribuées
Réplication haute disponibilité
Kafka Streams (traitement léger)
Kafka Connect (connecteurs source/sink)
Schema Registry (Avro/Protobuf)
Kafka UI (monitoring)
Exactly-once semantics
Rétention configurable des messages
1

Streaming d'événements applicatifs en temps réel

Kafka collecte les événements utilisateurs (clics, achats, erreurs) depuis les applications web et mobile et les distribue en temps réel aux systèmes de traitement, analytics et stockage.

2

Bus de messages microservices

Dans une architecture microservices, Kafka sert de broker central pour découpler les services : chaque service publie ses événements dans un topic que les autres consomment de manière asynchrone.

3

Ingestion dans un data lake

Kafka Connectors (via Kafka Connect) ingèrent en continu des données de bases de données relationnelles via CDC (Change Data Capture) vers S3, HDFS ou des data warehouses cloud.

4

Détection de fraude en temps réel

Les banques utilisent Kafka Streams pour analyser les transactions en millisecondes, appliquer des règles métier et des modèles ML pour bloquer les transactions frauduleuses avant validation.

✓ Points forts

+Throughput extrêmement élevé (millions de messages/sec)
+Durabilité et haute disponibilité
+Écosystème immense (Connect, Streams, ksqlDB)
+Standard de facto pour l'event streaming
+Rétention des messages (replay possible)

✗ Limites

Complexité opérationnelle élevée (ZooKeeper/KRaft)
Configuration et tuning expert nécessaires
Pas adapté aux petits volumes ou faibles budgets
Debugging difficile

✓ Fait pour vous si…

Architectures événementielles à fort volume, pipelines temps réel, découplage de microservices.

✗ Pas fait pour vous si…

Petites équipes sans expertise ops. Besoins de faible latence ultra (préférer Redis Streams).

🎓 Confluent Certified Developer for Apache Kafka (CCDAK)

Associé

Confluent

Voir la certification →

🎓 Confluent Certified Administrator for Apache Kafka (CCAAK)

Professionnel

Confluent

Voir la certification →

🎓 Confluent Certified Operator for Apache Kafka (CCOAK)

Professionnel

Confluent

Voir la certification →

Apache Kafka Series — Learn Apache Kafka for Beginners

MOOC

Udemy

~15€

Kafka Fundamentals Accreditation

Formation officielle

Confluent Developer

Gratuit

Introduction to Kafka

MOOC

DataCamp

~50€/mois
open-sourcestreamingeventsenterprise