Data Universe
Newsletter
AccueilOutilsRedis
🔴

Redis

Data Processing

La base de données in-memory de référence — cache, pub/sub, feature store et recherche vectorielle

Tarif

Gratuit (open source). Redis Cloud : free tier 30 Mo, puis ~7€/mois pour 250 Mo.

Open sourceFree tierDébutant

Redis est la base de données in-memory open source la plus populaire. Elle supporte de nombreuses structures de données (strings, hashes, lists, sets, sorted sets, streams) et offre des latences de l'ordre de la microseconde. Très utilisée dans les architectures data pour le caching, le feature store ML, le pub/sub temps réel et, depuis Redis 7.x, la recherche vectorielle (Redis Search).

Structures de données riches (strings, hashes, sets, sorted sets)
Pub/Sub et Redis Streams
Redis Search (full-text + vecteurs HNSW)
Persistence (RDB snapshots + AOF)
Replication master-replica
Redis Cluster (distribution horizontale)
TTL sur les clés (expiration automatique)
Transactions MULTI/EXEC
Lua scripting
1

Feature store ML pour inférence temps réel

Les features calculées en batch (score RFM, historique 30j) sont stockées dans Redis avec clé user_id. L'API de scoring les lit en < 1ms pour l'inférence en temps réel.

✓ Points forts

+Latence microseconde pour les opérations de cache
+Multi-usage : cache, feature store, messaging, vector search
+Redis Streams pour le messaging léger sans Kafka
+Très simple à démarrer

✗ Limites

Données limitées par la RAM disponible
Pas adapté aux requêtes analytiques complexes
Redis Search moins performant que Qdrant pour de très grands volumes vectoriels

⚠️ Pièges connus en production

1.maxmemory sans politique d'eviction configurée peut bloquer toutes les écritures quand la RAM est pleine.
2.Les clés sans TTL s'accumulent indéfiniment — toujours définir une expiration sur les données temporaires.
3.Redis single-threaded pour les commandes — les opérations O(N) sur de grands ensembles (KEYS *, SMEMBERS) bloquent tout le serveur.

✓ Fait pour vous si…

Caching de requêtes/API, feature store ML pour l'inférence temps réel, pub/sub léger, sessions utilisateurs.

✗ Pas fait pour vous si…

Stockage primaire des données business, analytics complexes, grands volumes vectoriels.

cachein-memoryopen-sourcestreamingfeature-store