PostgreSQL est la base de données relationnelle open source de référence, utilisée aussi bien comme base opérationnelle que comme entrepôt de données léger. Son extensibilité est sa force : pgvector ajoute la recherche vectorielle, TimescaleDB la gestion des séries temporelles, Citus la distribution horizontale. PostgreSQL est la base de Supabase, Amazon Aurora PostgreSQL et de nombreux services managés cloud.
Base opérationnelle + CDC vers data warehouse
PostgreSQL stocke les données opérationnelles de l'application. Debezium lit le WAL pour streamer les changements vers Kafka, puis vers Snowflake via Kafka Connect.
Recherche vectorielle avec pgvector
pgvector transforme PostgreSQL en base vectorielle légère pour les applications RAG avec < 1M vecteurs, évitant une infrastructure séparée.
✓ Points forts
✗ Limites
⚠️ Pièges connus en production
✓ Fait pour vous si…
Base opérationnelle robuste, stockage de données de référence, base d'APIs data, et analyses légères sur des datasets < 100 Go.
✗ Pas fait pour vous si…
Analytics sur pétaoctets ou workloads massivement parallèles (préférer un data warehouse cloud).