Accueil›Outils›PostgreSQL

PostgreSQL

Data Processing

La base de données relationnelle open source la plus avancée — couteau suisse des équipes data

Tarif

Gratuit (open source). Versions managées : AWS RDS ~50€/mois, Supabase free tier, Neon free tier.

Open sourceFree tierIntermédiaire

Présentation

PostgreSQL est la base de données relationnelle open source de référence, utilisée aussi bien comme base opérationnelle que comme entrepôt de données léger. Son extensibilité est sa force : pgvector ajoute la recherche vectorielle, TimescaleDB la gestion des séries temporelles, Citus la distribution horizontale. PostgreSQL est la base de Supabase, Amazon Aurora PostgreSQL et de nombreux services managés cloud.

Fonctionnalités clés

✓SQL ANSI complet (CTEs, window functions, JSONB)

✓ACID complet avec MVCC

✓Extensions : pgvector, PostGIS, TimescaleDB, pg_trgm

✓Full-text search natif

✓Partitioning déclaratif

✓Logical replication et CDC via pgoutput

✓JSONB pour les données semi-structurées

✓Foreign Data Wrappers (requêtes cross-sources)

✓pg_stat_statements pour le query profiling

Cas d'usage

Base opérationnelle + CDC vers data warehouse

PostgreSQL stocke les données opérationnelles de l'application. Debezium lit le WAL pour streamer les changements vers Kafka, puis vers Snowflake via Kafka Connect.

Recherche vectorielle avec pgvector

pgvector transforme PostgreSQL en base vectorielle légère pour les applications RAG avec < 1M vecteurs, évitant une infrastructure séparée.

✓ Points forts

+Gratuit, open source, aucun vendor lock-in

+Extensible via des centaines d'extensions

+Performances OLTP et analytiques légères excellentes

+Écosystème immense (Supabase, Neon, Aurora)

✗ Limites

−Pas optimisé pour les requêtes analytiques massives (préférer BigQuery ou Redshift)

−Gestion du VACUUM nécessaire pour maintenir les performances

−Sharding complexe sans Citus

⚠️ Pièges connus en production

1.AUTOVACUUM mal configuré sur les tables avec beaucoup d'UPDATEs crée du bloat et ralentit les queries.

2.Les requêtes avec LIKE '%pattern%' n'utilisent pas les index B-tree — utiliser pg_trgm ou full-text search.

3.Oublier de créer un index sur les colonnes de jointure fréquentes est la cause #1 des queries lentes.

✓ Fait pour vous si…

Base opérationnelle robuste, stockage de données de référence, base d'APIs data, et analyses légères sur des datasets < 100 Go.

✗ Pas fait pour vous si…

Analytics sur pétaoctets ou workloads massivement parallèles (préférer un data warehouse cloud).

open-sourcesqloltpacidextensions