🏗️Exemple concret
Analyser 3 milliards de transactions e-commerce sur 5 ans en 8 secondes avec un SELECT SQL classique. Même requête sur PostgreSQL classique : timeout ou 4 heures. BigQuery y arrive grâce à son architecture en colonnes et son traitement massivement parallèle sur des milliers de serveurs Google.
∑ Concept clé
Coût = TB scannés × 5$/TB (mode à la demande) ou prix fixe (slots réservés). Format columnar (Parquet) réduit la consommation car seules les colonnes utilisées sont lues.
🎯Quand l'utiliser ?
✓Analytics sur de très grands volumes (des Go aux PB)
✓Reporting BI avec Looker Studio
✓ML avec BigQuery ML (SQL pour entraîner des modèles)
✅ Avantages
+Serverless : aucune infrastructure à gérer
+Très performant sur des requêtes analytiques
+BigQuery ML : entraîner des modèles directement en SQL
⚠️ Limites
−Coûteux sur des requêtes fréquentes et gourmandes (sans slots réservés)
−Pas adapté aux transactions OLTP (insertions/mises à jour fréquentes)
−Latence de quelques secondes même sur petites données
🛠️ Outils principaux
BigQuery Studio (Google Console)
BigQuery API (Python, Java)
Looker Studio
dbt (adapters BigQuery)
Vertex AI (ML pipeline)
GCPData WarehouseSQLAnalyticsServerless