Data Universe
Newsletter
AccueilOutilsGoogle BigQuery
🔷

Google BigQuery

Data Warehouse

L'entrepôt de données serverless de Google, référence pour le SQL analytique à pétaoctets

Tarif

Pay-per-query (5$/To traité) ou slots réservés (flat rate). Storage : 0.02$/Go/mois. 1 To/mois de requêtes gratuit.

Free tierDébutant

BigQuery est le data warehouse serverless de Google Cloud, connu pour sa capacité à exécuter des requêtes SQL sur des pétaoctets en quelques secondes sans aucune gestion d'infrastructure. Son architecture sépare compute et storage de façon transparente. BigQuery ML permet d'entraîner des modèles directement en SQL. Très populaire dans les startups et scale-ups qui veulent démarrer vite sans gestion d'infra.

Serverless : zéro infrastructure à gérer
BigQuery ML (entraînement de modèles en SQL)
BigQuery Omni (requêtes cross-cloud S3/Azure)
Partitioning et clustering automatiques
Materialized Views
BigQuery BI Engine (cache in-memory pour Looker/Data Studio)
Data Transfer Service (ingestion automatisée)
Row-level et column-level security
BigQuery Datasets Marketplace
Intégration native avec Vertex AI
1

Analytics e-commerce à grande échelle

Analyse de milliards d'événements web et app en SQL, avec BigQuery ML pour la prédiction de churn directement en SQL sans exporter les données.

2

Data warehouse GCP-first

Centralisation de toutes les sources (Firebase, Google Ads, CRM) dans BigQuery via le Data Transfer Service et dbt pour les transformations.

✓ Points forts

+Démarrage immédiat sans configuration
+Performance excellent sur les requêtes analytiques complexes
+Facturation à la requête (idéal pour les charges variables)
+Intégration native avec tout l'écosystème Google Cloud
+BigQuery ML réduit les frictions entre SQL et ML

✗ Limites

Coût difficile à prévoir avec le modèle pay-per-query
Moins adapté aux workloads transactionnels OLTP
Pas d'annulation de requête gratuite (on paie même si on annule)
Vendor lock-in GCP fort

⚠️ Pièges connus en production

1.Les requêtes en SELECT * sur des tables partitionnées sans filtre sur la partition ignorent le partitioning et scannent tout — coût ×10 à ×100.
2.Les tables non partitionnées avec des milliards de lignes coûtent très cher à requêter. Toujours partitionner par date d'ingestion.
3.BigQuery facture les To scannés avant d'appliquer les filtres WHERE. Un COUNT(*) sur une table de 1 To coûte autant qu'un SELECT complet.
4.Les Materialized Views ne sont pas toujours utilisées par l'optimiseur. Vérifier le plan d'exécution.

✓ Fait pour vous si…

Équipes data sur GCP voulant un warehouse serverless sans gestion d'infra. Parfait pour les analyses exploratoires, les startups et les cas d'usage ML-SQL.

✗ Pas fait pour vous si…

Organisations souhaitant éviter le vendor lock-in GCP ou ayant des workloads OLTP importants.

cloudsqlserverlessanalyticsgcp